自1917年英国首架无人机的问世以来,无人机技术已经走过了超过一个世纪的历程。在这长达百年的发展过程中,无人机的发展历史映射了人类对航空技术的无限追求与创新精神。尤其是在过去的几十年间,伴随着科技的飞速发展和社会的快速进步,无人机技术经历了前所未有的蓬勃发展。无人机的演变可以追溯到最初的简单飞行器,而如今已经发展成为包含复杂系统的先进航空器,成为现代航空工业的一个重要分支。随着无人机技术的日益成熟和应用的广泛推广,世界各国逐渐认识到无人机在军事、民用和商业等多个领域的巨大潜力和价值。为了推动本国无人机产业的发展,许多国家制定了一系列政策和法规,旨在支持和激励无人机技术的研发与应用。这些政策不仅促进了无人机技术的创新和进步,也催生了一大批专注于无人机研发的公司,这些公司在全球范围内如雨后春笋般涌现。这些无人机研发公司不仅在推动技术发展方面做出了巨大贡献,还在探索无人机在各个领域的应用方面发挥了重要作用。无人机的应用场景从军事侦察、航拍摄影,到物流配送、农业植保等,正逐渐成为各行各业不可或缺的工具。
国内的大疆公司在无人机行业中独树一帜,其推出的多款产品,例如精灵Phantom系列、御Mavic系列等,均深受市场喜爱。这些无人机不仅仅是简单的飞行工具,它们还巧妙地融合了尖端的飞行控制与图像处理技术,使得无人机仿佛拥有了“大脑”,能够通过深度学习进行自我飞行训练。借助先进的算法,这些无人机仿佛具备了超能力,能够精确地追踪、检测目标,并按预设完成定点飞行,带给用户前所未有的飞行体验。但大疆的惊喜远不止于此,其真正的创新在于自主研发的避障科技。想象一下,这些无人机能够像有自我意识一样,主动避开障碍物,它们可以在飞行时敏锐地感知四周,然后迅速做出判断和避障动作,这无疑极大地加强了飞行的安全性和稳定性。这种高科技的避障功能,不仅让用户更轻松地操作无人机,更重要的是,它为用户构筑了一道坚实的安全屏障,使得无人机在多变、复杂的环境中飞行都显得游刃有余。
在国际上,诸如Parrot、3DRobotics和AscTec等无人机研发公司一直是业界焦点。这些公司不仅在技术创新上屡屡刷新纪录,而且在产品性能和用户体验方面也实现了显著提升。以Parrot公司的AR.Drone为例,这款无人机不仅具备了自动飞行的能力,还能执行一系列高难度的特技飞行动作,其飞行技巧令人叹为观止。继AR.Drone之后,Parrot公司又推出了BebopDrone,通过将重量减轻到原来的四分之一,并搭配Skycontroller遥控设备,用户得以体验身临其境的第一人称视角飞行,开辟了飞行体验的新篇章。
在国内外无人机轻量级跟踪算法的研究领域,近年来取得了显著进展。国际上,研究焦点集中在基于深度学习的跟踪方法,例如SiamRPN和SiamFC++等算法,它们通过采用轻量级网络架构和高效的特征提取策略,实现了高精度和实时跟踪性能。与此同时,国内研究者则致力于基于判别相关滤波器(DCF)的跟踪器研究,这些跟踪器以单CPU上高效运行而著称。然而,DCF方法的精度通常不及深度学习方法。
视觉跟踪方法是计算机视觉领域中一个活跃的研究方向。现代跟踪器主要分为DCF和深度学习两大类。DCF跟踪器从最小输出平方误差和(MOSSE)滤波器发展而来,通过引入内核技巧、判别尺度估计、连续卷积、空间和时间正则化、训练集管理、深度特征、注意力、上下文以及背景信息等多种技术,实现了性能的显著提升。由于DCF跟踪器通常使用手工制作的特征,并在傅立叶域中进行计算,因此它们能够以高效的方式获得有竞争力的性能,这在无人机跟踪领域尤为重要。然而,由于手工特征的表示能力有限,DCF方法在挑战性条件下难以保持鲁棒性。
由于深度学习在多个领域取得了令人瞩目的成就,近年来,它在视觉跟踪方面的应用也展现出了显著的效果,极大地提升了众多跟踪器的精确度和稳健性。SiamFC,作为这一领域的开创性工作,创新性地将视觉跟踪视为一种相似性学习问题,它采纳了Siamese网络来评估目标和搜索图像间的相似性,从而引领了众多基于深度学习的跟踪器采用连体架构的设计思路。例如,近期,以Siam为基础的跟踪器大致可划分为两大类:基于锚点和无锚点的跟踪器。在基于锚点的方法论中,SiamRPN[别出心裁地将区域建议网络(RPN)与Siamese网络融合,进而将跟踪任务分解为分类与回归两个子任务;DaSiamRPN则推出了干扰子感知模块与高效的采样策略;而SiamMask更是新增了一个分支,用于生成像素二进制掩码。近期,SiamDW与SiamRPN++更深入地探索了网络架构,旨在进一步提升跟踪精度,然而这样的提升却以牺牲效率为代价。在无锚点跟踪器方面,SiamFC++通过引入一个全新的质量评估分支来优化分类,构建了一个简约而不简单的框架。以此为基础,SiamCAR通过重塑无锚点结构及合并多层特征,实现了出色的性能。另外,SiamBAN则探索了全新的策略来生成分类标签与回归目标。当然,除了基于Siamese的跟踪器,还有众多深度学习跟踪器是通过扩展在线判别框架来进行端到端训练的。
值得注意的是,尽管近期有更深的网络架构被开发出来以提升跟踪精度,但这些进步往往以牺牲效率为代价。相较之下,SiamFC++则以其简洁而强大的框架,特别是其中的质量评估分支,提升了跟踪精度。但遗憾的是,尽管其在GPU上表现不俗,但仍未能达到实时速度(即30 FPS)。在本文中,我们致力于运用模型压缩技术,以期提升SiamFC++在实时无人机跟踪方面的效率。
模型压缩技术,近年来,基于剪枝的模型压缩技术在国内外都受到了广泛关注和研究。国际学术界不断有新的剪枝方法提出,旨在减少深度神经网络中的参数量和计算复杂度,同时确保模型性能不受太大影响。这些方法包括但不限于权重剪枝、通道剪枝和层剪枝等,它们通过移除网络中不那么关键的部分,实现了模型的小型化和速度提升。在中国,随着人工智能技术的飞速进步,剪枝技术同样成为研究的热门领域。国内的研究人员不仅致力于探索各种剪枝方法,还在图像识别、自然语言处理等多个应用领域取得了一系列显著的成就。他们还针对中国的特定问题和数据集,提出了一系列剪枝策略和优化方法,这些方法充分考虑了中文语言的特点和国内数据的特性。尽管国内外对剪枝技术的研究已经取得了丰硕的成果,但仍面临着一些挑战和未解决的问题。例如,如何在剪枝过程中找到模型精度和压缩率之间的最佳平衡点,如何有效地确定剪枝的阈值和策略,以及如何将剪枝技术与其它模型压缩技术如量化、低秩分解等相结合,以进一步提升模型的压缩效果和运行效率,这些都是当前和未来研究的重要方向。随着技术的不断进步,我们有理由相信,剪枝技术将在人工智能领域发挥更大的作用,为模型的部署和应用带来更多的可能性。
一般来说,模型压缩的目标是在不显著降低原始模型精度的情况下实现简化模型。修剪是一种常用的神经网络压缩技术,它探索模型权重中的冗余,并尝试删除/修剪冗余和非关键权重,这涉及从训练的网络中删除神经元或整个神经元,通道或滤波器之间的连接。修剪是一种探索神经网络权重冗余并去除非关键权重的技术,包括移除神经元或其连接。修剪技术自20世纪80年代开始应用,但随着深度神经网络的发展和在资源受限环境中的部署,其重要性日益凸显。修剪流程通常包括预训练、修剪和微调三个阶段,涉及修剪结构、比例、标准和时间表等主题。修剪结构分为非结构化(权重)和结构化(过滤)修剪,其中结构化修剪由于权重规则排列,更容易实现加速。修剪比例的调整可以通过预定义比率或基于正则化的方法实现。修剪标准用于选择要修剪的权重,常用的有权重大小、滤波器范数和稀疏性等。修剪调度决定了网络稀疏度达到目标值的过程,可以选择一步到位或逐步进行。逐步修剪可能优于一次完成的方式,因为它提供了更多训练时间,但后者在训练中更为高效。
总的来说,修剪在目前仍然是一个开放的问题。最近提出的HRank是一种有效且高效的过滤器剪枝方法,它使用每层特征图的秩作为剪枝标准,并且以一次性方式进行调度,从而无需引入额外的约束或重新训练,大大简化了剪枝的复杂度。我们利用这种方法在这项工作中,以实现我们的目标模型压缩。
未来研究方向预计将集中在开发能够在效率和精度之间取得平衡的轻量级跟踪算法。特别值得注意的是,探索模型压缩技术的潜力,以减轻基于深度学习的跟踪器的计算负担,同时保持高精度。其他有前景的方向包括使用解纠缠表示学习和自注意机制来提高特征表示的有效性和跟踪精度。
综上所述,无人机Hrank跟踪领域正迅速发展,为了满足实际应用的需求,需要持续的研发努力。通过探索新的算法和技术,研究人员可以在无人机跟踪的效率和精度方面继续突破可能的界限,为空中监视、搜救和其他关键任务开辟新的机会。