近期,信息学院陈志泊教授课题组在动物研究领域期刊《Animals》(二区,IF=3.231)发表了题为“A Fine-Grained Bird Classification Method Based on Attention and Decoupled Knowledge Distillation”的学术论文,第一作者为硕士研究生王康,通讯作者为陈志泊教授,北京林业大学为第一完成单位。
在鸟类物种智能识别任务中,利用鸟类图像的视觉特征辨别鸟的种类是一个热门的研究方向。然而,基于图像的鸟类物种分类属于细粒度图像分类任务,不同类别之间的相似度非常高,同一类别内部的差异又很大,导致了高类内方差和低类间方差的问题,因此鸟类物种分类是一个具有挑战性的任务。此外,深度卷积模型的复杂性和计算量也是限制鸟类细粒度图像分类模型应用的因素。如何解决鸟类细粒度图像分类的问题,提高分类的准确性和效率,是当前鸟类物种识别领域的热门研究方向。
图1 本文提出的鸟类细粒度识别模型结构示意图
针对上述问题,论文提出了一种基于注意力机制的鸟类细粒度分类方法(图1)。首先利用注意力机制定位鸟类辨别性部位,提取鸟类部位的细粒度特征,缓解不同鸟类之间高类内方差和低类间方差的影响;其次,设计基于解耦知识提取的模型压缩机制(图2),通过分别提取目标类和非目标类知识,消除了目标类预测结果对非目标类知识迁移的干扰,实现了模型的高效压缩。该方法实现了鸟类细粒度分类模型减少67%的参数量和仅需1.2G的计算量,有效保证了高正确率,提高了模型推理速度。
图2 本文提出的基于Med-BERT的Span-FLAT医学实体识别模型
本文提出的鸟类图像智能识别方法,可以通过移动设备或探测站点设备开展鸟类的自动化监测,从而实现有效的鸟类监测,并从一定程度上降低了监测成本,具有重要的研究价值和应用前景。近年来,信息学院陈志泊教授团队坚持以人工智能等新一代信息技术为核心,聚焦生物多样性监测、森林病虫害智能识别、智慧林草等领域的交叉融合研究,在人工智能及其林业应用研究领域取得了一系列重要进展,为推动人工智能技术在林业应用中的广泛应用做出了积极的贡献。
该研究受到国家林业和草原局委托项目“智慧园林建设规范(2019130004-129)”、“林草科技推广APP信息服务(2021133108)”以及中央高校基本科研业务费专项资金(BLX202004)的资助。
论文链接:https://www.mdpi.com/2076-2615/13/2/264