植物寄生线虫是一种常见低等动物,分布很广,能吸取植物体内营养,影响植物正常生长,导致植物出现根瘤、根腐、沤根、枯萎黄化、果实长不大等情况,严重危害植物健康以及农产品的产量和质量。因此,海关口岸需要对各种线虫进行形态学鉴定,以防范外来植物病原线虫可能造成的环境受害风险,这对维护国门生物安全有着重要意义。
由于线虫大多在2毫米以下,形态相似,且肉眼不可见,因此,线虫鉴定工作对鉴定人员的专业背景知识和从业经验有着极高的要求。在深度学习技术兴起后,线虫学家们通过研究发现,传统的图像鉴定手段耗时、耗材、费力,鉴定结果与专业人员的知识储备和技能经验息息相关。而基于深度学习的图像识别方法,在识别效率和识别准确率上都有强劲的表现,完全可以应用到线虫鉴定工作中,作为一种额外的手段辅助从业者工作。在实际的鉴别过程中,线虫分类模型的训练样本通常是在专业实验室由高质量的显微镜采集并标注。然而,海关监测样本可能来自不同品牌的显微镜,成像质量也参差不齐,这会导致基于深度学习训练模型的泛化能力不足,识别精度下降。
中国科学院宁波材料技术与工程研究所计算机视觉技术团队在增强线虫分类模型泛化性上取得新进展。该团队的硕士研究生朱屹在肖江剑研究员、庄佳衍高级工程师的指导下,通过结合深度度量学习模型训练策略和风格迁移技术帮助模型学习跨领域不变的表征(Cross-domain Invarience),从而使模型在未见域(Unseen Domain)中也能精准定位线虫的判别性特征。
利用该方法生成的新域样本,可以显著扩展样本空间。如用风格迁移算法AdaIN变换后的新域样本与源域样本具有颜色不同,但图像结构相同的特点,使得该样本对的结构相似性高达99%,证明了样本对中的梯度信息一致性。因此,使用深度度量学习策略来学习源域和新域之间的跨域不变表征,通过损失函数对样本对的相似性进行度量,实现了更好的分类决策边界学习,进一步提高了模型的泛化性。
相关研究成果近期以“Domain Generalization in Nematode Classification”为题发表于农业计算机交叉领域的国际顶级期刊Computers and Electronics in Agriculture (doi.org/10.1016/j.compag.2023.107710)。
以上工作成果得到宁波市公益科技项目(NO.2021S024)、宁波科技发明项目(NO.2020Z019)、国家自然科学基金(NO.62005128)、海关总署科研项目(NO.2020HK161)、宁波市公益科技项目(NO.2021S024)、浙江省教育厅科研项目(NO.Y202147558)的支持。
图1 基于风格迁移的样本增广方法
图2 基于深度度量学习的局部结构不变性引导的领域泛化框架
中科院宁波材料所
|