基于深度学习的农业病虫害识别
(浙江农林大学, 杭州 311302)
摘要: 随着人工智能的迅猛发展, 深度学习技术已经渗透到各种不同领域。农业研究者们利用深度学习较强的图像和数据处理能力将其用于农业生产中, 尤其是在农业病虫害识别方面取得了显著的成果。运用基于深度学习的农业病虫害识别技术可以在各种复杂环境下对农作物进行快速无损识别, 并且准确性高, 稳定性好, 从而使农民可以迅速采取有效的防治措施, 最大程度的降低农作物的损失。本文首先阐释了基于深度学习的农业病虫害识别技术对农业发展的重大意义, 并分别对各类病虫害识别技术进行了详细的优劣势分析以及它们在病虫害识别中的表现。其次, 介绍了深度学习的各项关键技术, 包括数据源、数据预处理、数据增强、网络模型选择、迁移学习等多种核心技术的概念和应用情况。最后, 根据以上研究结果, 分析深度学习在农业病虫害识别中遇到的问题, 探讨了其在病虫害识别中的未来发展方向。
关键词: 农业病虫害, 深度学习, 卷积神经网络, 图像识别
DOI: 10.48014/ccsr.20231015001
引用格式: 袁俊超, 王丽娜, 李青, 等. 基于深度学习的农业病虫害识别[J]. 中国计算机科学评论, 2024, 2(1): 7-13.
文章类型: 综 述
收稿日期: 2023-10-15
接收日期: 2023-11-27
出版日期: 2024-03-28
0 引言
农作物在生长期间可能遭受各类病虫害的侵害,导致农作物的产量和品质严重减少。在中国,2021年全年农作物病虫害发生面积60亿亩次,防治面积80亿亩次,经防治挽回产量损失2500亿斤,占全年粮食总产的18.3%[1]。因此,如何提高农作物病虫害防治成效显得尤为重要,传统的农作物病虫害识别方法多依赖个人经验,需要通过实地勘探逐一对农作物的表征进行判断,费时费力,且难以大面积推广应用。如何高效、准确地进行农作物病虫害识别,成为当前智慧农业发展中必须考虑的问题。
随着计算机图像识别与数据处理技术不断创新发展[2],基于深度学习的农作物病虫害识别技术逐渐成为当下推动农业智能化发展,提高农业产值的重要推动力。运用深度学习算法可以在各类复杂背景下对农作物进行病虫害的检测识别,且其准确性和速度相比传统的机器学习方法有了长足的进步。
为深入研究深度学习在农业病虫害识别中的应用情况,本文对运用机器学习和深度学习进行图像识别的过程进行了详细对比,提出了深度学习的各项关键技术,并从数据源、数据预处理、数据增强、网络模型选择、迁移学习几个方面进行详细阐述。
1 农业病虫害识别技术
1.1 传统农业病虫害识别技术
传统农业病虫害识别主要是利用人工观察或运用化学试剂对农作物病虫害进行判断。比如,根据植物表现出的症状,如叶片萎蔫、变色、畸形等,来推测可能的病虫害。
传统的病虫害识别方法有着相当的局限性。(1)主观性较强:传统方法主要依赖于人的观察和分析,受到人的经验和主观意志的影响。(2)准确性有限:部分病虫害在肉眼看来极其相似,即使是专业人员也难以辨别,比如缺铁、缺氮、真菌感染等黄化病害的外观相似性可能导致难以确定具体病因[2]。(3)限制因素多:传统方法需要依赖专业设备、化学试剂或人工分析,受到设施设备、场地和专业人员的经验水平的限制。
1.2 基于传统机器学习的农业病虫害识别
基于传统机器学习的农作物病虫害识别技术主要是通过对农作物图片的RGB颜色、纹理和形状信息等进行人工特征选择,从而获取矩、直方图、对比度等特征。然后通过K-means分类、支持向量机等算法进行模型训练,以提高其对特定特征向量的分类准确性,从而实现有效的病虫害图像识别[3]。
目前,国内外对于机器学习的各类算法都进行了深入研究与拓展。在国外,Zhu H等人运用ResNet101网络提取图像深层特征,并采用SVM进行图像分类,以提高对胡萝卜品质的准确率,结果显示,该方法的准确率达到了98.13%[14]。在国内,邹永杰等研究了运用机器学习进行番茄病虫害检测的方法,通过LBP和HOG特征对有病虫害和无病虫害的番茄叶片进行特征提取,然后采用SVM作为分类器进行模型训练,其检测准确率达到99.49%[4]。
虽然机器学习的算法能够对农作物病虫害的识别达到不错的效果,但其图像特征的选择和设计基本依赖于专业人士的经验,效率较低。且它在病虫害识别时对图像背景、光照情况以及叶片摆放位置等都有严格的要求,难以大范围地推广使用。
1.3 基于深度学习的农业病虫害识别
与机器学习相比,深度学习可以运用卷积神经网络算法自动提取图像的形状、纹理以及颜色等特征。深度学习算法不需要人工进行复杂的图像特征的选择与设计,也不受专业知识的限制,大大提高了农业病虫害识别模型的开发效率与可迁移性。运用深度学习算法可以在各种复杂图像背景下对农作物病虫害进行高效识别,且有较高的准确性和稳定性。
在深度学习中,主要运用卷积神经网络中的LeNet和AlexNet模型对农业病虫害进行识别。在最新的研究中,王国伟等研究了运用卷积神经网络进行玉米病虫害识别的方法,对LeNet模型进行改进。首先用5种玉米的健康和病害图像作为数据集,然后运用Adam算法来进行模型优化,并选择Dropout策略降低数据过拟合,改进后的LeNet模型对玉米病虫害的识别准确率达到96%[5]。赵立新等通过引入迁移学习对AlexNet模型进行改良,成功实现了对棉花叶部病虫害的识别,准确率达到了97.16%[6]。尽管深度学习技术在提高病虫害检测效率和准确性方面克服了机器学习的多种缺陷,但也存在一些局限性,主要包括以下几个方面:
(1)数据集规模要求较大。深度学习模型的训练需要大规模高质量的数据才能不断提高模型的准确率。对于农业病虫害识别领域来说,国内外公开的病虫害数据集较少,致使获取标记的大规模数据集较为困难。
(2)试验条件要求较高。深度学习模型通常需要大量的计算资源和内存空间来进行长时间的训练和推断。这包括高性能的图形处理单元(GPU)或者领先的深度学习加速器等硬件资源,较大规模的实验可能还需要分布式计算环境。
机器学习与深度学习在农业病虫害识别中都有着不错的表现,但它们在图像识别时,采取的特征提取和模型训练方式有所不同,两者的图像识别流程见图1。
图1 机器学习与深度学习图像识别过程
Fig.1 Machine learning and deep learning image recognition process
2 基于深度学习的农业病虫害识别关键技术
2.1 数据源
深度学习模型需要大规模高质量的数据来进行训练。数据源便提供了这些训练数据,模型通过学习这些数据中的图像特征来提高其对病虫害识别的准确率。
在农业病虫害识别领域,数据源的获取主要有3种方式:第一类是利用现有的公开数据集,如农业病虫害研究图库(IDADP),AI Challenger病虫害分类数据集等[2]。这些公开数据集通常经过标注和验证,可以直接下载使用。第二类是通过实地调查、传感器设备等方式自行收集数据。它可以根据实际需求来获取特定领域或问题的数据,但需要花费大量的时间和资源。第三类则是从互联网、社交媒体等公开渠道中挖掘数据。这需要进行一定的数据清洗、匹配和标注工作,以确保数据的质量。
2.2 数据预处理
在对病虫害数据集进行处理时,经常会遇到阴影,强曝光之类的图片[7]。这些图像由于受光线,手机像素,叶片形态大小的影响,致使图像与实际植物病态不同,这就需要先对原始数据进行预处理。
通过对原始数据的集中处理,使数据更便于图像特征向量的提取。对数据进行预处理要先去除原始数据中重复无效的数据,以增强数据的质量和可靠性。再进行数据变换,将数据进行特征缩放,特征编码等操作,能有效调整图像的亮度,对比度等属性。最后进行数据集的划分和归一化的处理,以使其更适合用于机器学习算法的训练。具体数据处理方式及其说明见表1。
表1 数据预处理方式
Table 1 Data preprocessing methods
方法 |
目的 |
图像分割 |
去除无关因素,突出图像特征区域 |
降噪 |
去除图像中的高斯,椒盐噪声干扰 |
空间转换 |
对图像进行几何变换或投影变换的操作 |
归一化 |
将图像数据缩放到指定的范围内,使图像数值分布更均匀 |
灰度化 |
将原始图像进行灰度化处理,以降低图像复杂度 |
2.3 数据增强
为了训练出更精准的深度学习模型,需要获取大规模高质量的数据用于模型训练,但由于用户隐私安全保护以及数据错误标注等问题,使数据集的获取较为困难。这就需要利用数据增强技术来降低模型训练过程中对数据的依赖。
数据增强是通过对原始数据在空间,色彩,噪声等方面进行多样化的变换和扩展,有效增加训练样本的丰富性和数量。利用数据增强技术提升模型的鲁棒性,能够更好地泛化到未见过的数据,增加模型对于噪声、变形、光照等因素的适应性,从而帮助研究者更高效性的构建适用于不同场景的深度学习模型。Hu等在运用VGG16模型进行茶叶病害识别中,利用改进的生成对抗网络,进行数据增强,生成新的数据样本[15]。
2.4 网络模型结构选择
网络模型的选择直接决定着深度学习模型的识别效果,通过特定的网络模型,对图像特征进行精确提取,从而达到图像识别和分类的目的。本文用于病害识别的网络模型采用卷积神经网络。卷积神经网络模型由卷积层、池化层和全连接层组成,其工作原理如图2所示。
图2 卷积神经网络原理图
Fig.2 Schematic diagram of convolutional neural network
卷积神经网络在农业病虫害识别中的应用,根据其应用场景不同,可分为两大类技术。
第一类技术适用于图像背景简单及病虫害区域在图像中占比较较大的情景。这类技术包括Le Net,AlexNet,VGG等基于现有卷积神经网络的结构,进行改进的图像分类技术。图像分类技术可以将大规模的农作物叶片、果实或整株植物的图像分到预定义的类别中,从而帮助研究者快速准确的识别作物叶片或果实的受感染状况。鲍文霞等针对苹果叶片图像的病斑区域较小而不能精确识别的问题,对卷积神经网络进行改进,首先引入VGG16进行数据迁移,然后在卷积层采用选择性核提取图像特征,最后通过全局平均池化的操作更好的捕捉病虫害叶片上的微小特征。实验结果表明,该改进模型对苹果叶部病虫害的识别准确率达到了94.70。岳有军等研究了复杂背景和噪声影响下病虫害的精确检测方法。首先,在VGG网络中添加高阶残次子网络,使病虫害的识别准确率更高,然后,运用参数共享反馈子网络降低图像中的背景噪声,使得经过改进的VGG网络更具鲁棒性[10]。
第二类技术适用于图像背景较复杂以及病虫害区域在图像中所占比例较低的情景。这类技术包括Faster R-CNN、YOLO和SSD等常用的基于CNN的目标检测算法。目标检测算法通过候选框生成算法能够在图像中生成一些可能包含目标物体的候选框,并对其进行图像特征的提取。再根据训练好的分类器,对每个候选框进行分类与筛选,最终输出其在图像中的位置信息。李鑫然等针对苹果叶片背景复杂,虫害区域较小,而不能快速准确的进行病虫害识别的问题,对Faster R-CNN网络进行了改进,首先,通过引入特征金字塔对不同尺度的苹果叶片病害特征进行提取,然后运用精确感兴趣区域池化对小目标进行处理,实验结果表明,该改进模型对5种苹果叶片病虫害的识别准确率达到了82.48[11]。姚青等研究了水稻冠层多丛植株上病虫害的检测方法,对RetinaNet模型进行了改进,运用 ResNeXt101进行图像特征提取,并改进了特征金字塔网络,最终识别准确率达到93.76%[12]。这两类技术所涉及的主要网络结构及其优缺点见表2。
表2 不同应用场景的网络结构的优缺点
Table 2 Advantages and disadvantages of network structures for different application scenarios
适用场景 |
模型结构 |
优点 |
缺点 |
简单背景 |
LeNet |
网络结构简单,参数共享,降低过拟合风险 |
网络模型深度不足,无法满足复杂的视觉任务 |
|
AlexNet |
使用数据增强技术,并能进行大规模并行计算 |
训练速度较慢,易出现过拟合,准确性不高 |
|
VGG |
有统一的网络结构,较小的卷积核,使得训练更加高效 |
对GPU的需求较大,且文件体积较大 |
复杂背景 |
YOLO |
检测速度快,可同时检测多个目标 |
需要手动设定超参数,且准确度不足 |
|
Faster R-CNN |
检测准确率高,可进行小目标检测 |
检测速度较慢,模型结构较为复杂 |
|
SSD |
实时性高,可进行多尺度检测 |
对小目标检测效果较差,模型复杂 |
2.5 迁移学习
在进行深度学习模型训练时,通过对大规模、多样化的植物病虫害数据集进行预处理和数据增强,成功训练出了一个专注于某一类植物病虫害的识别模型。但它却无法识别其他的植物病虫害,为了在另一个相关领域的模型任务上更高效地实现训练,加速模型训练的过程,同时降低计算资源的需求,就需要采用迁移学习。
迁移学习可以将从一个领域获得的模型特征和参数等信息迁移至其他相关领域进行应用,避免新任务从零开始训练。在将训练好的模型迁移到新任务时,可以使用预训练模型的特征提取器,将之前提取的模型特征信息映射到新的特征空间,这些特征可以进一步用于训练新模型。苏婷婷等针对花生叶部病虫害发生时间短,数据采集难度大的问题,对Inception-v3模型进行微调,然后将微调后的模型迁移到花生叶部病虫害识别中,经过充分训练,其模型识别准确率达到了94.1%[13]。
3 结论
综上所述,随着深度学习技术的深入研究,以CNN算法为基础的农作物病虫害识别技术已经取得了一系列的进展和成果。与传统的识别技术相比,基于深度学习的病虫害识别技术克服了人工观察方法的主观性误差,避免了运用机器学习时进行人工图像特征提取的复杂过程。深度学习算法通过对大量数据集进行预处理和数据增强,并运用卷积神经网络自动提取病虫害图像特征,最终训练出农作物的病虫害识别模型,对病虫害识别的准确率更高、速度更快,也更能适应复杂环境下的病虫害识别工作。
然而,在运用深度学习进行病虫害识别的过程中,会因为数据不均衡,环境复杂,模型泛化能力不足等因素对识别效果产生影响。因此,未来应聚焦高质量样本数据集的获取和预处理模型的优化,并提高复杂背景下的病虫害图像特征提取的速度和精准度,以建立更加高效通用的深度学习农业病虫害识别模型。
利益冲突: 作者声明无利益冲突。
[②] *通讯作者 Corresponding author:余乐,leyu@zafu.edu.cn
收稿日期:2023-10-15; 录用日期:2023-11-27; 发表日期:2024-03-28
参考文献(References)
[1] 刘万才. 2021年农作物病虫害发生防控概况与2022年工作重点[N]. 农药资讯网, 2021-01-04(01).
[2] 李子涵, 周省邦, 赵戈, 等. 基于卷积神经网络的农业病虫害识别研究综述[J]. 江苏农业科学, 2023, 51(07): 15-23.
https://doi.org/10.15889/j.issn.1002-1302.2023.07.003
[3] 王乐石, 杨文彬, 胡云龙, 等. 基于卷积神经网络的农业病虫害识别方法研究[J]. 新农业, 2023(09): 9-10.
[4] 邹永杰, 张永军, 秦永彬, 等. 应用于番茄病虫害检测的HOG特征与LBP特征的结合[J]. 南京师范大学学报(工程技术版), 2019, 19(03): 23-24.
https://doi.org/10.3969/j.issn.1672-1292.2019.03.004
[5] 王国伟, 刘嘉欣. 基于卷积神经网络的玉米病害识别方法研究[J]. Journal of Intelligent Agricultural Mechanization( In Chinese and English), 2021, 2(01): 64-70.
https://doi.org/10.13733/j.jcam.issn.2095-5553.2021.02.021
[6] 赵立新, 侯发东, 吕正超, 等. 基于迁移学习的棉花叶部病虫害图像识别[J]. 农业工程学报, 2020, 36(07): 184-191.
https://doi.org/10.11975/j.issn.1002-6819.2020.07.021
[7] 边柯橙, 杨海军, 路永华. 深度学习在农业病虫害检测识别中的应用综述[J]. 软件导刊, 2021, 20(03): 26-33.
https://doi.org/10.11907/rjdk.201940
[8] 小方哥. 基于深度学习的农作物病虫害识别研究现状[N]. 人工智能感知信息处理算法研究院, 2022-08-13(01).
[9] 鲍文霞, 吴刚, 胡根生, 等. 基于改进卷积神经网络的苹果叶部病害识别[J]. 安徽大学学报: 自然科学版, 2021, 45(1): 7.
https://doi.org/10.3969/j.issn.1000-2162.2021.01.008
[10] 岳有军, 李雪松, 赵辉, 等. 基于改进VGG网络的农作物病害图像识别[J]. 农机化研究, 2022, 44(6): 18-24.
https://doi.org/10.3969/j.issn.1003-188X.2022.06.003
[11] 李鑫然, 李书琴, 刘斌. 基于改进Faster R_CNN的苹果叶片病害检测模型[J]. 计算机工程, 2021, 47(11): 298-304.
https://doi.org/10.19678/j.issn.1000-3428.0059290
[12] 姚青, 谷嘉乐, 吕军, 等. 改进RetinaNet的水稻冠层害虫为害状自动检测模型[J]. 农业工程学报, 2020, 36(15): 182-188.
https://doi.org/10.11975/j.issn.1002-6819.2020.15.023
[13] 苏婷婷, 牟少敏, 董萌萍, 等. 深度迁移学习在花生叶部病害图像识别中的应用[J]. 山东农业大学学报(自然科学版), 2019, 50(05): 865-869.
https://doi.org/10.3969/j.issn.1000-2324.2019.05.028
[14] Zhu H, Yang L, Fei J, et al. Recognition of carrot appearance quality based on deep feature and support vector machine[J]. Computers and Electronics in Agriculture, 2021, 186: 106185.
[15] HuGensheng, WuHaoyu, ZhangYan, et al. A low shot learning method for tea leafs disease identification[J]. Computers & Electronics in Agriculture, 163: 104852- 104852[2023-11-21].
https://doi.org/10.1016/j.compag.2019.104852
Deep Learning-based Agricultural Pest and Disease Recognition
(Zhejiang Agricultural and Forestry University, Hangzhou 311302, China)
Abstract: With the rapid development of artificial intelligence, deep learning technology has penetrated into a variety of different fields. Agricultural researchers have used deep learning's strong image and data processing capabilities to apply it to agricultural production, especially in the identification of agricultural pests and diseases, which has achieved remarkable results. The use of deep learning-based agricultural pest and disease identification technology can quickly and non-destructively identify crops in various complex environments, with high accuracy and good stability, so that farmers can quickly take effective control measures to minimize the loss of crops. This paper first explains the significance of deep learning-based agricultural pest identification technology to agricultural development, and makes a detailed analysis of the advantages and disadvantages of various pest identification technologies and their performance in pest and disease identification. Secondly, various key technologies of deep learning are introduced, including the concepts and applications of various core technologies such as data source, data preprocessing, data augmentation, network model selection, and transfer learning. Finally, based on the above research results, the problems encountered by deep learning in the identification of agricultural pests and diseases are analyzed, and its future development direction in the identification of pests and diseases is discussed.
Keywords: Agricultural pests and diseases, deep learning, convolutional neural networks, image recognition
DOI: 10.48014/ccsr.20231015001
Citation: YUAN Junchao, WANG Lina, LI Qing, et al. Deep learning-based agricultural pest and disease recognition[J]. Chinese Computer Sciences Review, 2024, 2(1): 7-13.