Plant Phenomics | 南京農(nóng)業(yè)大學(xué)計(jì)智偉教授團(tuán)隊(duì)提出特征選擇新方法用于植物表型分析
2023年5月,Plant Phenomics在線發(fā)表了南京農(nóng)業(yè)大學(xué)人工智能學(xué)院計(jì)智偉教授團(tuán)隊(duì)題為A novel Feature Selection Strategy Based on Enhanced Slap Swarm Algorithm for Diseased Plant Classification的研究論文。
這項(xiàng)研究公開了一種群智能優(yōu)化的特征選擇方法SSAFS,并應(yīng)用于植物表型圖像的關(guān)鍵特征提取,實(shí)現(xiàn)植物病害的高精度檢測(cè)(圖1)。SSAFS模型的核心,是一種基于改進(jìn)的樽海鞘群優(yōu)化(SSA)的特征選擇策略。SSA作為一種新型的啟發(fā)式群體智能優(yōu)化算法,它具有參數(shù)少,原理簡(jiǎn)單,收斂速度快,計(jì)算量低等優(yōu)點(diǎn)。正是因?yàn)镾SA的諸多優(yōu)勢(shì),目前已成功應(yīng)用在路徑規(guī)劃、工程優(yōu)化設(shè)計(jì)和控制參數(shù)優(yōu)化等領(lǐng)域。
該研究通過(guò)二進(jìn)制編碼種群設(shè)計(jì)了SSA的增強(qiáng)算法SSAFS,并引入了混沌映射初始化來(lái)增加種群的多樣性。此外,采用了正余弦優(yōu)化算法在候選解空間中探索,在一定程度上避免過(guò)早陷入局部最優(yōu),加速算法收斂速度。仿真實(shí)驗(yàn)中,研究人員在4個(gè)UCI公共數(shù)據(jù)集和6個(gè)植物病害表型數(shù)據(jù)集,將SSAFS與已有的五種群智能特征選擇方法進(jìn)行對(duì)比測(cè)試。實(shí)驗(yàn)結(jié)果表明,SSAFS能夠獲得較少的特征子集;同時(shí),提供了較高的分類精度。這項(xiàng)工作是首次利用群體智能優(yōu)化算法用于基于圖像的植物病害檢測(cè)和嚴(yán)重程度分級(jí)估計(jì)的研究。
圖1基于圖像的植物病害檢測(cè)
研究人員從UCI標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)中選取了Heart、Urban Land Cover、Arrhythmia和CNAE-9四個(gè)數(shù)據(jù)集,同時(shí)從Plant Village等公開數(shù)據(jù)庫(kù)中選取并構(gòu)建了有關(guān)植物病害的六個(gè)葉片圖像數(shù)據(jù)集 (圖2):Corn diseases、 Apple diseases、 Grape diseases、Coffee diseases、Three grades of corn rust和 Three grades of coffee leaf miner。在圖像預(yù)處理方面,利用顏色矩獲取顏色特征以及利用灰度共生矩陣GLCM和局部二值模式LBP提取紋理特征,每個(gè)葉片圖像提取171個(gè)特征。
圖2 SSAFS測(cè)試的六個(gè)植物葉片病害數(shù)據(jù)集
1)SSAFS在UCI數(shù)據(jù)集和植物表型數(shù)據(jù)中的性能分析
以分類精度、適應(yīng)值和特征子集規(guī)模作為評(píng)價(jià)指標(biāo),分別在UCI數(shù)據(jù)集和圖像數(shù)據(jù)集中測(cè)試SSAFS和其他五種算法的性能表現(xiàn),SSAFS在大多數(shù)數(shù)據(jù)集上性能表現(xiàn)優(yōu)于其他方法(表1-2)。
表1 UCI數(shù)據(jù)集上的算法性能比較
表2六個(gè)植物表型數(shù)據(jù)集上的對(duì)比實(shí)驗(yàn)
2) SSAFS在植物表型數(shù)據(jù)中的魯棒性分析
除DS_coffee數(shù)據(jù)集外,SSAFS在其余五個(gè)數(shù)據(jù)集上均表現(xiàn)出極高的穩(wěn)定收斂(圖3),驗(yàn)證了種群初始化對(duì)SSAFS優(yōu)化的輸出沒(méi)有顯著影響。另外,SSAFS比其他五種經(jīng)典算法獲取了更好的特征子集,而且收斂速度也快得多(圖4)。
圖3 SSAFS在六個(gè)表型數(shù)據(jù)集中穩(wěn)定性分析
圖4 SSAFS與其他五種方法在六個(gè)表型數(shù)據(jù)集中的收斂曲線對(duì)比
3) SSAFS在植物表型數(shù)據(jù)集中的統(tǒng)計(jì)分析
進(jìn)一步分析顯示:針對(duì)提取的171個(gè)圖像特征,有18個(gè)重要特征存在于至少三個(gè)表型數(shù)據(jù)集的最優(yōu)特征子集中(圖5A)。在這18個(gè)特征中,顏色特征的比例高于紋理特征,表明顏色特征在植物圖像分類中發(fā)揮著更重要的作用。另外,只有顏色特征的比例在特征選擇后才會(huì)顯著增加(圖5B)。與CLCM相比,基于LBP的特征可能包括一些不相關(guān)的變量,SSAFS可以去除這些變量。
圖5 SSAFS在六個(gè)表型數(shù)據(jù)集中的最優(yōu)特征分析
與目前廣泛報(bào)道的深度學(xué)習(xí)方法不同,我們提出的特征選擇方法SSAFS針對(duì)的是植物病害圖像的人工設(shè)計(jì)特征。通過(guò)SSAFS篩選圖像的關(guān)鍵特征,能實(shí)現(xiàn)植物病害圖像的高效、高精度的分類目標(biāo)。此外,我們的研究結(jié)果還提示了圖像局部特征對(duì)病害檢測(cè)的重要性。
本文的第一作者為南京農(nóng)業(yè)大學(xué)人工智能學(xué)院謝小軍博士,通訊作者為計(jì)智偉教授。2020級(jí)碩士生夏菲完成圖像數(shù)據(jù)預(yù)處理和算法原型開發(fā)。南京農(nóng)業(yè)大學(xué)劉守陽(yáng)教授、吳玉峰教授、徐煥良教授以及新加坡國(guó)立大學(xué)Ke Yan教授參與了本項(xiàng)研究工作。UNC Chapel Hill的Weiling Zhao教授為文章的撰寫提供了寶貴意見(jiàn)。感謝南京農(nóng)業(yè)大學(xué)海外高層次引進(jìn)人才啟動(dòng)項(xiàng)目、江蘇省自然科學(xué)基金項(xiàng)目、科技部外專項(xiàng)目、中央高校業(yè)務(wù)經(jīng)費(fèi)等項(xiàng)目的支持。
論文鏈接:
https://doi/10.34133/plantphenomics.0039
數(shù)據(jù)獲取鏈接:
https://github.com/JakeJiUThealth/SSAFS_V1.0
——推薦閱讀——
Robust Surface Reconstruction of Plant Leaves from 3D Point Clouds
https://doi/10.34133/2021/3184185
Plant Phenomics | 基于植物葉片三維點(diǎn)云的穩(wěn)健表面重建
Spectral Preprocessing Combined with Deep Transfer Learning to Evaluate Chlorophyll Content in Cotton Leaves
https://doi.org/10.34133/2022/9813841
Plant Phenomics | 光譜預(yù)處理與深度轉(zhuǎn)移學(xué)習(xí)相結(jié)合的葉片葉綠素含量評(píng)估
Plant Phenomics | 葉片表型文章合集
加入作者交流群
掃碼添加小編微信,拉您進(jìn)入《植物表型組學(xué)》作者交流群,群內(nèi)不定期開展作者分享會(huì)、?l(fā)布會(huì)等高質(zhì)量活動(dòng)。
添加小編微信,備注姓名+單位+PP,加入作者交流群
About Plant Phenomics
《植物表型組學(xué)》(Plant Phenomics)是由南京農(nóng)業(yè)大學(xué)和美國(guó)科學(xué)促進(jìn)會(huì)(AAAS)合作創(chuàng)辦的英文學(xué)術(shù)期刊,于2019年1月正式上線發(fā)行。采用開放獲取形式,刊載植物表型組學(xué)交叉學(xué)科熱點(diǎn)領(lǐng)域具有突破性科研進(jìn)展的原創(chuàng)性研究論文、綜述、數(shù)據(jù)集和觀點(diǎn)。具體范圍涵蓋高通量表型分析的最新技術(shù),基于圖像分析和機(jī)器學(xué)習(xí)的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農(nóng)業(yè)實(shí)踐中的表型組學(xué)新應(yīng)用,與植物表型相結(jié)合的分子生物學(xué)、植物生理學(xué)、統(tǒng)計(jì)學(xué)、作物模型和其他組學(xué)研究,表型組學(xué)相關(guān)的植物生物學(xué)等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等數(shù)據(jù)庫(kù)收錄?祁Nò睯CR2021影響因子為6.961,位于農(nóng)藝學(xué)、植物科學(xué)、遙感一區(qū)。中科院農(nóng)藝學(xué)、植物科學(xué)一區(qū)、遙感二區(qū)、生物大類一區(qū)(TOP期刊)。2020年入選中國(guó)科技期刊卓越行動(dòng)計(jì)劃高起點(diǎn)新刊項(xiàng)目。
說(shuō)明:本文由《植物表型組學(xué)》編輯部負(fù)責(zé)組稿。
中文內(nèi)容僅供參考,一切內(nèi)容以英文原版為準(zhǔn)。
特邀作者:謝小軍、計(jì)智偉
排版:王慧敏(南京農(nóng)業(yè)大學(xué))
審核:孔敏、王平