Plant Phenomics | AI助力苜蓿根系表型研究,ResNet-18技術(shù)精準(zhǔn)解析植物結(jié)構(gòu)
根系結(jié)構(gòu)(Root System Architecture,RSA)在通過地下根系性狀實施植物改良方面正受到越來越多的關(guān)注,F(xiàn)代計算技術(shù)應(yīng)用于圖像,為通過RSA分析(使用圖像識別/分類根系類型和特征)推進(jìn)植物性狀改良和選擇提供了新的途徑。然而,基于圖像的RSA表型分析的一個主要障礙是圖像標(biāo)簽噪聲,這降低了以圖像作為直接輸入的模型的準(zhǔn)確性。
2024年9月,Plant Phenomics在線發(fā)表了University of Minnesota和Washington State University等單位合作完成的題為Phenotyping Alfalfa (Medicago sativa L.) Root Structure Architecture via Integrating Confident Machine Learning with ResNet-18的研究論文。
為了解決標(biāo)簽噪聲問題,Brandon J.Weihs等人開發(fā)了一種人工智能模型,能夠直接從圖像中對苜蓿(Medicago sativa L.)的RSA進(jìn)行分類,并將其與下游標(biāo)簽改進(jìn)方法相結(jié)合。將不同模型輸出的圖像與手動根系分類進(jìn)行了比較,并測試了可信機(jī)器學(xué)習(xí)(CL)和反應(yīng)式機(jī)器學(xué)習(xí)(RL)方法,以最大限度地減少主觀標(biāo)記的影響,從而提高標(biāo)記和預(yù)測的準(zhǔn)確性。
紫花苜蓿根頸RSA(根系結(jié)構(gòu))取樣與成像、圖像標(biāo)簽創(chuàng)建與校正以及模型實施的工作流程如下:其中橙色表示田野或?qū)嶒炇胰;紫色表示圖像準(zhǔn)備方法;藍(lán)色表示建模方法;黃色表示圖像標(biāo)簽校正過程;粉色表示圖像標(biāo)簽校正步驟;綠色表示在新數(shù)據(jù)集上的模型驗證及對未標(biāo)記數(shù)據(jù)的預(yù)測;紅色表示模型對新數(shù)據(jù)集圖像的預(yù)測。
圖1 紫花苜蓿根頸RSA(根系結(jié)構(gòu))取樣與成像、圖像標(biāo)簽創(chuàng)建與校正以及模型實施的工作流程
圖2 從MN數(shù)據(jù)集導(dǎo)出的隨機(jī)森林和ResNet-18混淆矩陣
圖3 采用跨種群和合并分析的ResNet-18混淆矩陣
圖2展示了四個不同的混淆矩陣,分別對應(yīng)于兩種模型(RF和ResNet-18)在原始和修正后的MN數(shù)據(jù)集上的表現(xiàn):(A) 來自Xu等人的RF預(yù)測準(zhǔn)確性 (B) 經(jīng)修正的MN標(biāo)簽的RF混淆矩陣 (C) 原始MN標(biāo)簽的ResNet-18混淆矩陣。(D) 經(jīng)修正的MN標(biāo)簽的ResNet-18混淆矩陣。圖3展示了四個不同的ResNet-18混淆矩陣,它們展示了模型在原始標(biāo)簽、修正標(biāo)簽、合并標(biāo)簽以及合并可信標(biāo)簽下的性能:(A) 來源于原始(MN和OK)標(biāo)簽的ResNet-18混淆矩陣。(B) 來源于修正后(MN和OK)標(biāo)簽的ResNet-18混淆矩陣。(C) 來源于合并(n = 881)標(biāo)簽的ResNet-18混淆矩陣。(D) 來源于合并可信(n = 608)標(biāo)簽的ResNet-18混淆矩陣。
實驗的結(jié)果證明,CL算法適度提高了隨機(jī)森林模型對MN數(shù)據(jù)集的整體預(yù)測準(zhǔn)確度(1%),而在ResNet-18模型的結(jié)果中觀察到了更大的準(zhǔn)確性提升。與原始/預(yù)處理的數(shù)據(jù)集相比,CL方法使得ResNet-18的跨種群預(yù)測準(zhǔn)確度提高了約8%到13%。訓(xùn)練和測試數(shù)據(jù)組合中,預(yù)測主根RSA的最高準(zhǔn)確度(86%)來自CL和/或RL修正的數(shù)據(jù)集。同樣地,對于中間RSA類別的最高準(zhǔn)確度也來自于修正后的數(shù)據(jù)組合。使用ResNet-18模型在包含兩個采樣地點圖像的合并數(shù)據(jù)集上應(yīng)用CL所達(dá)到的最高整體準(zhǔn)確度約為75%。當(dāng)采用CL和RL時,紫花苜蓿RSA圖像標(biāo)簽的ResNet-18深度神經(jīng)網(wǎng)絡(luò)預(yù)測準(zhǔn)確度得以提升。通過增加數(shù)據(jù)集規(guī)模以減少過擬合的同時發(fā)現(xiàn)并糾正圖像標(biāo)簽錯誤,Brandon J.Weihs等人證明了使用半自動化的計算機(jī)輔助預(yù)處理和數(shù)據(jù)清理(CL/RL)可以實現(xiàn)高達(dá)約11%至13%的準(zhǔn)確性提升。
論文鏈接:
https://doi.org/10.34133/plantphenomics.0251
——推薦閱讀——
The State of the Art in Root System Architecture Image Analysis Using Artificial Intelligence: A Review
https://doi.org/10.34133/plantphenomics.0178
Plant Phenomics 綜述 | 利用人工智能進(jìn)行根系結(jié)構(gòu)成像分析的最新進(jìn)展
加入作者交流群
掃碼添加小編微信,拉您進(jìn)入《植物表型組學(xué)》作者交流群,群內(nèi)不定期開展作者分享會、?l(fā)布會等高質(zhì)量活動。
添加小編微信,備注姓名+單位+PP,加入作者交流群
About Plant Phenomics
《植物表型組學(xué)》(Plant Phenomics)是由南京農(nóng)業(yè)大學(xué)創(chuàng)辦的英文學(xué)術(shù)期刊,于2019年1月正式上線發(fā)行。采用開放獲取形式,刊載植物表型組學(xué)交叉學(xué)科熱點領(lǐng)域具有突破性科研進(jìn)展的原創(chuàng)性研究論文、綜述、數(shù)據(jù)集和觀點。具體范圍涵蓋高通量表型分析的最新技術(shù),基于圖像分析和機(jī)器學(xué)習(xí)的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農(nóng)業(yè)實踐中的表型組學(xué)新應(yīng)用,與植物表型相結(jié)合的分子生物學(xué)、植物生理學(xué)、統(tǒng)計學(xué)、作物模型和其他組學(xué)研究,表型組學(xué)相關(guān)的植物生物學(xué)等。期刊已被DOAJ、Scopus、PMC、EI和SCIE等數(shù)據(jù)庫收錄?祁Nò睯CR2023影響因子為7.6,位于農(nóng)藝學(xué)一區(qū)(1/125名),植物科學(xué)一區(qū)(13/265名),遙感一區(qū)(6/62名)。2023年中科院期刊分區(qū)位于農(nóng)林科學(xué)大類一區(qū)。2020年入選中國科技期刊卓越行動計劃高起點新刊項目、2024年入選江蘇科技期刊卓越行動計劃領(lǐng)軍期刊項目。
說明:本文由《植物表型組學(xué)》編輯部負(fù)責(zé)組稿。
中文內(nèi)容僅供參考,一切內(nèi)容以英文原版為準(zhǔn)。
編輯排版:王平、張婕(上海交通大學(xué))
審核:尹歡、孔敏