Plant Phenomics | 利用彈性網(wǎng)正則化或卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建評估扁豆絲囊菌根腐病的廣義線性模型
絲囊菌根腐病是限制扁豆和豌豆產(chǎn)量的主要疾病,能夠?qū)е聡?yán)重的經(jīng)濟(jì)損失。目前商業(yè)化推廣種植的品種大都缺乏根腐病抗性,因此,研究者致力于通過遺傳育種方法開發(fā)出抗病性更好的扁豆品種。
作物表型由于與植物表達(dá)性狀(受基因和環(huán)境因素間的相互作用影響)的評估息息相關(guān),所以成為了作物改良工作中的一個關(guān)鍵過程。傳統(tǒng)表型方法通量較低且易受主觀因素影響,往往費(fèi)時費(fèi)力,因此有必要開發(fā)新的表型組學(xué)技術(shù),在細(xì)胞、器官、植株或群體層面輔助獲取多維表型數(shù)據(jù)。可以預(yù)見的是,與傳統(tǒng)方法相比,表型組學(xué)的進(jìn)步將能夠?qū)崿F(xiàn)對大規(guī)模育種試驗(yàn)進(jìn)行無損、自動化以及高時空分辨率的評估。
數(shù)據(jù)驅(qū)動的方法解釋特定的生物學(xué)模式(如抗病性和農(nóng)藝表現(xiàn)等)能夠幫助植物育種專家、病理學(xué)家和生理學(xué)家等做出決策。傳感器技術(shù)的發(fā)展推動了許多性狀的大規(guī)模篩選,這種大規(guī)模篩選的方法會生成大量的數(shù)據(jù),需要進(jìn)行數(shù)據(jù)分析來提取出有意義的數(shù)據(jù)性狀,因此新的數(shù)據(jù)分析方法也亟待開發(fā)。已有研究表明,統(tǒng)計學(xué)方法和機(jī)器學(xué)習(xí)方法都可以從收集到的表型數(shù)據(jù)中有效地提取性狀。與統(tǒng)計學(xué)方法相比,機(jī)器學(xué)習(xí)方法的優(yōu)點(diǎn)之一是其能夠評估多個性狀的組合,而不是針對某些性狀一個一個地進(jìn)行評估。
近日,Plant Phenomics在線發(fā)表了華盛頓州立大學(xué)Afef Marzougui等人的題為Generalized Linear Model with Elastic Net Regularization and Convolutional Neural Network for Evaluating Aphanomyces Root Rot Severity in Lentil的研究論文。
論文作者使用可見光圖像評估了扁豆的絲囊菌根腐病抗性。為了輔助表型過程,在論文作者先前的研究工作中,已評估了從可見光或高光譜圖像中提取扁豆根芽的可能性,并結(jié)合使用了用于疾病分類預(yù)測的彈性網(wǎng)回歸模型?紤]到深度學(xué)習(xí)方法的潛在優(yōu)點(diǎn),該文章建立了一個扁豆根圖像數(shù)據(jù)集(Fig. 1 (a)),并由育種專家根據(jù)發(fā)病的嚴(yán)重程度進(jìn)行了標(biāo)注,之后基于數(shù)據(jù)集開發(fā)并比較了兩種深度學(xué)習(xí)方法,具有彈性網(wǎng)正則化或卷積神經(jīng)網(wǎng)絡(luò)的廣義線性模型(Fig. 1),能夠?qū)⒓膊】剐苑譃槿悾嚎剐、部分抗性、易感性?/P>
Fig.1: Data analysis approaches: training and optimization. (a) Imagery datasets, (b) distribution of ARR visual disease scores and ARR disease classes within experiments, (c) distribution of ARR visual disease scores and ARR disease classes within root_1 dataset (n = 6,460 images) and root_2 dataset (n = 3,275 images), (d) CNN architecture, and (e) generalized mixed model with EN regularization optimization and feature selection.
結(jié)果表明,使用彈性網(wǎng)正則化的模型提取出的圖像特征能夠以較高準(zhǔn)確度對三種疾病類別進(jìn)行分類(Fig. 4),且兩種方法均能準(zhǔn)確地檢測出抗病等級(Fig. 5)。然而,由于部分抗性的特征和數(shù)據(jù)通常與抗性和易感性的數(shù)據(jù)有所重疊,因此很難檢測出部分抗性。總體來說,該文使用表型技術(shù)和機(jī)器學(xué)習(xí)方法為扁豆絲囊菌根腐病抗性的定量分析提供了新的見解。
Fig.4: Spearman correlation analysis of the model-selected final RGB features—selected using EN—and visual disease scores (n = 6,460 and 3,275, for root_1 and root_2, respectively).
Fig.5: nMDS ordinations of test set (random run = 7): (a) RGB features selected using EN for root_1 dataset, (b) RGB features selected using EN for root_2 dataset, (c) FC features extracted from CNN for root_1 dataset, and (d) FC features extracted from CNN for root_2 dataset. (e) Venn diagram of resistant class classification averaged across the 10 random runs.
論文鏈接
https://spj.sciencemag.org/journals/plantphenomics/2020/2393062/
——推薦閱讀——
Convolutional Neural Networks for Image-Based High-Throughput Plant Phenotyping: A Review
https://spj.sciencemag.org/journals/plantphenomics/2020/4152816/
Plant Phenomics 綜述 | 卷積神經(jīng)網(wǎng)絡(luò)用于基于圖像的高通量植物表型綜述
How Convolutional Neural Networks Diagnose Plant Disease
https://spj.sciencemag.org/journals/plantphenomics/2019/9237136/
如何利用卷積神經(jīng)網(wǎng)絡(luò)診斷植物病害 | RESEARCH ARTICLE
About Plant Phenomics
《植物表型組學(xué)》(Plant Phenomics)是由南京農(nóng)業(yè)大學(xué)和美國科學(xué)促進(jìn)會(AAAS)合作創(chuàng)辦的英文學(xué)術(shù)期刊,于2019年1月正式上線發(fā)行,是Science合作出版的第二本期刊。采用開放獲取形式,刊載植物表型組學(xué)交叉學(xué)科熱點(diǎn)領(lǐng)域具有突破性科研進(jìn)展的原創(chuàng)性研究論文、綜述、數(shù)據(jù)集和觀點(diǎn)。具體范圍涵蓋高通量表型分析的最新技術(shù),基于圖像分析和機(jī)器學(xué)習(xí)的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農(nóng)業(yè)實(shí)踐中的表型組學(xué)新應(yīng)用,與植物表型相結(jié)合的分子生物學(xué)、植物生理學(xué)、統(tǒng)計學(xué)、作物模型和其他組學(xué)研究,表型組學(xué)相關(guān)的植物生物學(xué)等。期刊已被CABI、CNKI、DOAJ和PMC數(shù)據(jù)庫收錄。
說明:本文由《植物表型組學(xué)》編輯部負(fù)責(zé)組稿。
中文內(nèi)容僅供參考,一切內(nèi)容以英文原版為準(zhǔn)。
撰稿:王棟(實(shí)習(xí))
編輯:周燦彧(實(shí)習(xí))、鞠笑、孔敏
審核:尹歡