為了提取植物性狀,需要對(duì)植株的某個(gè)部分或整個(gè)植株進(jìn)行分割。閾值分割是最簡(jiǎn)單、最常用的圖像分割方法,它通過像素強(qiáng)度的臨界值將圖像分類為前景和背景;陂撝捣指罘椒,一些用于高通量植物表型分析的平臺(tái)已被開發(fā),包括HTPheno、Image Harvest和PlantCV等。上述軟件采用了公認(rèn)的步驟來處理植物圖像并提取表型特征。然而這些平臺(tái)僅專注于圖像處理,對(duì)植物生長(zhǎng)過程的統(tǒng)計(jì)建模和推斷方面的功能有所欠缺。
K均值聚類也是一種著名的圖像分割算法,該算法將像素分配到子組中,并使得組內(nèi)像素強(qiáng)度變化最小。當(dāng)簇的數(shù)量給定時(shí),K均值方法無需調(diào)整參數(shù)選擇。隱馬爾可夫隨機(jī)場(chǎng)模型(HMRF)可用于優(yōu)化來自K均值聚類和閾值分割的分割結(jié)果。HMRF是具有馬爾可夫隨機(jī)場(chǎng)隱藏層的層次模型,用于針對(duì)每個(gè)像素的類標(biāo)簽進(jìn)行建模,從而捕獲像素對(duì)其鄰近像素的空間依賴性。由于閾值分割和K均值算法都忽略了圖像的空間結(jié)構(gòu),因此HMRF模型能夠通過像素的鄰域類別信息來進(jìn)行像素合并,從而提供更準(zhǔn)確的像素分類。
假設(shè)圖像分割是精確的,那么就可以從圖像中提取出表型性狀的測(cè)量值。這些量化的數(shù)值可用于分析不同的基因型或處理隨時(shí)間對(duì)植物生長(zhǎng)的影響。在傳統(tǒng)的生長(zhǎng)曲線分析中,會(huì)在每個(gè)測(cè)量時(shí)間點(diǎn)逐點(diǎn)采用方差分析的方法。然而,這種獨(dú)立地分析每個(gè)時(shí)間點(diǎn)的方法無法反映出植物的動(dòng)態(tài)生長(zhǎng)過程。對(duì)生長(zhǎng)曲線進(jìn)行參數(shù)化建模是另外一種常用的方法,但是參數(shù)模型的擬合需要測(cè)量全生育期的植物性狀數(shù)據(jù),且常常會(huì)忽略數(shù)據(jù)的時(shí)間相依性,這使得此方法可能無法用于某些實(shí)驗(yàn)場(chǎng)景。函數(shù)型方差分析是一個(gè)新的非參數(shù)分析方法,可用于分析按時(shí)間序列采集的植物性狀數(shù)據(jù)。在函數(shù)型方差分析中,使用了樣條曲線平滑和局部多項(xiàng)式回歸方法來代替參數(shù)回歸進(jìn)行植物生長(zhǎng)過程的估計(jì)。這樣的非參數(shù)方法完全由數(shù)據(jù)驅(qū)動(dòng),且適應(yīng)于數(shù)據(jù)的時(shí)間相依性。雖然函數(shù)型方差分析方法有如上優(yōu)點(diǎn),實(shí)現(xiàn)植物表型數(shù)據(jù)的函數(shù)型方差分析卻并不容易。目前用于函數(shù)型數(shù)據(jù)分析的R語言程序包“fda”非常復(fù)雜,對(duì)于非統(tǒng)計(jì)學(xué)背景的研究者而言,使用時(shí)會(huì)存在困難。在使用函數(shù)型方差分析對(duì)植物生長(zhǎng)過程的研究中,當(dāng)前也沒有相關(guān)的計(jì)算教程。
近日,Plant Phenomics 刊發(fā)了美國(guó)內(nèi)布拉斯加大學(xué)林肯分校(University of Nebraska-Lincoln)及愛荷華州立大學(xué)(Iowa State University)的Ronghao Wang、Yumou Qiu等人的題為A High-Throughput Phenotyping Pipeline for Image Processing and Functional Growth Curve Analysis 的研究論文。為了滿足高通量表型系統(tǒng)數(shù)據(jù)分析的需求,論文作者開發(fā)了一個(gè)R語言程序包“implant”,涵蓋了對(duì)所提取特征的圖像分析和函數(shù)型數(shù)據(jù)分析。文章提供了一個(gè)簡(jiǎn)單易用的方法來分析原始圖像和數(shù)據(jù)分析中的高通量表型數(shù)據(jù)。相比于主要聚焦在介紹非參數(shù)曲線擬合方法的論文,本文上述的程序包提供了一個(gè)對(duì)用戶友好的計(jì)算工具,可使植物學(xué)家輕松地對(duì)植物動(dòng)態(tài)生長(zhǎng)過程進(jìn)行函數(shù)型數(shù)據(jù)分析。此外,該程序包還提供了隨時(shí)間變化而變化的回歸系數(shù)的置信區(qū)間(Figure 3)。
Figure 3. (a) 95% confidence regions for the average plant size of genotypes 1 and 3 over the three blocks. (b) 95% confidence regions for the average plant size of genotypes 2 and 3 over the three blocks.
下列流程圖(Figure 1)闡述了該方法的主要步驟。首先,采用雙標(biāo)準(zhǔn)閾值(DCT)或HMRF方法完成對(duì)植株的分割。如果有不包含植株的容器圖像,那么DCT可用于對(duì)比含植株和不含植株的容器圖像(如Figures 2(a)–2(c)所示)。在第二步(Figure 2)中,使用形態(tài)學(xué)腐蝕和膨脹的方法來優(yōu)化對(duì)植株區(qū)域的識(shí)別和分割。接著基于分割后的圖像計(jì)算植株性狀。最后,對(duì)提取出的性狀進(jìn)行函數(shù)型數(shù)據(jù)分析和統(tǒng)計(jì)學(xué)推斷。
Figure 1. Flow chart of the proposed “implant” pipeline. In the first step of segmentation, multiple methods could be jointly applied and the common plant area is considered to be the final segmentation.
Figure 2. (a) Original plant image. (b) Original empty pot image; the red square is the identified region of interest by the functions “ColorB” and “ColorG.” (c) Contrast of (a) and (b). (d) Segmented image of (a) using DCT. (e) Segmented image of (c) using DCT. (f) Intersection of (d) and (e). (g) Dilated-eroded-eroded-dilated image of (f). (h) Final segmented image by identifying the region of interest.
該方法能夠估計(jì)植物生長(zhǎng)過程中的主要影響因素和干擾因素,并處理不合理的觀察時(shí)間點(diǎn),給出影響因素曲線的置信區(qū)間(Figure5)。這些置信區(qū)間可以證明隨著時(shí)間推移,不同的基因型和處理所造成影響的統(tǒng)計(jì)學(xué)意義。
Figure 5. (a) 95% confidence region for the block effect between block 3 and block 1. (b) 95% confidence region for the genotype effect between genotype 2 and genotype 3.
——推薦閱讀——
Convolutional Neural Networks for Image-Based High-Throughput Plant Phenotyping: A Review
https://spj.sciencemag.org/journals/plantphenomics/2020/4152816/
Plant Phenomics 綜述 | 卷積神經(jīng)網(wǎng)絡(luò)用于基于圖像的高通量植物表型綜述
Easy MPE: Extraction of Quality Microplot Images for UAV-Based High-Throughput Field Phenotyping
https://spj.sciencemag.org/journals/plantphenomics/2019/2591849/
Plant Phenomics | Easy MPE:基于無人機(jī)高通量表型技術(shù)提取高質(zhì)量田間小區(qū)圖像
About Plant Phenomics
《植物表型組學(xué)》(Plant Phenomics)是由南京農(nóng)業(yè)大學(xué)和美國(guó)科學(xué)促進(jìn)會(huì)(AAAS)合作創(chuàng)辦的英文學(xué)術(shù)期刊,于2019年1月正式上線發(fā)行,是Science合作出版的第二本期刊。采用開放獲取形式,刊載植物表型組學(xué)交叉學(xué)科熱點(diǎn)領(lǐng)域具有突破性科研進(jìn)展的原創(chuàng)性研究論文、綜述、數(shù)據(jù)集和觀點(diǎn)。具體范圍涵蓋高通量表型分析的最新技術(shù),基于圖像分析和機(jī)器學(xué)習(xí)的表型分析研究,提取表型信息的新算法,作物栽培、植物育種和農(nóng)業(yè)實(shí)踐中的表型組學(xué)新應(yīng)用,與植物表型相結(jié)合的分子生物學(xué)、植物生理學(xué)、統(tǒng)計(jì)學(xué)、作物模型和其他組學(xué)研究,表型組學(xué)相關(guān)的植物生物學(xué)等。期刊已被CABI、CNKI和DOAJ數(shù)據(jù)庫(kù)收錄。
說明:本文由《植物表型組學(xué)》編輯部負(fù)責(zé)組稿。
中文內(nèi)容僅供參考,一切內(nèi)容以英文原版為準(zhǔn)。
撰稿:王棟(實(shí)習(xí))
編輯:周燦彧(實(shí)習(xí))、孔敏
審核:尹歡