摘要:我們提出了一種多光譜種子表型分析方法,作為管理種質(zhì)庫種質(zhì)的快速而強(qiáng)大的工具。使用多光譜視覺系統(tǒng)拍攝 20 種不同水稻品種(每個品種約 30 粒種子)的種子圖像。 然后從圖像中提取特征信息。 特征數(shù)據(jù)的多變量分析用于根據(jù)種質(zhì)對種子表型進(jìn)行分類。 正確分類的水稻種子比例為93%。 我們得出結(jié)論,多光譜圖像分析可以在比較傳入種子與現(xiàn)有種質(zhì)、識別種子樣本中的不同種子類型和/或檢查再生種子是否與原始種子匹配方面發(fā)揮作用。
圖1.Blob檢測
使用VideometerLab 3.0版軟件,將圖像(即包含種子圖像的培養(yǎng)皿)標(biāo)記為具有背景(培養(yǎng)皿)和前景(種子)的區(qū)域(圖 1(a))。然后使用典型判別分析 (CDA) 計算屬于兩個不同類別的像素光譜的協(xié)方差矩陣之間和內(nèi)部,創(chuàng)建用于分割(識別圖像中的種子)的評分圖像(圖 1(b)) ;圖 1(c))。在分割之后,我們最終得到了 20 個種質(zhì)的總共 598 個二元標(biāo)記對象(BLOB),每個都包含一個單獨(dú)的水稻種子(BLOB)(圖 1(d))。
第一個規(guī)范函數(shù)
真正的IRGC登錄號
圖2.(a)前兩個 CDA 函數(shù)的散點(diǎn)圖,覆蓋了種質(zhì)的示例大米圖像?蛑酗@示的數(shù)字是國際水稻基因庫收藏(IRGC)登錄號。 (b)應(yīng)用優(yōu)化模型后得到的誤差矩陣。沿對角線的陰影數(shù)字表示 BLOB(水稻種子)的數(shù)量被正確分配(預(yù)測類別 ¼ 真實(shí)類別)。其他數(shù)字顯示 BLOB 的數(shù)量分配不正確。正確分類種子的總比例為93%。
從每個BLOB中提取的177個特征集合被放入一個矩陣 X∈R598x177:其中一些特征與水稻種子在不同波長下的反射值有關(guān),一些是(線性)CDA 投影,用于區(qū)分和增強(qiáng)整個種子和形態(tài)的顏色差異。每個特征都通過對所有種質(zhì)的成對測試進(jìn)行測試,并且沒有顯示出分離能力的特征被移除。這將特征數(shù)量減少到 90。由于與其他特征的高度相關(guān)性,另外50個特征被移除(r>0.99;P <0.05),產(chǎn)生一個矩陣 X∈R598x40。
Matlabw Release 2014a (MathWorks, Natick, MA, USA) 用于建模,使用 k-最近鄰 (k-NN) 分類器結(jié)合多類 CDA。使用交叉驗(yàn)證方案來驗(yàn)證模型,其中將數(shù)據(jù)分成 N 個相等的部分,并使用比例 (N 2 1)/N 的數(shù)據(jù)迭代地創(chuàng)建模型。該模型使用剩余的 1/N 數(shù)據(jù)進(jìn)行驗(yàn)證。在迭代過程中,累積了所有 N 個測試部分的分類率的預(yù)測性能。對 k ∈[1, 30] 和 N∈[2, 50] 的每個組合進(jìn)行分析。分類錯誤最少的k和N的最佳值分別為6和13,分類錯誤為 7%(圖 2)。