多光譜成像結(jié)合多變量分析的單株紫花苜蓿種子品種鑒別
摘要:快速準(zhǔn)確地辨別苜蓿品種對(duì)生產(chǎn)者、消費(fèi)者和市場(chǎng)監(jiān)管者來說至關(guān)重要。然而,傳統(tǒng)的苜蓿品種鑒別程序既費(fèi)時(shí)又費(fèi)力。在這項(xiàng)研究中,評(píng)估了一種新方法的潛力,該方法使用多光譜成像結(jié)合對(duì)象多變量圖像分析來區(qū)分具有單個(gè)種子的紫花苜蓿品種。應(yīng)用主成分分析(PCA)、線性判別分析(LDA)和支持向量機(jī)(SVM)三種多元分析方法,根據(jù)其形態(tài)和光譜特征對(duì)12個(gè)苜蓿品種的種子進(jìn)行區(qū)分。結(jié)果表明,形態(tài)特征和光譜數(shù)據(jù)的結(jié)合可以為不同品種的紫花苜蓿種子進(jìn)行多變量分析提供一個(gè)極其簡(jiǎn)潔的過程,而僅用種子的形態(tài)特征無法進(jìn)行分類。LDA 測(cè)試集的種子分類準(zhǔn)確率為91.53%,SVM 為 93.47%。因此,多光譜成像結(jié)合多變量分析可以提供一種簡(jiǎn)單、穩(wěn)健和無損的方法來區(qū)分苜蓿種子品種。
Abi700、Boja、Maverick、Ranger、Sutter、uc-1465、Fado、Vernal、Zhongmu1、Zhongmu3、Dongmu1、Zhonglan2 12個(gè)苜蓿品種由甘肅寒旱區(qū)種質(zhì)資源庫提供。種子被保存在平均溫度為-18°C的儲(chǔ)藏室的防水袋中,直到2020年1月用于成像。種子照片如圖1所示。
圖1.12種苜蓿的種子圖像
當(dāng)我們將PCA應(yīng)用于形態(tài)特征時(shí),前三個(gè)原理成分解釋了種子之間原始方差的 67.41%,PC1、PC2 和 PC3 分別為 35.40、20.28 和 11.73%(圖 2a)。 對(duì)于光譜特征,前三個(gè)主成分的解釋方差率分別為總方差的 60.56、25.63 和 9.33%(圖2b)。此外,基于形態(tài)特征和種子光譜的 PCA 結(jié)果還表明,前三個(gè)主成分解釋了種子之間原始方差的 65.98%,PC1、PC2和 PC3 分別為 31.60、19.59 和 14.79%(圖 2c)。然而,無論是基于形態(tài)學(xué)、光譜數(shù)據(jù)或其組合的PCA得分圖都未能將不同品種的種子分成12個(gè)不同的組。
圖2.(a)形態(tài)學(xué)、(b)光譜學(xué)和(c)形態(tài)學(xué)與12個(gè)品種的光譜特征數(shù)據(jù)集結(jié)合的前三個(gè)主成分(PC)的三維圖
總的來說,12個(gè)品種種子的反射率表現(xiàn)出相似的趨勢(shì),波長(zhǎng)越長(zhǎng),反射率越高(圖3)。然而,在每個(gè)波長(zhǎng)下,品種之間的反射率存在顯著差異。例如,法朵在365~780 nm光譜范圍內(nèi)的反射率值明顯高于其他品種,而在850~970 nm范圍內(nèi)的反射率值低于除中木1、中木3、春夏、冬木以外的其他品種。1和Zhonglan2。12個(gè)品種的種子根據(jù)其對(duì)365~540 nm和880~970 nm的光反射率可分為3組。第一組只包括法朵,第二組包括中木1、中木3、東木1和中蘭2,第三組包括阿比700、博雅、馬克里克、游俠、薩特UC-1465和弗納爾。對(duì)于 uc-1465、Boja和 Maverick,它們表現(xiàn)出非常相似的反射率模式,在 365 到 540 nm 范圍內(nèi)具有最低值,在780到970nm范圍內(nèi)具有最高值。
圖3.12個(gè)紫花苜蓿品種的19個(gè)波長(zhǎng)(nm)的平均光反射率
如前所述,基于不同的數(shù)據(jù)源開發(fā)了兩種多元判別分析模型:形態(tài)特征數(shù)據(jù)、光譜特征數(shù)據(jù)以及形態(tài)和光譜特征數(shù)據(jù)的組合。結(jié)果表明,基于形態(tài)特征數(shù)據(jù)的LDA 模型對(duì)訓(xùn)練和獨(dú)立測(cè)試數(shù)據(jù)集的分類準(zhǔn)確率分別為 43.63% 和 42.22%。另一方面,法多與其他品種有明顯的距離,其他11個(gè)品種無法分開(圖4a)。相比之下,LDA 模型的準(zhǔn)確度在光譜數(shù)據(jù)的基礎(chǔ)上得到了極大的提高,在訓(xùn)練和測(cè)試數(shù)據(jù)集上分別表現(xiàn)出高達(dá) 87.50% 和 86.81% 的辨別準(zhǔn)確度(補(bǔ)充表 S4)(圖 4b)。當(dāng)使用組合形態(tài)特征和光譜數(shù)據(jù)時(shí),總體正確分類率在訓(xùn)練集和測(cè)試集分別為 91.96%、92.44% 和 91.53%。然而,不同品種的分類精度差異很大。例如,分類Fado的準(zhǔn)確率是100%,而中牧3的準(zhǔn)確率低至LDA的11.67%。
圖4.基于(a)形態(tài),(b)光譜和(c)形態(tài)結(jié)合光譜特征的線性鑒別分析(LDA)模型用于鑒別紫花苜蓿12個(gè)品種種子的得分圖
對(duì)于具有形態(tài)數(shù)據(jù)的LDA模型,前5個(gè)特征解釋了總變異的72.98%,其次是寬長(zhǎng)比 (24.60%)、直徑面積 (15.56%)、緊湊橢圓 (15.33%)、偏心率 (10.13%) , 和寬度 (7.36%), 表明品種之間的形態(tài)區(qū)分主要基于形狀特征 (圖 5a)。對(duì)于光譜數(shù)據(jù),470 nm (12.75%)、490 nm (9.74%)、940 nm (8.79%)、430 nm (7.44%)、970 nm (7.28%) 是前五個(gè)特征加起來 LDA的 46.00% 變化(圖5c)。對(duì)于形態(tài)和光譜數(shù)據(jù)的組合(圖5e),寬度/長(zhǎng)度比(15.53%)、直徑面積(11.60%)、緊湊橢圓(8.81%)、偏心率(5.76%)和寬度(5.14%)是前5個(gè)特征,占LDA變異的46.86%,說明形態(tài)特征對(duì)品種鑒別有很大貢獻(xiàn)。
圖5.LDA和支持向量機(jī) (SVM) 模型的形態(tài)、光譜和形態(tài)結(jié)合光譜特征的相對(duì)重要性。(a)LDA的形態(tài)特征
相關(guān)閱讀
Videometer種子表型組學(xué):種子活力研究-熒光成像
Videometer種子表型組學(xué):多光譜成像作為菠菜種子健康檢測(cè)的潛在工具
Videometer種子表型組學(xué):多光譜圖像分析在種子種質(zhì)庫管理中的應(yīng)用
Videometer種子表型組學(xué):利用可見光、近紅外多光譜和化學(xué)計(jì)量學(xué)對(duì)不同番茄種子品種的分類
Videometer種子表型組學(xué):使用多光譜成像和化學(xué)計(jì)量學(xué)方法在線鑒別水稻種子
Videometer種子表型組學(xué):使用多光譜成像預(yù)測(cè)蓖麻種子的活力
Videometer種子表型組學(xué):甜菜種子加工損傷的多光譜圖像分類
種子表型組學(xué):基于多光譜成像的葵花籽品質(zhì)特征識(shí)別
種子表型組學(xué):利用多光譜成像和化學(xué)計(jì)量學(xué)方法對(duì)大豆種子進(jìn)行無損鑒別
種子表型組學(xué):Videometer多光譜成像種子質(zhì)量評(píng)估的新工具
種子表型組學(xué):聚合物包衣對(duì)水稻種子萌發(fā)的影響
種子表型組學(xué):基于可見-近紅外多光譜圖像數(shù)據(jù)的偏最小二乘判別分析檢測(cè)菠菜種子的發(fā)芽能力和胚芽長(zhǎng)度
種子表型組學(xué):使用灰度共生矩陣和機(jī)器學(xué)習(xí)技術(shù)識(shí)別單倍體玉米種子
種子表型組學(xué):不同成熟度甜菜種子發(fā)芽抑制因子去除的優(yōu)化
種子表型組學(xué):通過射線照相和多光譜圖像分析測(cè)定小麥種子中的侵染
種子表型組學(xué):用于表征麻瘋樹種子質(zhì)量的多光譜和X射線圖像
種子表型組學(xué):鹽脅迫下九個(gè)高羊茅品種的種子萌發(fā)和幼苗生長(zhǎng)參數(shù)
種子表型組學(xué):多光譜成像結(jié)合機(jī)器學(xué)習(xí)判別辣椒種子品種