摘要:雙單倍體(DH)技術(shù)在玉米育種中得到了有效的應(yīng)用。該技術(shù)在時(shí)間和純合度方面均優(yōu)于傳統(tǒng)玉米育種。 DH技術(shù)的重要過(guò)程之一是單倍體種子的選擇。選擇單倍體的最常用方法是 R1-nj(納瓦霍)顏色標(biāo)記。這種顏色標(biāo)記出現(xiàn)在種子胚乳和胚胎中。僅選擇胚乳有色種子并持續(xù)到發(fā)芽階段。這種選擇通常是手動(dòng)完成的。單倍體種子選擇的自動(dòng)化將增加成功率并減少勞動(dòng)力和時(shí)間。在這項(xiàng)研究中,我們使用了 87 個(gè)單倍體和 326 個(gè)二倍體玉米種子作為數(shù)據(jù)集。使用了玉米種子胚的質(zhì)地特征。這些特征是從灰度共生矩陣中獲得的。特征向量使用決策樹(shù)、k-最近鄰和人工神經(jīng)網(wǎng)絡(luò)進(jìn)行分類(lèi)。機(jī)器學(xué)習(xí)技術(shù)的分類(lèi)性能通過(guò)使用 10 折交叉驗(yàn)證方法進(jìn)行測(cè)試。測(cè)試結(jié)果表明,決策樹(shù)的性能最好,分類(lèi)成功率為84.48%。
關(guān)鍵詞:玉米;單倍體識(shí)別;紋理特征;GLCM;決策樹(shù);kNN;ANN
在這項(xiàng)研究中,使用了為之前的工作創(chuàng)建的數(shù)據(jù)集。該數(shù)據(jù)集包括 413 粒玉米種子,共 87 個(gè)單倍體和 326 個(gè)二倍體。 所有樣品均作為玉米研究所2016年“國(guó)家玉米育種研究”項(xiàng)目的一部分收獲。所有樣品均來(lái)自RWS、RWK-76和“RWSxRWK-76”母源單倍體誘導(dǎo)劑150個(gè)基因型的雜交結(jié)果。樣品的選擇在胚胎和胚乳中具有不同的R1-nj表達(dá)(淺深色,無(wú)密色)。 根據(jù) R1-nj 顏色標(biāo)記手動(dòng)完成樣本的類(lèi)別標(biāo)簽分配。 圖 1 給出了數(shù)據(jù)集中單倍體和二倍體玉米種子的樣本圖像。
圖1.(I)單倍體和(II)二倍體玉米種子的樣本圖像
確定在對(duì)數(shù)據(jù)集中隨機(jī)選擇的80粒玉米種子進(jìn)行的測(cè)量中,統(tǒng)計(jì)學(xué)上的35像素半徑代表胚孔。圖2顯示了二倍體玉米種子樣本的種子質(zhì)心和特征提取區(qū)域。
圖2.樣品種子、種子的質(zhì)心和分割的胚區(qū)
單倍體和二倍體玉米種子在結(jié)構(gòu)上彼此不同。紋理特征經(jīng)常用于解決許多不同的模式識(shí)別問(wèn)題。在這項(xiàng)研究中,紋理特征用于分離單倍體和二倍體玉米種子。從數(shù)據(jù)集中,樣品單倍體和二倍體玉米種子胚的圖像已在圖3中給出。
圖3.(I)單倍體和(II)二倍體玉米種子的胚胎圖像
總共使用了48個(gè)紋理特征來(lái)表示數(shù)據(jù)集中的每個(gè)圖像。帶有邊緣直方圖的數(shù)據(jù)集中樣本的分布如圖4所示。單倍體樣本用藍(lán)色強(qiáng)調(diào),而二倍體樣本用橙色突出顯示?梢钥闯,單倍體和二倍體標(biāo)本是交織在一起的。這意味著將解決具有挑戰(zhàn)性的分類(lèi)任務(wù)。
圖4.考慮總共48個(gè)紋理特征的記錄分布