摘要:針對(duì)目前大豆種皮裂紋檢測(cè)主要依靠人工,、檢測(cè)效率低,、誤差大的問題,,提出一種基于近紅外光譜技術(shù)和機(jī)器學(xué)習(xí)的大豆種皮裂紋自動(dòng)識(shí)別方法,。采用FT-NIR光譜儀采集150粒大豆樣品(裂紋大豆75粒,,正常大豆75粒)的近紅外光譜,,采用原始光譜、標(biāo)準(zhǔn)正態(tài)變量變換(Standard normal variate, SNV),、多元散射校正(Multiple scatter correction, MSC),、一階導(dǎo)數(shù)結(jié)合SG平滑、二階導(dǎo)數(shù)結(jié)合SG平滑等5種方法對(duì)獲得的光譜進(jìn)行預(yù)處理,,分別采用偏最小二乘判別分析法(Partial least squares discriminant analysis, PLS-DA),、k-近鄰法(k-nearest neighbor, KNN)、支持向量機(jī)法(Support vector machine, SVM),、隨機(jī)森林法(Random forest,,RF)、隨機(jī)梯度提升法(Stochastic gradient boosting, SGB),、極端梯度提升法(Extreme gradient boosting,,XGBoost)等6種機(jī)器學(xué)習(xí)方法建立了大豆種皮裂紋識(shí)別模型,研究了不同光譜預(yù)處理方法對(duì)6種機(jī)器學(xué)習(xí)方法分類效果的影響,,對(duì)比分析了不同建模方法的分類效果,。結(jié)果表明,光譜預(yù)處理方法對(duì)不同機(jī)器學(xué)習(xí)方法的分類效果差別較大,。在合適的光譜預(yù)處理?xiàng)l件下,,6種不同的機(jī)器學(xué)習(xí)算法的驗(yàn)證集準(zhǔn)確率均不低于80.00%。PLS-DA的分類效果最好,,驗(yàn)證集最優(yōu)準(zhǔn)確率達(dá)到90.00%,;XGBoost的分類效果次之,驗(yàn)證集最優(yōu)準(zhǔn)確率達(dá)到86.67%,,接下來依次是SVM,、KNN,、SGB和RF。利用近紅外光譜技術(shù)和機(jī)器學(xué)習(xí)方法識(shí)別大豆種皮裂紋是可行的,,在原始光譜條件下,,PLS-DA是大豆種皮裂紋識(shí)別的最佳方法。