摘要:奶粉市場是食品摻假行為頻發(fā)領(lǐng)域,,其中嬰幼兒配方奶粉價格高,,其質(zhì)量是消費(fèi)者,、生產(chǎn)企業(yè)和執(zhí)法部門關(guān)注的重點(diǎn)。近紅外高光譜成像(Near infrared-hyperspectral imaging, NIR-HSI)技術(shù)結(jié)合化學(xué)計(jì)量學(xué)和機(jī)器學(xué)習(xí)算法可以檢測奶粉中單一摻假物含量,?;贜IR-HSI技術(shù)研究了不同品牌嬰幼兒奶粉中多摻假物(三聚氰胺、香蘭素和淀粉)的定量預(yù)測,。對基于像素點(diǎn)預(yù)處理后的高光譜圖像劃分感興趣區(qū)域(Region of interest, ROI),,提取ROI平均光譜?;诮?jīng)典的過濾式特征選擇算法拉普拉斯分?jǐn)?shù)(Laplacian score)(無監(jiān)督)和ReliefF(有監(jiān)督)挑選建模關(guān)鍵變量,,建立偏最小二乘回歸模型(Partial least squares, PLS)。開發(fā)包含自定義選擇層的一維卷積神經(jīng)網(wǎng)絡(luò)模型(One-dimensional convolutional neural networks, 1DCNN),。自定義層根據(jù)權(quán)重系數(shù)絕對值,,可確定重要波長變量。Laplacian score-PLS模型對預(yù)測集中奶粉,、三聚氰胺,、香蘭素和淀粉質(zhì)量分?jǐn)?shù)預(yù)測結(jié)果均方根誤差分別為0.1110%、0.0570%,、0.0349%和0.3481%,。ReliefF-PLS模型對預(yù)測集中奶粉、三聚氰胺,、香蘭素和淀粉預(yù)測結(jié)果均方根誤差分別為0.1998%,、0.0540%、0.0455%和0.1823%,。1DCNN模型對預(yù)測集中奶粉,、三聚氰胺、香蘭素和淀粉質(zhì)量分?jǐn)?shù)預(yù)測結(jié)果均方根誤差分別為0.8561%,、0.0911%,、00644%和0.2942%。對Laplacian score,、ReliefF和自定義選擇層挑選出的前15個重要波長進(jìn)行對比分析,,不同特征選擇方法挑選的特征波長子集有所區(qū)別,但都選擇 1210,、1474,、1524、1680nm等附近波長,。基于ReliefF-PLS模型的可視化結(jié)果表明了其良好的預(yù)測能力,。