摘要:采用可見/近紅外漫反射光譜技術(shù)對蘋果可溶性固形物含量(Soluble solids content, SSC)檢測時,,光譜采集探頭到蘋果 表面的距離變化是隨機(jī)和不可控的,,造成檢測精度降低,。并且采用特征波長篩選算法優(yōu)化預(yù)測模型時,,忽略了被舍棄光譜數(shù)據(jù)中所包含的與成分含量相關(guān)信息,,造成光譜信息丟失,。針對以上問題,通過探究檢測距離對漫反射光譜的影響規(guī)律,,提出一種距離校正方法(Distance correction, DC),,并采用數(shù)據(jù)融合方法將特征波長和非特征波長數(shù)據(jù)中的有效信息相結(jié)合,以提高蘋果 SSC預(yù)測模型的預(yù)測性能,。為了驗證所提出方法的有效性,,分別采用多元散射校正(Multiple scattering correction, MSC),、標(biāo)準(zhǔn)正態(tài)變換(Standard normal variate transform, SNV)和 DC 算法對蘋果光譜預(yù)處理后,建立蘋果 SSC 的偏最小二乘回 歸(Partial least squares regression, PLSR)模型,。結(jié)果表明,,DC能更加有效提升 PLSR 模型的預(yù)測性能。為了減少模型數(shù)據(jù)量,、消除光譜中共線性和無效信息,,在DC預(yù)處理光譜的基礎(chǔ)上,采用競爭性自適應(yīng)加權(quán)采樣算法(Competitive adaptive reweighted sampling, CARS),、自舉軟收縮(Bootstrapping soft shrinkage, BOSS)和區(qū)間變量迭代空間收縮法(Interval variable iterative space shrinkage approach, iVISSA)對光譜數(shù)據(jù)進(jìn)行特征波長篩選,。建模結(jié)果表明,DC-CARS-PLSR模型具有較好預(yù)測結(jié)果,,并且大幅減少了光譜數(shù)據(jù)量,。為了充分利用特征波長和非特征波長數(shù)據(jù)中與蘋果SSC相關(guān)的信息,將特征和非特征波長PLSR模型的潛變量得分相融合,,建立融合PLSR預(yù)測模型,。結(jié)果表明,所提出的數(shù)據(jù)融合方法能夠進(jìn)一步提高模型預(yù)測性能,。其中CARS算法的特征波長和非特征波長數(shù)據(jù)融合建模結(jié)果具有最佳預(yù)測性能,,校正集相關(guān)系數(shù)Rc、校正集均方根誤差(Root mean square error of calibration, RMSEC),、預(yù)測集相關(guān)系數(shù)Rp,、預(yù)測集均方根誤差(Root mean square error of prediction, RMSEP)和相對分析誤差(Relative percentage difference, RPD)分別為0.981、0.297%,、0.957,、0.469% 和3.424,。