摘要:茶葉采摘點定位是茶葉選擇性采摘的關(guān)鍵技術(shù)之一,,在茶樹采摘場景中,存在采摘點尺度小,、背景干擾大,、光照情況復(fù)雜等問題,導(dǎo)致準(zhǔn)確分割茶葉采摘點成為難題,。本研究針對茶園場景下采摘點精確分割問題,,構(gòu)建了一種基于多頭自注意力機(jī)制結(jié)合多尺度特征融合的語義分割算法——RMHSA-NeXt。首先使用ConvNeXt卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征,;其次構(gòu)造基于殘差和多頭自注意力機(jī)制的注意力模塊,,將模型注意力集中于分割目標(biāo),增強重要特征的表達(dá),;再次通過多尺度結(jié)構(gòu)(Atrous spatial pyramid pooling, ASPP)將不同尺度的特征進(jìn)行融合,,在其中針對采摘點特性,在融合過程中使用條狀池化(Strip pooling),,減少無用特征的獲?。蛔詈笸ㄟ^卷積以及上采樣等操作完成信息的解碼,,得出分割結(jié)果,。試驗表明,茶園環(huán)境下該模型可以對采摘點進(jìn)行有效分割,,模型的像素準(zhǔn)確率達(dá)75.20%,,平均區(qū)域重合度為70.78%,運行速度達(dá)到8.97f/s,?;谙嗤瑴y試集將本文模型與HRNet V2,、EfficientUNet++、DeeplabV3+,、BiSeNet V2模型進(jìn)行對比,,結(jié)果表明相比于其他模型同時具有準(zhǔn)確性高、推理速度快,、參數(shù)量小等優(yōu)點,,能夠較好地平衡精度與速度指標(biāo)。本文的研究成果可以為精準(zhǔn)定位茶葉采摘點提供有效可靠的參考,。