摘要:茶葉采摘點(diǎn)定位是茶葉選擇性采摘的關(guān)鍵技術(shù)之一,,在茶樹(shù)采摘場(chǎng)景中,,存在采摘點(diǎn)尺度小、背景干擾大,、光照情況復(fù)雜等問(wèn)題,,導(dǎo)致準(zhǔn)確分割茶葉采摘點(diǎn)成為難題。本研究針對(duì)茶園場(chǎng)景下采摘點(diǎn)精確分割問(wèn)題,,構(gòu)建了一種基于多頭自注意力機(jī)制結(jié)合多尺度特征融合的語(yǔ)義分割算法——RMHSA-NeXt,。首先使用ConvNeXt卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征;其次構(gòu)造基于殘差和多頭自注意力機(jī)制的注意力模塊,,將模型注意力集中于分割目標(biāo),,增強(qiáng)重要特征的表達(dá);再次通過(guò)多尺度結(jié)構(gòu)(Atrous spatial pyramid pooling, ASPP)將不同尺度的特征進(jìn)行融合,,在其中針對(duì)采摘點(diǎn)特性,,在融合過(guò)程中使用條狀池化(Strip pooling),減少無(wú)用特征的獲??;最后通過(guò)卷積以及上采樣等操作完成信息的解碼,得出分割結(jié)果,。試驗(yàn)表明,,茶園環(huán)境下該模型可以對(duì)采摘點(diǎn)進(jìn)行有效分割,模型的像素準(zhǔn)確率達(dá)75.20%,,平均區(qū)域重合度為70.78%,,運(yùn)行速度達(dá)到8.97f/s?;谙嗤瑴y(cè)試集將本文模型與HRNet V2,、EfficientUNet++、DeeplabV3+,、BiSeNet V2模型進(jìn)行對(duì)比,,結(jié)果表明相比于其他模型同時(shí)具有準(zhǔn)確性高、推理速度快,、參數(shù)量小等優(yōu)點(diǎn),,能夠較好地平衡精度與速度指標(biāo)。本文的研究成果可以為精準(zhǔn)定位茶葉采摘點(diǎn)提供有效可靠的參考,。