摘要:針對采摘機器人對場景中目標(biāo)分布密集,、果實相互遮擋的檢測及定位能力不理想問題,提出一種引入高效通道注意力機制(ECA)和多尺度融合特征金字塔(FPN)改進Faster R-CNN果實檢測及定位方法,。首先,,利用表達能力較強的融合FPN的殘差網(wǎng)絡(luò)ResNet50替換原VGG16網(wǎng)絡(luò),消除了網(wǎng)絡(luò)退化問題,,進而提取更加抽象和豐富的語義信息,,提升模型對多尺度和小目標(biāo)的檢測能力;其次,,引入注意力機制ECA模塊,,使特征提取網(wǎng)絡(luò)聚焦特征圖像的局部高效信息,減少無效目標(biāo)的干擾,,提升模型檢測精度,;最后,采用一種枝葉插圖數(shù)據(jù)增強方法改進蘋果數(shù)據(jù)集,,解決圖像數(shù)據(jù)不足問題,。基于構(gòu)建的數(shù)據(jù)集,,使用遺傳算法優(yōu)化K-means++聚類生成自適應(yīng)錨框,,提高模型定位準確性。試驗結(jié)果表明,,改進模型對可抓取和不可直接抓取蘋果的精度均值分別為96.16%和86.95%,,平均精度均值為92.79%,較傳統(tǒng)Faster R-CNN提升15.68個百分點,;對可抓取和不可直接抓取的蘋果定位精度分別為97.14%和88.93%,,較傳統(tǒng)Faster R-CNN分別提高12.53個百分點和40.49個百分點;內(nèi)存占用量減少38.20%,,每幀平均計算時間縮短40.7%,,改進后的模型參數(shù)量小且實時性好,能夠更好地應(yīng)用于果實采摘機器人視覺系統(tǒng),。