摘要:為方便調(diào)查寧夏全區(qū)荒漠草原植物種類及其分布,,需對(duì)植物識(shí)別方法進(jìn)行研究。針對(duì)YOLO v5s模型參數(shù)量大,,對(duì)復(fù)雜背景下的植物不易識(shí)別等問(wèn)題,,提出一種復(fù)雜背景下植物目標(biāo)識(shí)別輕量化模型YOLO v5s-CBD。改進(jìn)模型YOLO v5s-CBD在特征提取網(wǎng)絡(luò)中引入帶有Transformer模塊的主干網(wǎng)絡(luò)BoTNet(Bottleneck transformer network),,使卷積和自注意力相結(jié)合,,提高模型的感受野;同時(shí)在特征提取網(wǎng)絡(luò)融入坐標(biāo)注意力(Coordinate attention,CA),,有效捕獲通道和位置的關(guān)系,,提高模型的特征提取能力;引入SIoU函數(shù)計(jì)算回歸損失,,解決預(yù)測(cè)框與真實(shí)框不匹配問(wèn)題,;使用深度可分離卷積(Depthwise separable convolution,DSC)減小模型內(nèi)存占用量,。實(shí)驗(yàn)結(jié)果表明,,YOLO v5s-CBD模型在單塊Nvidia GTX A5000 GPU單幅圖像推理時(shí)間僅為8ms,模型內(nèi)存占用量為8.9MB,,精確率P為95.1%,,召回率R為92.9%,綜合評(píng)價(jià)指標(biāo)F1值為94.0%,,平均精度均值(mAP)為95.7%,,在VOC數(shù)據(jù)集平均精度均值可達(dá)80.09%。相比YOLO v3-tiny,、YOLO v4-tiny和YOLO v5s,,改進(jìn)模型內(nèi)存占用量減小,平均精度均值提升,。模型YOLO v5s-CBD在公開(kāi)數(shù)據(jù)集和寧夏荒漠草原植物數(shù)據(jù)集都有良好的魯棒性,,推理速度更快,,且易于部署,已應(yīng)用在寧夏荒漠草原移動(dòng)端植物圖像識(shí)別APP和定點(diǎn)生態(tài)信息觀測(cè)平臺(tái),,可用來(lái)調(diào)查寧夏全區(qū)荒漠草原植物種類和分布,,長(zhǎng)期觀測(cè)和跟蹤寧夏鹽池縣大水坑、黃記場(chǎng),、麻黃山等地植物生態(tài)信息,。