CVPR2020|深蘭科技挑戰(zhàn)復雜場景,獲霧天條件目標檢測挑戰(zhàn)賽冠軍
03賽題特點&主要工作
在這次挑戰(zhàn)賽中,主要的難點包含以下幾個方面:
1.可視條件差、圖像模糊
可視條件差是這個賽道核心問題,霧天收集的數(shù)據(jù)特點就是能見度低,圖像模糊,遠處的物體不容易被檢測與識別,容易造成大量的目標漏檢、誤檢,從而導致mAP效果下降。
2.圖片數(shù)量少,數(shù)據(jù)分布不平衡
總共只有4000多張帶標注的圖片,增加了訓練難度,再加上數(shù)據(jù)分布的不均衡,很難劃分一個具有代表性的驗證集,很可能導致模型不具有泛化能力,在新的測試集上表現(xiàn)會不如預期。

檢測器
我們先通過常規(guī)檢測所累積的經(jīng)驗構(gòu)造出一個baseline:
Baseline=Backbone+DCN[1]+FPN[2]+CascadeRCNN[3]
這套pipeline,也是去年冠軍團隊所使用的方法,在這里我們沿用這套算法,以此為基礎進行改進。

通過觀察實驗結(jié)果發(fā)現(xiàn),模型誤檢情況遠多于漏檢,經(jīng)常出現(xiàn)一個目標有多個檢測結(jié)果,并且這些檢測結(jié)果之間無法使用nms去除。歸納為兩方面原因。
1.模型自身能力不足,回歸分類能力差,導致大量誤檢;
2.負樣本不足,由于樣本個數(shù)限制,模型會在一些模棱兩可的地方檢測出置信度較高的結(jié)果,無法通過閾值去處理這些誤檢結(jié)果。
根據(jù)目前結(jié)果做了一下幾個方面的改進:
1.DoubleHeads[6]
當需要提升模型能力時,有2個比較簡單高效的方法,一是使用更強的backbone,二是提高RCNN中分類檢測head的能力,通過實驗比對,我們最終使用了doublehead的結(jié)構(gòu)(如下圖所示)。


▲DoubleHeads

Doublehead采用分而治之的思想,將原始head解耦為2個獨立的分支,針對不同的需求設計head結(jié)構(gòu),通過對比實驗可發(fā)現(xiàn):使用FC-h(huán)ead做分類,Conv-h(huán)ead做回歸,可以得到最好的效果。
因為分類更多地需要語義信息,所以使用全連接層。而坐標框回歸需要更多的空間信息,因此使用卷積層。當然這種方法會增加計算量。在平衡速度和準確率的情況下,最終我們選擇了3個殘差2個Non-local共5個模塊。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
-
2 華為,重大突破!
- 1 人形機器人“第一股”來了!宇樹科技即將上會
- 2 全球股市陷AI獨大結(jié)構(gòu)性瘋狂
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 DeepSeek融資500億,梁文鋒難逃資本局
- 5 谷歌2026 I/O大會完整回顧:模型依然重要,但智能體正在接管一切
- 6 全球資本,重倉中國機器人
- 7 Figure AI 交付突破350臺,陪跑特斯拉會迎來iPhone 時刻嗎?
- 8 Anthropic發(fā)布2028年全球AI領(lǐng)導力的兩種情景報告
- 9 “國產(chǎn)GPU第一股”摩爾線程首季扭虧,但造血能力仍待考驗
- 10 特斯拉宣布監(jiān)督版FSD登陸中國?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













