4月16日,由北京曠視科技有限公司與北京智源星空人工智能研究院共同舉辦的“智源學(xué)者計劃啟動暨聯(lián)合實驗室發(fā)布會”在京舉行。在會上,曠視研究院聯(lián)合北京智源星空人工智能研究院發(fā)布了全球最大的物體檢測數(shù)據(jù)集——曠視Objects365,該數(shù)據(jù)集也是新一代通用物體檢測數(shù)據(jù)集,具有規(guī)模大、質(zhì)量高、泛化能力強(qiáng)的特點。

圖:“智源學(xué)者計劃啟動暨聯(lián)合實驗室發(fā)布會”在京召開
曠視Objects365首批開放60萬張圖像和1000萬標(biāo)注框,超越微軟COCO
據(jù)曠視首席科學(xué)家兼研究院院長孫劍介紹,在規(guī)模方面,曠視Objects365定義了生活中常見的365個類別,第一批將開放63萬張圖像,1000萬的標(biāo)注框。開放圖片數(shù)是微軟COCO的5倍,標(biāo)注框超過微軟COCO的11倍。
算法優(yōu)化的上限嚴(yán)重依賴于基準(zhǔn)數(shù)據(jù)集術(shù)的質(zhì)量。因此,為保證標(biāo)注質(zhì)量,在打造曠視Objects365時,曠視設(shè)計出一套科學(xué)而嚴(yán)格的標(biāo)注流程,每一張圖片的背后至少會經(jīng)過9名標(biāo)注工人之手。此外,作為一個優(yōu)秀的預(yù)訓(xùn)練數(shù)據(jù)集,曠視Objects365預(yù)訓(xùn)練模型在使用過程中,可以輕松超越現(xiàn)有算法的精度,顯著加速收斂過程,表現(xiàn)出極強(qiáng)的泛化能力。在執(zhí)行COCO、VOO Det、CityPersons等檢測任務(wù)時,在VOC Seg和ADE等分割任務(wù)上均有顯著提升。
除此之外,孫劍還表示:“雖然曠視Objects365已是目前世界上最大的物體檢測數(shù)據(jù)集,但我們的目標(biāo)是在未來3年內(nèi)將這個數(shù)據(jù)集從現(xiàn)在的60萬,擴(kuò)大到200萬圖,超過2000多萬框,進(jìn)一步擴(kuò)大這個數(shù)據(jù)集。”

圖:曠視首席科學(xué)家兼研究院院長孫劍在發(fā)布會上講話
重視數(shù)據(jù)共享,曠視為行業(yè)發(fā)展樹立新的里程碑
相較于算法,高質(zhì)量的數(shù)據(jù)能對深度學(xué)習(xí)帶來更大的提升,因而數(shù)據(jù)共享是集結(jié)全行業(yè)之力推動計算機(jī)視覺發(fā)展的關(guān)鍵之舉。并且近幾年,相關(guān)技術(shù)的進(jìn)步使得圖像采集設(shè)備一代代革新,更高清晰度、更優(yōu)色彩表現(xiàn)的圖像將會對計算機(jī)視覺模型的訓(xùn)練產(chǎn)生更大影響。曠視Objects365 數(shù)據(jù)集的發(fā)布,無論從數(shù)據(jù)規(guī)模再到標(biāo)注質(zhì)量,皆為計算機(jī)視覺基礎(chǔ)技術(shù)通用物體檢測樹立了新的里程碑。
值得一提的是,曠視Objects365數(shù)據(jù)集將被用于Detection In the Wild 2019(DIW 2019)挑戰(zhàn)賽中。DIW 2019由曠視研究院聯(lián)合北京智源星空人工智能研究院舉辦,并已成功申請到2019 CVPR Workshop,其目的是為了推動目標(biāo)檢測技術(shù)的發(fā)展,改善現(xiàn)有目標(biāo)檢測數(shù)據(jù)集的類別覆蓋不全、標(biāo)注精度不高、密集場景缺少等問題。
DIW2019挑戰(zhàn)賽的比賽賽道分為三個賽道,即Objects365賽道、Objects365小賽道和CrowdHuman賽道。其中,為探索目標(biāo)檢測系統(tǒng)的瓶頸,參加Objects365賽道的選手將利用公開的365種類別,60萬張圖片超過1000萬個框的完整訓(xùn)練集對檢測模型進(jìn)行訓(xùn)練;在3萬張圖片構(gòu)成的驗證集上調(diào)試算法,并在10萬張圖片構(gòu)成的測試集上進(jìn)行最終的挑戰(zhàn)。
主辦方為每個賽道的冠軍隊伍準(zhǔn)備了10000美元的獎勵。同時,挑戰(zhàn)賽賽程共分為四個階段:即日起進(jìn)入第一階段,開放注冊并同步發(fā)布訓(xùn)練集和驗證集;第二階段(5月初)發(fā)布測試集數(shù)據(jù);第三階段(6月初)終止提交結(jié)果;最后階段將于CVPR 2019 Workshop期間公布比賽結(jié)果,并邀請優(yōu)勝隊在研討會中介紹比賽經(jīng)驗,共同探討檢測問題的瓶頸及優(yōu)化方向。
DIW2019挑戰(zhàn)賽只是曠視Objects365數(shù)據(jù)集其中一個應(yīng)用案例。相信隨著該數(shù)據(jù)集的發(fā)布,研究社區(qū)得以在曠視 Objects365 這一全新的 Benchmark 上開展更多實驗,這勢必會推動通用物體檢測技術(shù)發(fā)展新一波浪潮的到來,為計算機(jī)視覺技術(shù)發(fā)展注入新活力和新動力。
星空人工智能技術(shù)網(wǎng) 倡導(dǎo)尊重與保護(hù)知識產(chǎn)權(quán)。如發(fā)現(xiàn)本站文章存在版權(quán)等問題,煩請30天內(nèi)提供版權(quán)疑問、身份證明、版權(quán)證明、聯(lián)系方式等發(fā)郵件至1851688011@qq.com我們將及時溝通與處理。!:首頁 > 星空人工智能產(chǎn)業(yè) > 智能物聯(lián) » 超越微軟COCO 全球最大物體檢測數(shù)據(jù)集“曠視Objects365”發(fā)布