盤點(diǎn)2018年計(jì)算機(jī)視覺領(lǐng)域技術(shù)突破
回顧2018年,是屬于人工智能的一年,不論是Google、Facebook、Intel、阿里巴巴等通過(guò)產(chǎn)業(yè)布局進(jìn)入人工智能領(lǐng)域的互聯(lián)網(wǎng)企業(yè),亦或如曠視科技Face++、極鏈科技Video++、優(yōu)必選科技這樣直接以人工智能起家的原生技術(shù)企業(yè),都將AI注入到每個(gè)角落,掀起了一輪又一輪的技術(shù)高潮。
因而,除了NLP研究突破接連不斷,CV領(lǐng)域同樣精彩紛呈,伴隨著各式各樣落地應(yīng)用如此接近人們的生活,技術(shù)也變得越發(fā)成熟。本文整理了在2018年,在CV技術(shù)領(lǐng)域取得的最主要的一些重大技術(shù)突破。

BigGAN發(fā)布
Ian Goodfellow在2014年設(shè)計(jì)了GAN,在之后的幾年中,圍繞這個(gè)概念產(chǎn)生了多種多樣的應(yīng)用程序。
其中,在ICLR 2019論文中出現(xiàn)的BigGAN,同樣是一個(gè)GAN,只不過(guò)更強(qiáng)大,是擁有了更聰明的課程學(xué)習(xí)技巧的GAN,由它訓(xùn)練生成的圖像連它自己都分辨不出真假,因?yàn)槌悄蔑@微鏡看,否則將無(wú)法判斷該圖像是否有任何問(wèn)題,因而,它更被譽(yù)為史上最強(qiáng)的圖像生成器。

在計(jì)算機(jī)圖像研究史上,BigGAN帶來(lái)的突破是劃時(shí)代的,比如在ImageNet上進(jìn)行128×128分辨率的訓(xùn)練后,它的IS得分能達(dá)到166.3,是之前最佳得分52.52分3倍;除了搞定128×128小圖之外,BigGAN還能直接在256×256、512×512的ImageNet數(shù)據(jù)上訓(xùn)練,生成更讓人信服的樣本。
英偉達(dá)Video-to-Video Synthesis
英偉達(dá)在2018年的收獲頗豐,他們的研究焦點(diǎn)從標(biāo)準(zhǔn)的監(jiān)督學(xué)習(xí)轉(zhuǎn)向更具挑戰(zhàn)性的機(jī)器學(xué)習(xí),如半監(jiān)督學(xué)習(xí),領(lǐng)域適應(yīng),主動(dòng)學(xué)習(xí)和生成模型等。其中,由英偉達(dá)在2018年末發(fā)布的最大成果之一便是視頻到視頻生成(Video-to-Video synthesis),它通過(guò)精心設(shè)計(jì)的發(fā)生器、鑒別器網(wǎng)絡(luò)以及時(shí)空對(duì)抗物鏡,合成高分辨率、照片級(jí)真實(shí)、時(shí)間一致的視頻,實(shí)現(xiàn)了讓AI更具物理意識(shí),更強(qiáng)大,并能夠推廣到新的和看不見的更多場(chǎng)景。


因而,Video-to-Video Synthesis也被看作是在過(guò)去幾年中,視頻領(lǐng)域的一次重大突破,畢竟從靜態(tài)框架轉(zhuǎn)換為動(dòng)態(tài)框架的難度是很大的,但機(jī)器訓(xùn)練卻在盡量模擬預(yù)測(cè)視頻將會(huì)發(fā)生的情景,通過(guò)給定的輸入視頻學(xué)習(xí)映射函數(shù),產(chǎn)生仿真度極高的視頻內(nèi)容。
Fast.a(chǎn)i18分鐘訓(xùn)練ImageNet
在普遍認(rèn)知還停留在需要大量計(jì)算資源來(lái)執(zhí)行適當(dāng)?shù)纳疃葘W(xué)習(xí)任務(wù)時(shí),F(xiàn)ast.a(chǎn)i通過(guò)使用16個(gè)公共AWS云實(shí)例,每個(gè)配備8個(gè)NVIDIA V100 GPU,運(yùn)行fast.a(chǎn)i和PyTorch,用18分鐘在ImageNet上將圖像分類模型訓(xùn)練到了93%的準(zhǔn)確率,刷新了一個(gè)新的速度記錄。

這是一個(gè)令人驚喜的結(jié)果,尤其在公共基礎(chǔ)設(shè)施上訓(xùn)練ImageNet能達(dá)到這種準(zhǔn)確性,并且比其專有TPU Pod群集上的谷歌DAWNBench記錄快40%,運(yùn)行成本僅約為40美元。這意味著一個(gè)關(guān)鍵的里程碑出現(xiàn)了,幾乎所有人都可以在一個(gè)相當(dāng)大的數(shù)據(jù)集上訓(xùn)練大規(guī)模神經(jīng)網(wǎng)絡(luò)。
除了這些重要的節(jié)點(diǎn)之外,2018年的計(jì)算機(jī)視覺技術(shù)也部署更多方面,不論是亞馬遜發(fā)布Rekognition將計(jì)算機(jī)視覺置于開發(fā)人員、微軟為OneDrive和SharePoint推出了新的AI服務(wù)、Google相冊(cè)讓我們的記憶變得可搜索、還是每個(gè)場(chǎng)景下都正在逐漸普及的AI人臉識(shí)別等等,計(jì)算機(jī)視覺正在逐步滲透到我們生活的每個(gè)部分。
最后,最值得注意的是,計(jì)算機(jī)視覺的市場(chǎng)增長(zhǎng)幾乎與其技術(shù)能力的增長(zhǎng)是一樣快的,預(yù)計(jì)到 2025年,計(jì)算機(jī)視覺領(lǐng)域會(huì)帶來(lái)超過(guò)262億美元的收益,因而在人工智能的未來(lái)里,計(jì)算機(jī)視覺一定是最有力的表現(xiàn)形式,并將隨處可見。
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來(lái)了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-

長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
6月30日立即申請(qǐng)?jiān)囉?> 【免費(fèi)試用】旭之源工業(yè)電源一一機(jī)器人的穩(wěn)定“心臟“
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來(lái)·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
推薦專題
-
2 華為,重大突破!
- 1 人形機(jī)器人“第一股”來(lái)了!宇樹科技即將上會(huì)
- 2 全球股市陷AI獨(dú)大結(jié)構(gòu)性瘋狂
- 3 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 DeepSeek融資500億,梁文鋒難逃資本局
- 5 谷歌2026 I/O大會(huì)完整回顧:模型依然重要,但智能體正在接管一切
- 6 全球資本,重倉(cāng)中國(guó)機(jī)器人
- 7 Figure AI 交付突破350臺(tái),陪跑特斯拉會(huì)迎來(lái)iPhone 時(shí)刻嗎?
- 8 Anthropic發(fā)布2028年全球AI領(lǐng)導(dǎo)力的兩種情景報(bào)告
- 9 “國(guó)產(chǎn)GPU第一股”摩爾線程首季扭虧,但造血能力仍待考驗(yàn)
- 10 特斯拉宣布監(jiān)督版FSD登陸中國(guó)?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





