打游戲也輸!新款“阿爾法”擊敗人類玩家
繼圍棋“人機大戰(zhàn)”成功擊敗人類頂尖圍棋高手后,谷歌旗下的人工智能技術(shù)公司“深層思維”的人工智能程序“阿爾法星”,與人類職業(yè)選手在經(jīng)典即時戰(zhàn)略電腦游戲《星際爭霸2》對戰(zhàn)中,取得壓倒性勝利。
據(jù)“深層思維”公司介紹,自去年12月以來,該公司開發(fā)的“阿爾法星”人工智能程序與高水平人類職業(yè)選手先后舉行了11場比賽。在這一系列“人機大戰(zhàn)”中,人工智能程序最終以10比1擊敗人類選手。只有在1月24日舉行的現(xiàn)場比賽中,“阿爾法星”由于游戲視角受限,人類選手才勉強贏下一場。
“深層思維”公司聯(lián)合研發(fā)負(fù)責(zé)人戴維·西爾弗在比賽后指出:“盡管后續(xù)還有很多工作要做,但是我希望未來人們在回望今天時,會把這一比賽結(jié)果當(dāng)成人工智能系統(tǒng)的能力又向前邁了一步的表現(xiàn)。”
據(jù)介紹,與圍棋棋盤上所有棋子都對雙方可見不同,此類游戲中有“戰(zhàn)爭迷霧”,一方需要猜測和偵察對方的行動,屬于“不完美信息博弈”,并且要求人工智能必須實時做出反應(yīng),這對人工智能的要求更高。
“深層思維”公司表示,在“阿爾法星”之前,還沒有任何人工智能系統(tǒng)能夠在《星際爭霸2》中能與人類職業(yè)選手的技巧比擬。而“阿爾法星”能夠在這場“人機大戰(zhàn)”中大比分勝出的一個重要基礎(chǔ),就是它使用了深度神經(jīng)網(wǎng)絡(luò),研究人員通過監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)的方式,直接利用游戲的原始數(shù)據(jù)來訓(xùn)練,以模仿學(xué)習(xí)的思路,讓模型快速學(xué)到高水平人類玩家在游戲中使用的策略和操作。
此外,《星際爭霸2》等游戲中有一個“手速”的概念,用APM(每分鐘操作指令數(shù))來衡量。在基準(zhǔn)測試中,“阿爾法星”每分鐘能夠執(zhí)行約280個操作指令,雖然遠(yuǎn)低于人類職業(yè)選手,但是其動作更精確,也有助于在比賽中取得勝利。
下贏圍棋、打贏電腦游戲,這都能給人工智能的發(fā)展帶來什么呢?“深層思維”的研究團隊認(rèn)為,訓(xùn)練“阿爾法星”的先進方法以及算法的先進架構(gòu)未來都會有助研究人員積累更多經(jīng)驗,最終設(shè)計出能夠應(yīng)對現(xiàn)實生活中不少復(fù)雜問題的人工智能程序,比如天氣預(yù)測、氣候模型計算以及語言理解等。
請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
-
2 華為,重大突破!
- 1 人形機器人“第一股”來了!宇樹科技即將上會
- 2 全球股市陷AI獨大結(jié)構(gòu)性瘋狂
- 3 AI狂歡遇上油價破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 DeepSeek融資500億,梁文鋒難逃資本局
- 5 谷歌2026 I/O大會完整回顧:模型依然重要,但智能體正在接管一切
- 6 全球資本,重倉中國機器人
- 7 Figure AI 交付突破350臺,陪跑特斯拉會迎來iPhone 時刻嗎?
- 8 Anthropic發(fā)布2028年全球AI領(lǐng)導(dǎo)力的兩種情景報告
- 9 “國產(chǎn)GPU第一股”摩爾線程首季扭虧,但造血能力仍待考驗
- 10 特斯拉宣布監(jiān)督版FSD登陸中國?
- 高級軟件工程師 廣東省/深圳市
- 自動化高級工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享













