新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯(cuò)
加入自媒體

陪球迷看了24年足球,百度文心贏了“AI世界杯”首局

文|唐辰  圖|網(wǎng)絡(luò)資料 

多數(shù)跟我同齡的球迷,對(duì)世界杯的初印象可能都來(lái)自2002年。 

這一年,世界杯第一次來(lái)到亞洲,也是中國(guó)男足唯一一次闖入世界杯正賽。同樣,這屆世界杯也是亞洲足球的高光時(shí)刻。 

我們當(dāng)時(shí)看球,主要靠鄰居家的“黑白”大彩電,跟著他們認(rèn)球員、認(rèn)隊(duì)服、喊加油。稍微奢侈一點(diǎn),就是在隔壁大學(xué)生帶回來(lái)的笨重臺(tái)式機(jī)上,在撥號(hào)上網(wǎng)的聲音中打開(kāi)百度首頁(yè),點(diǎn)擊導(dǎo)航的“世界杯”入口,感受互聯(lián)網(wǎng)帶來(lái)的世界杯新奇體驗(yàn)。 

百度也跟球迷們共同見(jiàn)證了伊涅斯塔絕殺、克羅地亞一黑到底、梅西登頂捧杯等無(wú)數(shù)名場(chǎng)面,也記錄了每一場(chǎng)實(shí)時(shí)比分、球員生涯數(shù)據(jù)、各國(guó)戰(zhàn)術(shù)打法及教練排兵思路,甚至冷門(mén)復(fù)盤(pán)和長(zhǎng)期交鋒記錄。 

今年,美加墨世界杯的賽場(chǎng),正在被AI重新改寫(xiě)。

賽場(chǎng)上,AI技術(shù)深度參與賽事運(yùn)營(yíng)、裁判視角視頻(VAR)等各個(gè)環(huán)節(jié);賽場(chǎng)外,陪伴球迷24年的百度,以百度文心的身份再次入場(chǎng),并在12大主流模型的預(yù)測(cè)比拼中領(lǐng)跑。 

圖片

圖|“世界杯預(yù)測(cè)人機(jī)大戰(zhàn)”戰(zhàn)報(bào)

首屆“AI世界杯”開(kāi)賽,“賽博保羅”登場(chǎng)

每屆世界杯,都會(huì)誕生一兩個(gè)民間預(yù)言家,從“章魚(yú)保羅”到“烏賊劉”,場(chǎng)外的“玄學(xué)”預(yù)測(cè)一直是球迷熱議話題。 

AI時(shí)代的到來(lái),讓“玄學(xué)”預(yù)測(cè)有了“科學(xué)”依據(jù)。

前兩天,“世界杯預(yù)測(cè)人機(jī)大戰(zhàn)”發(fā)布了階段戰(zhàn)報(bào),在前15場(chǎng)比賽預(yù)測(cè)中,百度文心以46.7%的勝率在國(guó)內(nèi)12款主流模型中排名第一,比足球?qū)<业念A(yù)測(cè)還精準(zhǔn)。 

尤其是在小組賽科特迪瓦對(duì)陣厄瓜多爾的爆冷對(duì)局。當(dāng)DeepSeek、Kimi、智譜清言、MiniMax、商湯小浣熊等7款主流大模型,不約而同地給出了“平局1:1”的預(yù)測(cè)時(shí),百度文心則給出了非共識(shí)但與賽況一致的“1:0”比分,成為唯一精準(zhǔn)命中具體比分的模型。 

圖片

圖|大模型預(yù)測(cè)科特迪瓦VS厄瓜多爾比賽結(jié)果

需要補(bǔ)充的是,世界杯預(yù)測(cè)人機(jī)大戰(zhàn),是全球首個(gè)由多個(gè)AI與全民同場(chǎng)預(yù)測(cè)的世界杯人機(jī)對(duì)決。12款主流模型全程跟進(jìn)104場(chǎng)賽事,全程可追溯、可對(duì)比、可核驗(yàn),完成一次物理世界大規(guī)模實(shí)景壓力測(cè)試。 

當(dāng)然,階段性領(lǐng)先不等于AI真的成了“預(yù)言家”。足球預(yù)測(cè)的難點(diǎn),恰恰在于變量復(fù)雜、結(jié)果不確定。真正值得討論的,是AI能否在動(dòng)態(tài)信息中形成更接近真實(shí)比賽的判斷路徑。 

也正因此,百度文心的表現(xiàn)有了被拆解的價(jià)值。 

首先,百度“從小就看世界杯”。回到文章開(kāi)頭,從2002年的首頁(yè)導(dǎo)航出現(xiàn)“世界杯”入口開(kāi)始,百度就承載全民看球的熱情。當(dāng)年全網(wǎng)積攢下的海量足球搜索需求,也催生了后續(xù)貼吧、知道等球迷交流陣地。 

圖片

圖|2002年百度首頁(yè)“世界杯”入口

2014年巴西世界杯,百度再度與谷歌、微軟和高盛對(duì)世界杯各階段結(jié)果進(jìn)行了預(yù)測(cè)。從小組賽階段的預(yù)測(cè)準(zhǔn)確率來(lái)看,百度以28場(chǎng)正確獲得58.33%的準(zhǔn)確率,領(lǐng)先準(zhǔn)確率為56.25%的微軟和37.5%的高盛。 

而在淘汰賽階段已經(jīng)進(jìn)行的12場(chǎng)比賽中,百度和微軟全部預(yù)測(cè)準(zhǔn)確,準(zhǔn)確率為100%,而谷歌則預(yù)測(cè)準(zhǔn)確其中的11場(chǎng),準(zhǔn)確率為91.67%。百度通過(guò)AI實(shí)現(xiàn)了精準(zhǔn)的預(yù)知,“完勝”微軟、谷歌、高盛。 

其次,“百度一下”正在重構(gòu)AI信任。前段時(shí)間“豆包型人格”風(fēng)靡網(wǎng)絡(luò),這種將AI抽象成某種“糊弄型人格”的解構(gòu),實(shí)際上是普通用戶對(duì)ChatBot式產(chǎn)品投下的不信任票。 

其本質(zhì)是,多數(shù)AI工具是“概率性文本生成器”,它們基于海量數(shù)據(jù)“預(yù)測(cè)”下一個(gè)最可能出現(xiàn)的詞。當(dāng)它無(wú)法給出準(zhǔn)確答案時(shí),為了維持對(duì)話的流暢性,會(huì)自動(dòng)腦補(bǔ)出一套符合語(yǔ)法邏輯但缺乏事實(shí)支撐,或者完全錯(cuò)誤的內(nèi)容。 

也就是大家常說(shuō)的,為了滿足用戶的即時(shí)情緒,它們會(huì)“一本正經(jīng)的胡說(shuō)八道”。 

這些AI追求極致效率,卻丟掉了最核心的可信度。比如青年演員劉美含在配音工作中,因不確定“坊”字怎么讀,查詢(xún)了百度AI、DeepSeek、元寶、豆包、千問(wèn)5款A(yù)I工具,但答案都不一樣。最終,她還是在《新華詞典》中得到確定答案,百度文心給出的fáng(二聲)是正確的。 

當(dāng)能力不再是瓶頸,信任才是AI的天花板。百度從架構(gòu)和治理上“雙管齊下”,對(duì)癥施藥。一方面,百度重塑搜索架構(gòu)的核心邏輯。它不再讓模型直接“生成”答案,而是在AI API的基礎(chǔ)上疊加了雙層Agent(智能體)。 

另外一方面,百度在信源上,通過(guò)三道權(quán)威性過(guò)濾機(jī)制——多源比對(duì)的全維度身份核驗(yàn)、先篩再用的多源交叉驗(yàn)證、以及實(shí)時(shí)巡檢的自動(dòng)糾偏兜底,來(lái)保障答案的準(zhǔn)確性。 

這種“左手生成,右手把關(guān)”的機(jī)制,讓其在低幻覺(jué)和數(shù)據(jù)準(zhǔn)確上建立了優(yōu)勢(shì),讓每一次輸出,都經(jīng)得起推敲。 

第三,文心大模型的硬核實(shí)力是底氣。足球的魅力在于不確定性,賽場(chǎng)內(nèi)外都會(huì)有各種突發(fā)狀況。球隊(duì)實(shí)力、球員狀態(tài)、戰(zhàn)術(shù)打法、天氣環(huán)境乃至裁判尺度等,都能左右最終結(jié)果。 

傳統(tǒng)賽事預(yù)測(cè)模型、早期AI工具,甚至包括當(dāng)前不少大模型,大多屬于“靜態(tài)計(jì)算工具”,僅能依托歷史戰(zhàn)績(jī)、球隊(duì)排名等固定數(shù)據(jù)做概率推演,不具備主動(dòng)拆解問(wèn)題、動(dòng)態(tài)研判場(chǎng)景的能力。 

此次百度文心憑借背后模型文心5.1的強(qiáng)大深度搜索、實(shí)時(shí)聯(lián)網(wǎng)、推理等能力,在世界杯預(yù)測(cè)場(chǎng)景中,能夠同時(shí)覆蓋更多維度的實(shí)時(shí)信息,如球隊(duì)?wèi)?zhàn)術(shù)體系、傷病情況、歷史交鋒等動(dòng)態(tài)變化數(shù)據(jù),從而預(yù)測(cè)結(jié)果的準(zhǔn)確性和穩(wěn)定性也就越高。 

要知道,在LMArena搜索榜中,文心5.1曾以1223分位列全球第四、國(guó)內(nèi)第一。 

圖片

圖|文心5.1排名LMArena搜索榜國(guó)內(nèi)第一

“1+1+1>3”,二十多年深耕足壇的海量數(shù)據(jù)積淀、百度文心與生俱來(lái)的可信底色、大模型成熟穩(wěn)定的推理能力,以及多年數(shù)據(jù)積累構(gòu)成的體系化生態(tài)能力,讓百度在世界杯預(yù)測(cè)和低幻覺(jué)解答上,有了領(lǐng)先全行業(yè)的根基。 

AI落地,拼的是長(zhǎng)期主義

世界杯是一個(gè)很特殊的AI試驗(yàn)場(chǎng),既有現(xiàn)實(shí)世界的復(fù)雜性、隨機(jī)性,又具備明確可驗(yàn)證的結(jié)果。預(yù)測(cè)準(zhǔn)不準(zhǔn),不能只靠概念包裝,最終都要回到比賽結(jié)果里接受檢驗(yàn)。 

其中最難的地方在于,AI面對(duì)的是動(dòng)態(tài)、充滿不確定性的真實(shí)世界。考驗(yàn)的是AI如何通過(guò)模型能力、Agent組織調(diào)度來(lái)完成復(fù)雜任務(wù),以及當(dāng)前AI能力究竟能做到什么、還有哪些邊界。 

這個(gè)過(guò)程就像足球比賽,能不能進(jìn)球的結(jié)果很迷人,但比賽過(guò)程一樣能讓人熱血沸騰。 

百度文心成為世界杯預(yù)測(cè)模型榜第一,依托的不只是大模型推理能力,還有百度長(zhǎng)期積累下來(lái)的搜索能力、數(shù)據(jù)沉淀和信息校驗(yàn)機(jī)制。 

這些能力組合在一起,才讓AI有機(jī)會(huì)在復(fù)雜場(chǎng)景里給出更接近真實(shí)比賽的判斷。 

從2002年開(kāi)始承載球迷的信息需求,到后來(lái)持續(xù)布局搜索、知識(shí)體系和AI技術(shù),百度一直在做的是同一件事:把信息組織起來(lái),把復(fù)雜問(wèn)題拆開(kāi),再用技術(shù)給出更可靠的答案。

比如,和世界杯同期的高考志愿填報(bào),百度文心也走出了差異化、高可信的落地路徑。其中最大的亮點(diǎn)是,百度高考還引入真人專(zhuān)家背書(shū)機(jī)制,由資深志愿咨詢(xún)師對(duì)AI生成的報(bào)告進(jìn)行審核認(rèn)證,這一機(jī)制在行業(yè)中尚屬首創(chuàng)。 

在百度的語(yǔ)境里,AI負(fù)責(zé)提高效率和覆蓋面,專(zhuān)家經(jīng)驗(yàn)則負(fù)責(zé)兜底和校準(zhǔn),二者在高風(fēng)險(xiǎn)決策場(chǎng)景中形成協(xié)同,搭建起完善的信任保障體系。 

世界杯預(yù)測(cè)也好,高考志愿也好,本質(zhì)上都指向同一個(gè)問(wèn)題:AI怎樣在真實(shí)世界里建立信任。

百度文心也讓外界看到:百度AI的硬核實(shí)力,不是在追風(fēng)口,而是深耕行業(yè)二十余年,沉淀下來(lái)的技術(shù)底氣與生態(tài)壁壘,并以此來(lái)解決真實(shí)世界的復(fù)雜問(wèn)題。 

我是唐辰同學(xué),關(guān)注互聯(lián)網(wǎng)科技及AI新經(jīng)濟(jì)。原創(chuàng)內(nèi)容,未經(jīng)許可,謝絕轉(zhuǎn)載。

       原文標(biāo)題 : 陪球迷看了24年足球,百度文心贏了“AI世界杯”首局

聲明: 本文由入駐維科號(hào)的作者撰寫(xiě),觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

0條評(píng)論,0人參與

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無(wú)評(píng)論

暫無(wú)評(píng)論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號(hào)
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號(hào)