百度AI最新進展,李彥宏打出一張效率牌

在算力貴過黃金的時代,效率本身就是壁壘。
新眸原創·作者 | 李小東
百度選在2026年Create大會開幕前四天,端出了文心大模型5.1。
這個時間點的選擇不算意外。5月13日的開發者大會需要一張技術底牌,而距離上一個版本發布已過去近半年,市場上關于“百度大模型掉隊”的聲音正在變響。
這個時候推出的文心5.1,需要用數據來回擊這些質疑,而它也的確拿出了幾張夠硬的牌:搜索榜國內第一,預訓練成本僅為業界同規模模型的6%,Agent能力超越DeepSeek-V4-Pro。
但回看百度過去一年的AI軌跡,一個問題很難回避:技術上的領先,似乎并沒完全轉化為市場端的領先?文心5.1給出的答案,分量又有多重呢?
01
三組數據和解一樁“舊案”
先看文心5.1到底亮出了什么。
根據LMArena大模型競技場最新排名,文心5.1以1223分位列搜索榜國內第一、全球第四,是該榜單中唯一上榜的國產大模型。它的Preview版本早在4月30日就以1476分登頂文本榜國內第一,超越GPT-5.5和DeepSeek-V4-Pro,是前十五名中唯一入圍的國產模型。

對于一家從2023年起就被反復質疑“大模型沒聲音了”的公司來說,這兩項成績是某種意義上的“解案”,至少從榜單維度看,百度的模型能力沒有掉隊。
不過值得討論的,的確不是分數,而是分數背后的技術路徑選擇。
文心5.1的核心技術叫“多維彈性預訓練”。這個提法最早在文心5.0發布時出現,它的邏輯是:在一次預訓練過程中,通過動態采樣機制同時優化大量不同深度、專家容量和稀疏度的子模型,最終構建一個覆蓋不同參數規模和計算預算的子模型矩陣。
翻譯成白話就是,一次訓練,生成多種型號,不再需要為每種規模單獨燒一次算力。按照研發人員的表述,這套框架分別沿彈性深度、彈性專家容量和彈性稀疏度三個維度做壓縮與擴展,通過可變Top-k路由靈活調配激活專家數量,在推理開銷和模型性能之間建立可控的調節空間。
落到具體數字上:文心5.1的總參數被壓縮到文心5.0的約三分之一,激活參數壓縮到約二分之一,預訓練計算成本僅為同規模同類模型的6%。
6%這個數字很容易被誤讀。它不是說“用6%的錢做出了100%的性能”,而是說,在同等參數量級和性能水平下,訓練階段消耗的算力只用了行業慣常的6%。這是通過“模型壓縮和彈性訓練大幅降低冗余計算”來達成的,是一種預訓練環節的效率提升。
在2026年全球數據中心能耗爭議持續升級、國產芯片供給尚不寬裕的背景下,這個方向的選擇,說服力不弱。
再看評測數據。在τ³-bench和SpreadsheetBench-Verified兩項智能體評測任務中,文心5.1超越了DeepSeek-V4-Pro,官方給出的描述是“智能體能力已接近領先閉源模型的水平”。創意寫作方面則與Gemini 3.1 Pro持平,在AIME26數學競賽(使用工具)上拿到99.6分,僅次于Gemini 3.1 Pro。

這些數據大多是百度內部評測或較小的基準測試,并不是LMArena那種大規模盲測榜單,穩健性還需更多第三方驗證,但整體方向是清晰的:這代模型的升級空間主要在Agent和深度搜索能力上,而非純粹的語言表達。
目前,文心5.1已在千帆模型廣場和文心一言官網上線,開發者可以通過千帆平臺調用API。百度還宣布將文心5.1陸續接入ISEKAI ZERO、Mulan AI、諦聽幻流、Storymaster等超過十個創意生產智能體平臺。
這個動作的意圖明顯,不是只談模型,而是談模型落地。
放在整個行業,文心5.1在產品端的節奏不算慢。但真正讓百度頭疼的,一直都不是技術。
02
百度選了一條不同的路
如果單純比打分,文心5.1并不弱勢。但2026年的AI市場,尤其在中國,產品競爭,相比看分數,大家更在乎的是誰的用戶多、場景多。
2026年春節,四家大廠在AI領域的總營銷投入接近50億元。百度搶先開局,拿出5億現金紅包,把入口全部放在百度App生態內。字節豆包投入15億到20億,騰訊元寶10億,阿里千問出手最重,60億。
根據QuestMobile的數據,春節前后字節豆包以8400萬日活開局,除夕當天沖到1.45億峰值;阿里千問活動次日日活達到7352萬;騰訊元寶除夕4054萬。而百度文心的用戶增長曲線動靜平平。
外界感知到的是,百度在C端用戶的爭奪中正在被甩開,雖然模型能力不斷迭代,但公眾感知嚴重滯后。這是中國AI產業一個特有的悖論,技術團隊不斷優化訓練效率,但用戶只關心“這玩意兒能不能幫我訂機票”。兩個坐標系互相不認識。
如果要說一個更大的行業敘事,2026年上半年的關鍵詞,正在從“軍備競賽”切換到“商業化”。
前不久,字節豆包啟動收費模式,最低檔68元/月,最高5088元/年,評論區被“又笨又收費”的罵聲淹沒。但不要搞錯,這是全行業的拐點。上個月,阿里云、騰訊云、百度智能云和智譜同步漲價,部分漲幅高達463%。
在C端用戶還在習慣“免費AI”幻象的時候,大廠們已經開始算現實的成本:API調用量每漲一波,模型的推理成本就跟著翻番。
百度實際上比大多數同行更早感受到了這種壓力的峰值。2025年Q3,百度核心在線營銷收入153億元,同比下降18%,和2023年Q2的峰值197億元相比,跌去了超過五分之一。這個縮水不是周期性的,而是結構性的——用戶不再愿意從一頁鏈接里自己找答案,AI直接給答案才是新習慣。對用戶體驗來說是好事,但對搜索廣告這個百度最大的利潤支柱來說,基礎開始松動。
李彥宏的選擇是押注AI轉型。到2025年Q4,百度AI新業務收入達到113億元,占核心非在線營銷收入的43%。AI云收入在Q3同比增長33%,AI原生營銷服務收入同比激增262%。一減一增之間,百度的業務結構確實在變。
回到文心5.1,如果放在這個商業化視角下重新審視,它傳遞的信號不只是“比分高”,看點在于,“訓練成本是行業6%”。在API價格集體走高的2026年,訓練成本優勢就是云服務的定價權和利潤空間。
百度在AI云的競爭力,取決于能否把文心大模型的效率優勢轉化為持續性收入增長。這個命題,比在Benchmark榜單上拿一個第一要難得多。
03
文心5.1的價值或許在百度App里
那么,文心5.1的真正價值在哪里?
如果只是將它當作一個API調用的標準模型,技術數據上它確實有說服力。但對于百度來說,需要思考的是,如何把它嵌入到百度App這個月活超2億的超級入口中。
今年初,文心助手月活突破2億,春節期間百度把紅包入口全部導向了百度App。這個策略說明百度已經放棄了做獨立AI App的打法,它要回到自己的主場,用AI重塑搜索。
在百度世界大會2025上,李彥宏透露,百度搜索首條結果的富媒體覆蓋率已達70%。用戶搜索一個問題,AI直接給出結構化的圖文答案,而不再是一排藍鏈接。這對用戶是好事,對廣告收入是壞事——因為點擊行為會大幅減少,廣告庫存跟著縮水。
這是一個商業悖論:用戶體驗越好,變現越難。
文心5.1給出的答案,在它被著重強調的“搜索能力”里。它的“多源信息快速檢索、整合與生成能力”,理論上可以用來給出更豐富、更個性化的答案。而這些高質量的信息整合結果,本身就可能成為新的廣告呈現方式——不是鏈接廣告,而是內容嵌入式的信息推薦。
在這個邏輯下,AI搜索不是吃掉廣告收入,而是換一個方式重建廣告收入。能不能走通,取決于百度在5月13日Create大會上公布的商業化路徑,是否足夠清晰。
同時不能忽視的是百度在算力側的布局。旗下昆侖芯已向港交所提交上市申請,同時百度構建的三萬卡智算集群為大模型訓練提供基礎支撐。在2026年國產芯片替代加速的語境下,“自研芯片+自研模型”這個組合的遠期價值,可能比文心5.1本身更值得關注。
高盛在近期報告中指出,中國AI訓練將越來越依賴高度優化的計算效率架構,而非單純堆算力規模。百度目前的路徑,通過軟硬協同優化把訓練成本壓縮到極致,與這個產業方向高度對齊。
文心5.1是一張技術底牌,在搜索能力、訓練效率和Agent能力三個維度上都給出了可以量化的提升。它最硬的數字在于那“6%”,在算力貴過黃金的時代,效率本身就是壁壘。
但2026年的中國AI競爭,早已過了“參數和跑分”定勝負的階段。商業化的壓力、用戶規模的爭奪、行業場景的滲透,構成了一套遠比Benchmark更復雜的評判體系。5億紅包打不出水花的尷尬,大模型上車的錯失,搜索廣告失速帶來的利潤真空——這些不是文心5.1憑技術數據能解決的。
5月13日Create大會,李彥宏將登場。屆時決定的可能不是“文心產品如何迭代”,而是百度在AI這條路上,到底準備怎么把錢掙回來。在大廠集體進入“算賬生存”模式的2026年,這個答案,也許才是市場最想聽到的。
本文系新眸原創
— END —
原文標題 : 百度AI最新進展,李彥宏打出一張效率牌
請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
- 1 特斯拉Optimus Gen3量產在即,哪些環節最具確定性?
- 2 OpenAI深夜王炸!ChatGPT Images 2.0實測:中文穩、細節炸,設計師慌了
- 3 五分之一崗位被AI滲透:美國加速替代,中國穩崗賦能,全球勞動力市場冰火兩重天
- 4 估值泡沫隱憂:OpenAI 8520 億估值的信任危機與戰略迷途
- 5 6000億美元估值錨定:字節跳動的“去單一化”突圍與估值重構
- 6 2026年,具身智能開啟工業單場景落地元年
- 7 Tesla AI5芯片最新進展總結
- 8 連夜測了一波DeepSeek-V4,我發現它可能只剩“審美”這個短板了
- 9 熱點丨AI“瑜亮之爭”:既生OpenClaw,何生Hermes?
- 10 AI晨報 | 英偉達發布全球首個量子AI模型Ising;騰訊云率先支持熱門Agent部署;OpenAI開撕Anthropic,大戰升級 過去一天,全球AI產業風云再起。從中美技術角力的最新論斷,到云


分享













