訂閱
糾錯
加入自媒體

大模型日報| 英偉達在CES2026上的三宗事

2026-01-07 11:50
硅基星芒
關注

01

算力與基礎設施(芯片/云/數據中心)

①CES 2026:英偉達Rubin系列芯片與自動駕駛AI登場

同樣是在2026年國際消費電子展上,被谷歌TPU逐漸打破生態壁壘的英偉達選擇開年出擊。黃仁勛在今年第一場演講上著重強調了以下三部分內容:

一是2025年開源模型正在改變AI行業。

提及開源模型,首當其沖的必然是DeepSeek R1這個被黃仁勛描述為“讓整個世界震驚”的國產模型。自R1發布以來,AI開始進入全球擴散化階段,相比最前沿的AI模型,開源模型僅僅落后約6個月,而這一距離正在肉眼可見地縮短。技術無法被徹底封鎖,依靠閉源實現壟斷的路徑幾乎不可能走通,只有擁抱開源才能構建龐大的生態環境。

黃仁勛表示,英偉達會將很多數據庫進行開源(包括復雜的物理、生物數據),允許用戶處理并生成數據,幫助用戶完成模型的創造、訓練、評估、約束和部署的閉環。

黃仁勛稱,英偉達采用完全公開的方式,讓每家公司、每個行業、每個國家都成為AI革命的一部分。 

二是推出全球首個專門為自動駕駛設計的思考與推理模型Alpamayo。

該模型引入了視覺語言動作模型(VLA),通過向自動駕駛的決策過程中加入人類思維以提升安全性和應急處理能力。英偉達將這一模型以及包含上千小時的物理數據同時開源,用戶可以自行獲取并微調該模型。

三是英偉達全新一代計算平臺Vera Rubin全面投產。

黃仁勛表示,訓練和推理階段所需的算力仍然在不斷激增,模型的規模每年大概要擴大10倍,“Test-Time Scaling”每年在推理階段消耗的token數量增長大概五倍,而token成本則每年要便宜10倍。因此,AI競爭的本質仍然是計算問題。計算速度的提升意味著更快達到下一個領域的新高度。

為此,英偉達設計的Vera Rubin計算平臺恰好在AI的下一個前沿領域到來之際開始投產。按照英偉達內部準則,新一代產品不應該更換超過2枚芯片。

不過,由于摩爾定律放緩,英偉達每年能夠獲得的晶體管數量已經無法匹配模型規模和tokens消耗量的迅速擴大,因此英偉達別無選擇,只能采用更為激進的方式:Vera Rubin是一個由6枚芯片設計為協同工作的系統,誕生于極端代碼設計。

IMG_256

根據演講公布的數據,Vera Rubin NVL72系統相比前代Blackwell系統,各項數據指標均實現顯著提升,其中在FP4推理算力和訓練算力上分別增強至3.6倍和2.5倍,整個機柜包含220萬億個晶體管。除此之外,黃仁勛親自演示了計算節點的組裝,耗時從前代的2個小時壓縮到了5分鐘,系統實現100%液冷。

addad2f42e956815bc0d9279e384e475

性能方面,以訓練一個10萬億參數規模的模型、使用100萬億個token為例,Rubin NVL72所需的GPU數量僅為Blackwell NVL72的1/4;大規模部署場景下,能夠處理的token數量是Blackwell的10倍;token成本則壓縮到了Blackwell的1/10。

短評:

這次英偉達“開源模型+自動駕駛+計算平臺”三軍齊出,可見以谷歌TPU為首的ASIC對英偉達造成的壓力非同小可。在其他廠商開始嘗試在特定場景實現更高的能效比的同時,英偉達轉向了全棧系統能力的競爭。

Rubin平臺作為一個可編程、可組合、支持多模態負載的AI系統,進一步擴大了英偉達生態環境的覆蓋范圍,而推理成本和訓練效率的改進讓英偉達能夠用系統級的優化對沖ASIC的能效優勢。

與此同時,黃仁勛對于開源模型的贊美以及Alpamayo的開源,則說明英偉達的護城河已經不再穩定,需要通過開源換取生態主導權。本次演講中反復強調的物理AI則是英偉達押注的下一片AI主戰場,具身智能、機器人和自動駕駛將成為未來AI應用的重點。

③CES 2026:AMD發布新一代AI PC芯片&游戲處理器

AMD在此次國際消費電子展上宣布了一系列新的AI處理器,表示AI驅動的個人端PC將會是未來的趨勢。

本次發布的是AMD Ryzen AI 400系列處理器,也是AMD AI驅動PC芯片的最新版本。相比競爭對手,多任務處理性能比競品快1.3倍,視頻剪輯和圖像生成等創作任務快1.7倍,內置12核24線程,專門為本地AI推理而進行優化。

生態環境上,目前已有250款以上的AI PC已經搭載AMD芯片,在過去的一年時間內實現了翻倍。同時,全新的Ryzen 7 9850X3D游戲CPU被視為目前最強大的游戲CPU,搭配最新版本的Redstone光追技術,能夠在保持幀率不降的情況下實現更真實的光影效果。

短評:

相比英偉達首次沒有在演講中提及消費級顯卡,甚至減產RTX 5070 / 5060 Ti等產品,AMD更傾向于將目標聚焦于個人電腦端和輕量級AI,差異化的產品設計方向也與AMD“讓每個人都用上AI”的目標相匹配。

盡管二者發布的產品并非直接競爭對手,但AMD的這次產品發布無疑能夠進一步提高生態滲透率,同時增加輕量級模型的應用場景。

02

重大發布(新模型/產品/開源)

①CES 2026:Google TV接入Gemini,“邊緣化”的電視重回舞臺

2026年國際消費電子展上,Google展示了將在其互聯網電視平臺Google TV上增加的多種Gemini相關功能,首發搭載于新款TCL電視,預計在未來幾個月內覆蓋所有Google TV設備。

目前,Google TV上的Gemini支持的功能仍然較為簡單:

一是根據用戶的指令進行內容查找和相關推薦;

二是允許用戶使用語音直接更改電視相關設置;

三是連接谷歌相冊進行圖像處理;

四是與用戶針對特定話題進行語音問答式互動。

以上功能除了必備的互聯網連接和谷歌賬戶以外,還需要Android TV OS 14以上版本方能支持運行。

短評:

電視作為上一代電子產品,如今的應用范圍已經極為有限。谷歌這次錦上添花的更新,幾乎不具備創新性,功能也較為局限,唯一的價值在于覆蓋了更廣泛的用戶群體。

②豆包大模型Doubao-Seed-1.8恢復公開可用

2025年12月25日,廣受國內用戶好評的豆包1.8版本大模型在僅僅發布10天就宣告調整,變為公測狀態,僅允許白名單用戶使用。根據官方給出的原因,Doubao-Seed-1.8的視覺語言模型需要進行調整,以便提供更高質量的技術服務。

目前,該模型已經重新開放體驗,但在“智能路由”的全自動模式下,其候選模型列表中仍然未包含Doubao-Seed-1.8。

短評:

作為國內目前最受歡迎的模型系列,豆包日均50萬以上的tokens消耗量令人震驚。盡管官方沒有給出這次技術調整的具體細節,但頻繁的請求導致字節的算力本就十分緊張,再加上近期AI安全性問題不時暴露,于此時進行緊急調整有利于完善使用體驗,短短幾天吊起用戶胃口也能進一步拉動模型需求增長。

③國產醫療語言模型開源:AntAngelMed拿下HealthBench榜首

昨日,浙江省衛生健康信息中心聯合螞蟻健康、浙江省安診兒醫學人工智能科技有限公司聯合研發了這款名為AntAngelMed的模型,同時它也是目前規模最大、能力最強的開源醫療語言模型之一。

IMG_256

該模型采用三階段的訓練方式:

第一階段是持續預訓練(Continual Pre-Training),大規模、高質量的語料庫有助于模型學習專業領域的知識;

第二階段是監督微調(Supervised Fine-Tuning, SFT),通過高質量的指令數據集模擬醫學場景,提升臨床表現;

第三階段是強化學習(Reinforcement Learning, RL),強調共情能力和安全邊界,減少幻覺概率。

同時,這一醫療模型采用了高效的MoE架構,總參數100B,每次運行只需要激活6.1B,在H20上的推理速度超過200 tokens/s,支持128K上下文窗口。

短評:

盡管該模型性能非常強大,但其硬件配置需求略顯高昂,若想在實際場景中應用至少需要H200級的計算性能;與此同時,由于LLM概率預測器的本質以及自回歸生成的機制,幻覺在本質上難以完全避免,導致該模型在醫學領域的部分復雜場景中難以實際應用。

03

 商業動態(融資/合作/財報)

①字節跳動辟謠:豆包AI眼鏡目前無明確銷售計劃

幾天前,字節旗下的豆包AI眼鏡進入出貨階段的消息讓AI硬件領域沸騰起來,當時傳出的消息是“總量10萬臺,采用高通AR1芯片”。不過,今天上午字節正式否認了這一傳言,明確告知目前暫無銷售計劃。

目前,AI可穿戴設備市場的競爭已經拉開帷幕。2025年,國內有百度的“小度AI眼鏡”、阿里的“夸克AI眼鏡”,國外有Meta的“Ray-Ban Display”,AR與AI能力的不斷提升促生出了這些廣受好評的新一代智能設備,在功能層面上已有替代手機的趨勢。2026年,谷歌預計發布代號為“Project Aura”的AI眼鏡,而字節的相關產品也即將誕生。

短評:

盡管字節否認了銷售計劃,但短短幾個小時內兩條消息的接連發布,仍然存在造勢的可能。在市場已有多款同類競品發布的情況下,字節需要推出技術和用戶體驗都更加完善的產品才能在市場中立足,而這正是坐擁豆包和抖音這兩款“國民級”應用、掌握大量用戶使用偏好數據的字節的優勢所在。

②Google DeepMind產品負責人:是時候重新開始發貨了!

今天凌晨,Google Deepmind的產品負責人Logan Kilpatrick發布了一條耐人尋味的推文:

900871988e3e9f79e5a7edaa657a8060

幾個小時后,又發布了一條升級Google AI Studio儀表盤的消息:

29a5db67f15f7677093aaf7e16d07295

可以推測,不久的未來Gemini將會有新產品誕生,目前廣泛猜測的可能性有兩個:

一是Gemini 3的新檢查點,即對現有Gemini 3模型的微調或對齊優化;

二是Nano Banana 2 Flash,即圖像生成模型Nano Banana的輕量級版本。

短評:

谷歌的產品矩陣已經比較完善,無論是大語言模型還是多模態模型,使用體驗都無可挑剔。本次發布的大概率不會是重量級新產品。但是,目前AI行業已經向著Agent這一領域開始進發,谷歌雖然具備全球數一數二的技術能力,但遲遲未有構建Agent相關的大動作。

不過,考慮到谷歌在與OpenAI這位LLMs先驅者的競爭中已經實現彎道超車,等到Agent的市場格局進一步完善再出手也是不錯的選擇。

       原文標題 : 大模型日報| 英偉達在CES2026上的三宗事

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號