爭鋒CPU,角逐PC! 黃仁勛臺北炸場,英特爾、AMD該慌了

英偉達發布個人電腦超級芯片RTX Spark,狠狠沖擊PC市場。

剛剛,英偉達GTC Taipei 2026大會上,黃仁勛身穿標志性的皮衣再次登場。
開場第一句就定調:“兩年前我來這里的時候,開始和你談論AI的下一波浪潮。今天我可以告訴你,代理式AI已經到來,實用性AI已經到來(Agentic AI has arrived. That useful AI has arrived.)。”
本次英偉達GTC Taipei 2026大會上,黃仁勛說了六大重點:
第一,Token經濟學,Token現在是盈利的單位。芯片便宜不代表你賺了,芯片貴不代表你虧了
第二,Agent架構五大核心組件:模型(Model)、線束(Harness)、工具(Tools)、技能(Skills)、運行時組件(Runtime)。
第三,Vera Rubin現在正在全面生產中,秋季開始發貨。
第四,發布智能體時代的CPU Vera;與x86 CPU相比,任務完成速度提高了1.8倍。
第五,發布個人電腦超級芯片RTX Spark,黃仁勛表示“30年來我們所學的一切精華,都凝聚在這一塊芯片中。
第六,芯片設計進入Agent時代,和Cadence、西門子、Synopsys等構建自主AI工程師。
Token經濟學:多買多賺
Token如今成了硅谷、中國臺灣、深圳所有科技從業者嘴里最熱的詞。黃仁勛說:“Token現在是盈利的單位。每個Token都是收入。AI公司想建更多Token,建更多AI工廠。”
一個1吉瓦的AI工廠項目,起步價200-300億美元。很快會到600億,800億。每吉瓦一百億美元。全球科技巨頭正在瘋狂建設AI基礎設施,中國臺灣的計算機廠商最近忙得飛起。黃仁勛在現場對著產業鏈說:“你們都如此忙碌,(中國臺灣)企業們做得很好。”這句話背后是整個半導體供應鏈的狂歡。

這就是Token經濟學。傳統IT時代,買服務器是成本,計算是消耗。AI時代,買GPU是投資,計算是收入。黃仁勛直接畫了一條線:芯片便宜不代表你賺了,芯片貴不代表你虧了。選錯架構的代價,從未如此高昂。如果你的AI工廠每瓦吞吐量不夠高,你買得越多虧得越多。如果每瓦吞吐量足夠高,你買得越多賺得越多。

兩年前黃仁勛說下一波是Agent AI。今天他說:“自主性AI已經到來,實用性AI已經到來”。
黃仁勛給出了一組數據:GitHub提交次數從2023年的3億次飆升至2026年的5億次。兩年翻將近兩倍。全球3000萬軟件開發者,用3萬億美元薪資,創造了9萬億美元生產力。
黃仁勛反駁了AI會導致失業的說法:“有人說AI會讓程序員失業。純屬無稽之談。工程師數量在增加。因為每個工程師能創造三倍產出,企業當然想招更多。”AI的價值不在于替代,在于放大。它讓每個開發者、每個企業的產出能力呈指數級增長。當每個軟件工程師能創造三倍價值時,企業沒有理由減少招聘,反而會擴招。這就是黃仁勛看到的未來:生產力革命正在發生,而且這個革命的速度比任何人預期的都快。
Agent架構:五大核心組件
過去四十年,計算機的工作模式從未改變:啟動應用程序,點擊輸入,等待結果。Agent時代完全不一樣。用戶只需要描述意圖,AI自動生成代碼或使用工具,產生必要輸出。
在傳統計算中,軟件是一個二進制包,運行在操作系統內部,受限于操作系統的調度和約束。Agent的計算模式是異構分布的——模型、線束、工具、技能、運行時分布在數據中心的不同位置,由CPU統一協調。

黃仁勛詳細拆解了Agent的五大核心組件:
黃仁勛明確指出:"This agent consists of model, harness, tools and skills, and a runtime."
模型(Model):充當“大腦”,負責理解、觀察、推理、規劃。大型語言模型融合了同步轉換能力,如今已能出色完成思考任務。
線束(Harness):連接一切的“操作系統”。每次上下文處理時,精確路由信息,理解正在發生的事情,協調各組件協同工作。工作記憶和長期記憶的區分在這里變得至關重要。
工具(Tools):可以是電子表格、網絡瀏覽器、數據處理引擎、數據庫引擎、C編譯器、Python解釋器、JavaScript引擎,甚至加速計算庫。每當Agent使用工具時,CPU被調用處理這些請求。
技能(Skills):這是黃仁勛特別強調的突破。技能本質上是工具的使用手冊,AI讀取后說“這就是它的使用方法”。英偉達的所有CUDA X庫現在都將配備AI可學習的技能。Agent使用這些庫的能力將遠超人類程序員。
運行時(Runtime):協調所有組件的執行環境。安全控制裝置在CPU和DPU安全處理器上運行,對整個過程進行監控。記憶管理是其中最困難的部分——工作記憶類似KV緩存,需要處理壓縮、檢索、結構化和非結構化數據。
Agent的計算是分布式異構的。這帶來巨大的技術挑戰:當計算被分解后,CPU核心之間、CPU與存儲設備之間、CPU與GPU之間的帶寬成為瓶頸。數據在芯片內外流動時,不能有三重態損耗,不能穿越芯片邊界。跨芯片通信延遲必須極低。
Agent的新應用程序與過去應用程序的運行方式有著本質區別。過去應用程序的約束來自操作系統,而Agent的約束來自架構本身——分布式計算的特性決定了它必須在異構環境中高效運行。
正是這個異構計算問題,促使英偉達開發了Vera Rubin。

Vera Rubin全面投產,秋季開始發貨
今天,黃仁勛宣布Vera Rubin 正在加速全面投產,產品將于今年秋季開始發貨。
Vera Rubin是 NVIDIA 迄今為止規模最大的 POD 級平臺——五個專用機架組成一個龐大的 AI 超級計算機,專為代理工作負載而設計。該平臺將Vera Rubin NVL72 系統、 Vera CPU、Groq 3 LPX、 Vera BlueField-4 STX 存儲和 Spectrum-6 SPX 以太網機架整合到一個完全集成的系統中。與上一代 NVIDIA Grace Blackwell 平臺相比,Vera Rubin 的大規模代理吞吐量提高了 10 倍。

黃仁勛說:“Vera Rubin正是為這一時刻而生——它是一個人工智能工廠引擎,能夠大規模地提供智能,并具備推動下一輪工業革命所需的性能、效率和安全性。”
過去組裝一個Grace Blackwell機架需要兩小時,現在只需5分鐘。沒有電纜,沒有軟管,沒有風扇,中間只有一塊PCB連接兩側。黃仁勛展示這段對比時,語氣里藏不住的得意:“上次我給你看這個的時候花了多少時間,我們到處都是電纜。但現在中間有一塊PCB,連接兩側的部分。過去需要兩小時完成的事情,現在只需五分鐘。”

不僅是更高的產能,更是AI工廠部署速度的質變。更重要的是可靠性提升,沒有線纜就沒有線纜故障的風險。黃仁勛說:“Rubin的可靠性和韌性,將會高得離譜。”
頂級系統集成商、基礎設施軟件和存儲合作伙伴正在全面生產Vera Rubin產品,其中包括戴爾科技、HPE、聯想和超微,以及AIC、仁寶、富士康、技嘉、英業達、和碩、廣達云科技(QCT)、緯創資通和Wiwynn等中國臺灣代工巨頭。
Vera Rubin平臺引入了NVIDIA Spectrum-X以太網光子技術,這是世界上首款基于共封裝光器件(CPO)的交換機,具有200Gb/s SerDes,現已投入生產。
同時,Vera Rubin平臺采用全棧式NVIDIA機密計算技術,旨在打造機架級可信執行環境。Vera Rubin NVL72將Vera CPU、Rubin GPU、NVIDIA NVLink網絡和安全功能集成于統一平臺,并通過高速互連加密數據。這提供了硬件級認證,確保系統防篡改。
NVIDIA DSX平臺為Vera Rubin人工智能工廠提供了完整的設計和運營基礎——統一了參考設計、仿真、基礎設施軟件、設施和生態系統技術,以幫助構建和運營節能型人工智能工廠,從而實現最低的Token成本。

黃仁勛專門花時間感謝了微軟、戴爾、CoreWeave,因為它們已經搭建了Vera Rubin的工程機架。這意味著代工伙伴不再只是生產零部件,它們在幫英偉達驗證整個系統。芯片、散熱、網絡、存儲全部打通。這才是真正的一站式交付。
Vera CPU:首款為Agent打造的處理器
本次演講中另一個發布,是英偉達首款專為AI Agent時代打造的處理器:Vera CPU。
黃仁勛提出了一個深刻的問題:過去所有CPU都是為人類設計的,人類使用CPU的方式是在一個以秒計數的世界里生活。人類可以等待,可以點擊關閉彈窗,可以適應各種不便。但Agent不一樣。Agent缺乏耐心。它們并非生活在分秒必爭的世界里,它們生活在一個以納秒為單位的世界里。當Agent使用工具時,希望響應時間盡可能快。當它訪問數據庫時,必須盡快回來。Agent等待的每一刻都會使其無法進入下一步。
這就是為什么需要全新的CPU架構。傳統CPU的設計假設用戶可以容忍一定的延遲,但Agent的要求完全不同。

在Vera Rubin機架中,Vera CPU承擔著三種關鍵職責:第一,編排與管理。Vera CPU用于協調和管理GPU的工具,管理KV緩存,處理機架中運行的所有軟件。在復雜的Agent工作流程中,這些CPU是整個系統的指揮中心。第二,安全與隔離。 通過Vera BlueField,CPU負責安全和隔離功能,確保不同工作負載之間不會相互干擾。第三,線束與入口。Vera CPU用于AI模型的工具使用編排,訪問數據庫。
黃仁勛指出了Vera CPU的架構設計圍繞四個關鍵特性展開:一是單線程性能必須極致;二是每核帶寬必須極致;三是芯片內外總帶寬必須極致;四是能效必須極致。

與x86 CPU 相比,Vera任務完成速度提高了 1.8 倍,可驅動各行各業的各種工作負載,包括智能體AI、強化學習和數據處理,從而產生更多的數據中心代幣收入。黃仁勛還提到了幾個關鍵數據:芯片內帶寬達3.6TB/s,無三重態損耗,無芯片邊界穿越;首款支持PCIe 6.0;首款搭載LPDDR5X且帶寬達1.2TB/s;88個Olympus內核。

黃仁勛說:“這是很長時間以來首款真正達到極限的CPU。”目前,云服務提供商方面,字節跳動、CoreWeave、Lambda、Nebius、Nscale和Oracle云基礎設施(OCI)都已計劃部署Vera CPU。Vera 系統將于今年秋季開始通過系統構建商和云合作伙伴提供。
黃仁勛指出了一個根本性的趨勢:“過去我們為人類制造了CPU。這是一個新市場的開端,一個前所未有的市場。這不會對舊市場造成沖擊,這是一個新市場——智能體的CPU。這個市場肯定會比上一個更大。其原因在于,Agent的數量將遠遠超過人口數量。”
AI PC芯片RTX Spark,40年來PC的首
次全面革新
本次最重磅的發布,也是最具消費電子屬性的產品——RTX Spark。
黃仁勛的開場白充滿歷史感:“四十年前Windows開啟了PC時代。四十年后,微軟和英偉達將重塑PC。”


過去四十年,PC的工作方式從未改變——用戶啟動應用程序,點擊鼠標,輸入文字。而現在,一個能夠理解你、為你提供幫助的Agent將直接接管你的電腦。你可以和它說話,它可以看著你,你可以讓它幫你重新提交文件,幫你做研究。新的操作系統是舊操作系統加上大型語言模型。在很多方面,這就是現代版的DirectX。它具備輸入輸出能力,理解提示,具備計算機視覺理解能力。

黃仁勛說:“30年來我們所學的一切精華,都凝聚在這一塊芯片中。”
具體看RTX Spark核心規格:6144 個 CUDA 核心;具備 1 petaflop 的 AI 性能;并通過NVLink-C2C芯片間互連技術連接到高性能的 20 核Grace CPU;128GB統一內存;臺積電3nm工藝;700億晶體管。英偉達與聯發科合作開發了定制CPU設計,實現了同類最佳的能效、性能和連接性。
RTX Spark筆記本電腦采用全尺寸高端設計,厚度僅為14毫米,重量僅為3磅,提供14至16英寸多種尺寸選擇。精密加工的鋁合金機身兼具耐用性和簡潔現代的設計感。配備色彩精準的雙OLED顯示屏,并搭載NVIDIA G-SYNC技術,可為創意工作和沉浸式游戲帶來驚艷的視覺體驗。

目前,各大硬件廠商紛紛加入RTX Spark陣營,包括華碩、戴爾、惠普、聯想、微軟Surface和微星在內的領先制造商將在今年秋季推出產品,宏碁和技嘉的機型隨后也將推出。黃仁勛激動地宣布:“這是40年來PC產品系列的首次全面革新。我感到無比榮幸,全球100%的PC行業都已加入我們,共同重塑PC。”

黃仁勛展示了新的路線圖。每一代架構,英偉達都將提供一臺臺式電腦、一臺筆記本電腦和一臺工作站。黃仁勛說:“我們有一個路線圖,這對我們來說是一個全新的產品系列。”
芯片設計進入Agent時代
黃仁勛宣布Cadence和英偉達正合作開發芯片設計Agent。
但這次不只是合作,而是真實的生產系統。Cadence使用NVIDIA OpenShell來保護其ChipStack AI超級代理——這是一個完全自主的AI工程師,能夠執行芯片設計和驗證。而英偉達是首個使用ChipStack自主驗證其芯片設計的客戶。
每塊芯片都始于一系列架構規范,然后翻譯成RTL(芯片設計的語言)。RTL必須在仿真中進行驗證,一個漏洞可能導致芯片延遲數月。在英偉達,數千名工程師每年數十億計算小時、數百萬次測試已編寫、運行并調試,一個周期需要團隊數周時間來壓縮其節奏。

現在,這個流程正在被Agent顛覆。Cadence、Dassault Systèmes、Siemens、Synopsys、Flexcompute、Luminary、Neural Concept、nTop、P-1 AI、PhysicsX和Synera等公司率先利用NVIDIA NemoClaw構建自主AI工程師。通過將這些任務委托給始終在線的自主AI工程師,企業可以將原本需要數周才能完成的工程周期壓縮到數小時。
西門子正在將NVIDIA NemoClaw和OpenShell集成到Fuse EDA AI Agent中,這是一個專門構建的自主代理,用于規劃和協調半導體、3D集成電路和印刷電路板系統設計中的多工具工作流程。Synopsys正在與NVIDIA合作,為芯片設計構建始終在線的自主AI工程師,重點是實現完全的工作流程自主性。
Nematron 3 Ultra:重新定義開放模型
在模型層面,黃仁勛發布了Nematron 3 Ultra,英偉達最新的開放模型系列。
這是一款擁有5500億參數的混合專家模型,可為編碼、研究和企業工作流程中的長時間運行Agent提供前沿智能。與同類開放式前沿模型相比,Ultra的推理速度提升高達5倍,成本降低高達30%,使Agent能夠以更低的成本更快地完成任務。
這是世界上首個基于SSM狀態空間模型與混合專家系統混合架構的模型。這種架構意味著什么?黃仁勛說:“我們快速行動,是為了讓你在快速思考時能夠敏捷思考。同樣的成本,更深入的思考。”
更重要的是,英偉達提供的不只是模型,還有完整訓練數據、訓練腳本、長時間運行工具。這才是真正的開放模型——不只是給你一個黑盒,而是給你整個訓練流程,讓你能夠復現和微調。
Nemotron 3 Ultra經過后訓練,可用于領先的Agent平臺和工具,包括Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands和OpenCode。CrowdStrike正在使用NVIDIA Nemotron模型為其專用Agent持續識別、確定優先級并修復漏洞和策略配置錯誤。Palantir將NVIDIA Nemotron模型集成到其AI FDE(前沿部署工程師)平臺中,以自主執行復雜任務。
黃仁勛宣布完全致力于Nematron 3的生產,并已經在開發Nematron 4。
英特爾、AMD該慌了嗎?
有人說,英偉達現在就是AI時代的“賣鏟人”。只要AI還在發展,就離不開英偉達的芯片。這話對了一半。英偉達確實在賣鏟子,但黃仁勛顯然不滿足于此。他要賣的不只是鏟子,而是整套的礦場——從GPU到CPU,從網絡到存儲,從軟件棧到AI模型。他想把整個AI時代都裝進自己的盒子里。
回顧整個發布會,今天的CPU和RTX Spark將狠狠沖擊PC市場。
Vera CPU這款芯片的定位非常精準,它不是用來替代你臺式機上的x86處理器,而是為AI工廠場景量身打造。英偉達很清楚自己的邊界在哪里:他們不會去搶消費級CPU市場,因為那沒有意義。Vera CPU的價值在于,它是Vera Rubin整個系統里不可或缺的一環。所以黃仁勛其實今天一直在強調,這是“全新的市場”。
再說RTX Spark。這是一個完全不同量級的產品,因為它直接殺進了消費級市場。40年來,PC的核心架構沒有本質變化:x86處理器加Windows操作系統。但RTX Spark 的筆記本電腦改變了這個公式:英偉達RTX Spark加Windows加Agent。英偉達第一次用自家芯片完整定義了PC的架構,而且是從底層到應用層的垂直整合。
這對市場的沖擊不只是“又多了一個芯片選擇”那么簡單。它意味著PC的評判標準被重新定義了。過去你看PC看的是主頻、核心數、內存大小;現在你看的是AI算力、統一內存容量、本地Agent運行能力。
也就是說,是英偉達正在做的事:用自己開發的芯片,替代傳統芯片廠商在PC市場的位置。
這種自我顛覆的可怕之處在于,英偉達在GPU市場已經是絕對王者,他有能力承擔轉型的成本。當他決定進軍CPU市場時,他帶過來的不只是芯片,還有CUDA生態、開發者社區、整套的軟件優化。這是任何新進入者都不具備的優勢。
*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯系后臺。
原文標題 : 爭鋒CPU,角逐PC!黃仁勛臺北炸場,英特爾、AMD該慌了
請輸入評論內容...
請輸入評論/評論長度6~500個字


分享













