爭鋒CPU，角逐PC! 黃仁勛臺北炸場，英特爾、AMD該慌了

2026-06-05 16:11

英偉達發布個人電腦超級芯片RTX Spark，狠狠沖擊PC市場。

剛剛，英偉達GTC Taipei 2026大會上，黃仁勛身穿標志性的皮衣再次登場。

開場第一句就定調：“兩年前我來這里的時候，開始和你談論AI的下一波浪潮。今天我可以告訴你，代理式AI已經到來，實用性AI已經到來（Agentic AI has arrived. That useful AI has arrived.）。”

本次英偉達GTC Taipei 2026大會上，黃仁勛說了六大重點：

第一，Token經濟學，Token現在是盈利的單位。芯片便宜不代表你賺了，芯片貴不代表你虧了

第二，Agent架構五大核心組件：模型（Model）、線束（Harness）、工具（Tools）、技能（Skills）、運行時組件（Runtime）。

第三，Vera Rubin現在正在全面生產中，秋季開始發貨。

第四，發布智能體時代的CPU Vera；與x86 CPU相比，任務完成速度提高了1.8倍。

第五，發布個人電腦超級芯片RTX Spark，黃仁勛表示“30年來我們所學的一切精華，都凝聚在這一塊芯片中。

第六，芯片設計進入Agent時代，和Cadence、西門子、Synopsys等構建自主AI工程師。

Token經濟學：多買多賺

Token如今成了硅谷、中國臺灣、深圳所有科技從業者嘴里最熱的詞。黃仁勛說：“Token現在是盈利的單位。每個Token都是收入。AI公司想建更多Token，建更多AI工廠。”

一個1吉瓦的AI工廠項目，起步價200-300億美元。很快會到600億，800億。每吉瓦一百億美元。全球科技巨頭正在瘋狂建設AI基礎設施，中國臺灣的計算機廠商最近忙得飛起。黃仁勛在現場對著產業鏈說：“你們都如此忙碌，（中國臺灣）企業們做得很好。”這句話背后是整個半導體供應鏈的狂歡。

這就是Token經濟學。傳統IT時代，買服務器是成本，計算是消耗。AI時代，買GPU是投資，計算是收入。黃仁勛直接畫了一條線：芯片便宜不代表你賺了，芯片貴不代表你虧了。選錯架構的代價，從未如此高昂。如果你的AI工廠每瓦吞吐量不夠高，你買得越多虧得越多。如果每瓦吞吐量足夠高，你買得越多賺得越多。

兩年前黃仁勛說下一波是Agent AI。今天他說：“自主性AI已經到來，實用性AI已經到來”。

黃仁勛給出了一組數據：GitHub提交次數從2023年的3億次飆升至2026年的5億次。兩年翻將近兩倍。全球3000萬軟件開發者，用3萬億美元薪資，創造了9萬億美元生產力。

黃仁勛反駁了AI會導致失業的說法：“有人說AI會讓程序員失業。純屬無稽之談。工程師數量在增加。因為每個工程師能創造三倍產出，企業當然想招更多。”AI的價值不在于替代，在于放大。它讓每個開發者、每個企業的產出能力呈指數級增長。當每個軟件工程師能創造三倍價值時，企業沒有理由減少招聘，反而會擴招。這就是黃仁勛看到的未來：生產力革命正在發生，而且這個革命的速度比任何人預期的都快。

Agent架構：五大核心組件

過去四十年，計算機的工作模式從未改變：啟動應用程序，點擊輸入，等待結果。Agent時代完全不一樣。用戶只需要描述意圖，AI自動生成代碼或使用工具，產生必要輸出。

在傳統計算中，軟件是一個二進制包，運行在操作系統內部，受限于操作系統的調度和約束。Agent的計算模式是異構分布的——模型、線束、工具、技能、運行時分布在數據中心的不同位置，由CPU統一協調。

黃仁勛詳細拆解了Agent的五大核心組件：

黃仁勛明確指出："This agent consists of model, harness, tools and skills, and a runtime."

模型（Model）：充當“大腦”，負責理解、觀察、推理、規劃。大型語言模型融合了同步轉換能力，如今已能出色完成思考任務。

線束（Harness）：連接一切的“操作系統”。每次上下文處理時，精確路由信息，理解正在發生的事情，協調各組件協同工作。工作記憶和長期記憶的區分在這里變得至關重要。

工具（Tools）：可以是電子表格、網絡瀏覽器、數據處理引擎、數據庫引擎、C編譯器、Python解釋器、JavaScript引擎，甚至加速計算庫。每當Agent使用工具時，CPU被調用處理這些請求。

技能（Skills）：這是黃仁勛特別強調的突破。技能本質上是工具的使用手冊，AI讀取后說“這就是它的使用方法”。英偉達的所有CUDA X庫現在都將配備AI可學習的技能。Agent使用這些庫的能力將遠超人類程序員。

運行時（Runtime）：協調所有組件的執行環境。安全控制裝置在CPU和DPU安全處理器上運行，對整個過程進行監控。記憶管理是其中最困難的部分——工作記憶類似KV緩存，需要處理壓縮、檢索、結構化和非結構化數據。

Agent的計算是分布式異構的。這帶來巨大的技術挑戰：當計算被分解后，CPU核心之間、CPU與存儲設備之間、CPU與GPU之間的帶寬成為瓶頸。數據在芯片內外流動時，不能有三重態損耗，不能穿越芯片邊界。跨芯片通信延遲必須極低。

Agent的新應用程序與過去應用程序的運行方式有著本質區別。過去應用程序的約束來自操作系統，而Agent的約束來自架構本身——分布式計算的特性決定了它必須在異構環境中高效運行。

正是這個異構計算問題，促使英偉達開發了Vera Rubin。

Vera Rubin全面投產，秋季開始發貨

今天，黃仁勛宣布Vera Rubin 正在加速全面投產，產品將于今年秋季開始發貨。

Vera Rubin是 NVIDIA 迄今為止規模最大的 POD 級平臺——五個專用機架組成一個龐大的 AI 超級計算機，專為代理工作負載而設計。該平臺將Vera Rubin NVL72 系統、 Vera CPU、Groq 3 LPX、 Vera BlueField-4 STX 存儲和 Spectrum-6 SPX 以太網機架整合到一個完全集成的系統中。與上一代 NVIDIA Grace Blackwell 平臺相比，Vera Rubin 的大規模代理吞吐量提高了 10 倍。

黃仁勛說：“Vera Rubin正是為這一時刻而生——它是一個人工智能工廠引擎，能夠大規模地提供智能，并具備推動下一輪工業革命所需的性能、效率和安全性。”

過去組裝一個Grace Blackwell機架需要兩小時，現在只需5分鐘。沒有電纜，沒有軟管，沒有風扇，中間只有一塊PCB連接兩側。黃仁勛展示這段對比時，語氣里藏不住的得意：“上次我給你看這個的時候花了多少時間，我們到處都是電纜。但現在中間有一塊PCB，連接兩側的部分。過去需要兩小時完成的事情，現在只需五分鐘。”

不僅是更高的產能，更是AI工廠部署速度的質變。更重要的是可靠性提升，沒有線纜就沒有線纜故障的風險。黃仁勛說：“Rubin的可靠性和韌性，將會高得離譜。”

頂級系統集成商、基礎設施軟件和存儲合作伙伴正在全面生產Vera Rubin產品，其中包括戴爾科技、HPE、聯想和超微，以及AIC、仁寶、富士康、技嘉、英業達、和碩、廣達云科技（QCT）、緯創資通和Wiwynn等中國臺灣代工巨頭。

Vera Rubin平臺引入了NVIDIA Spectrum-X以太網光子技術，這是世界上首款基于共封裝光器件（CPO）的交換機，具有200Gb/s SerDes，現已投入生產。

同時，Vera Rubin平臺采用全棧式NVIDIA機密計算技術，旨在打造機架級可信執行環境。Vera Rubin NVL72將Vera CPU、Rubin GPU、NVIDIA NVLink網絡和安全功能集成于統一平臺，并通過高速互連加密數據。這提供了硬件級認證，確保系統防篡改。

NVIDIA DSX平臺為Vera Rubin人工智能工廠提供了完整的設計和運營基礎——統一了參考設計、仿真、基礎設施軟件、設施和生態系統技術，以幫助構建和運營節能型人工智能工廠，從而實現最低的Token成本。

黃仁勛專門花時間感謝了微軟、戴爾、CoreWeave，因為它們已經搭建了Vera Rubin的工程機架。這意味著代工伙伴不再只是生產零部件，它們在幫英偉達驗證整個系統。芯片、散熱、網絡、存儲全部打通。這才是真正的一站式交付。

Vera CPU：首款為Agent打造的處理器

本次演講中另一個發布，是英偉達首款專為AI Agent時代打造的處理器：Vera CPU。

黃仁勛提出了一個深刻的問題：過去所有CPU都是為人類設計的，人類使用CPU的方式是在一個以秒計數的世界里生活。人類可以等待，可以點擊關閉彈窗，可以適應各種不便。但Agent不一樣。Agent缺乏耐心。它們并非生活在分秒必爭的世界里，它們生活在一個以納秒為單位的世界里。當Agent使用工具時，希望響應時間盡可能快。當它訪問數據庫時，必須盡快回來。Agent等待的每一刻都會使其無法進入下一步。

這就是為什么需要全新的CPU架構。傳統CPU的設計假設用戶可以容忍一定的延遲，但Agent的要求完全不同。

在Vera Rubin機架中，Vera CPU承擔著三種關鍵職責：第一，編排與管理。Vera CPU用于協調和管理GPU的工具，管理KV緩存，處理機架中運行的所有軟件。在復雜的Agent工作流程中，這些CPU是整個系統的指揮中心。第二，安全與隔離。 通過Vera BlueField，CPU負責安全和隔離功能，確保不同工作負載之間不會相互干擾。第三，線束與入口。Vera CPU用于AI模型的工具使用編排，訪問數據庫。

黃仁勛指出了Vera CPU的架構設計圍繞四個關鍵特性展開：一是單線程性能必須極致；二是每核帶寬必須極致；三是芯片內外總帶寬必須極致；四是能效必須極致。

與x86 CPU 相比，Vera任務完成速度提高了 1.8 倍，可驅動各行各業的各種工作負載，包括智能體AI、強化學習和數據處理，從而產生更多的數據中心代幣收入。黃仁勛還提到了幾個關鍵數據：芯片內帶寬達3.6TB/s，無三重態損耗，無芯片邊界穿越；首款支持PCIe 6.0；首款搭載LPDDR5X且帶寬達1.2TB/s；88個Olympus內核。

黃仁勛說：“這是很長時間以來首款真正達到極限的CPU。”目前，云服務提供商方面，字節跳動、CoreWeave、Lambda、Nebius、Nscale和Oracle云基礎設施（OCI）都已計劃部署Vera CPU。Vera 系統將于今年秋季開始通過系統構建商和云合作伙伴提供。

黃仁勛指出了一個根本性的趨勢：“過去我們為人類制造了CPU。這是一個新市場的開端，一個前所未有的市場。這不會對舊市場造成沖擊，這是一個新市場——智能體的CPU。這個市場肯定會比上一個更大。其原因在于，Agent的數量將遠遠超過人口數量。”

AI PC芯片RTX Spark，40年來PC的首

次全面革新

本次最重磅的發布，也是最具消費電子屬性的產品——RTX Spark。

黃仁勛的開場白充滿歷史感：“四十年前Windows開啟了PC時代。四十年后，微軟和英偉達將重塑PC。”

過去四十年，PC的工作方式從未改變——用戶啟動應用程序，點擊鼠標，輸入文字。而現在，一個能夠理解你、為你提供幫助的Agent將直接接管你的電腦。你可以和它說話，它可以看著你，你可以讓它幫你重新提交文件，幫你做研究。新的操作系統是舊操作系統加上大型語言模型。在很多方面，這就是現代版的DirectX。它具備輸入輸出能力，理解提示，具備計算機視覺理解能力。

黃仁勛說：“30年來我們所學的一切精華，都凝聚在這一塊芯片中。”

具體看RTX Spark核心規格：6144 個 CUDA 核心；具備 1 petaflop 的 AI 性能；并通過NVLink-C2C芯片間互連技術連接到高性能的 20 核Grace CPU；128GB統一內存；臺積電3nm工藝；700億晶體管。英偉達與聯發科合作開發了定制CPU設計，實現了同類最佳的能效、性能和連接性。

RTX Spark筆記本電腦采用全尺寸高端設計，厚度僅為14毫米，重量僅為3磅，提供14至16英寸多種尺寸選擇。精密加工的鋁合金機身兼具耐用性和簡潔現代的設計感。配備色彩精準的雙OLED顯示屏，并搭載NVIDIA G-SYNC技術，可為創意工作和沉浸式游戲帶來驚艷的視覺體驗。

目前，各大硬件廠商紛紛加入RTX Spark陣營，包括華碩、戴爾、惠普、聯想、微軟Surface和微星在內的領先制造商將在今年秋季推出產品，宏碁和技嘉的機型隨后也將推出。黃仁勛激動地宣布：“這是40年來PC產品系列的首次全面革新。我感到無比榮幸，全球100%的PC行業都已加入我們，共同重塑PC。”

黃仁勛展示了新的路線圖。每一代架構，英偉達都將提供一臺臺式電腦、一臺筆記本電腦和一臺工作站。黃仁勛說：“我們有一個路線圖，這對我們來說是一個全新的產品系列。”

芯片設計進入Agent時代

黃仁勛宣布Cadence和英偉達正合作開發芯片設計Agent。

但這次不只是合作，而是真實的生產系統。Cadence使用NVIDIA OpenShell來保護其ChipStack AI超級代理——這是一個完全自主的AI工程師，能夠執行芯片設計和驗證。而英偉達是首個使用ChipStack自主驗證其芯片設計的客戶。

每塊芯片都始于一系列架構規范，然后翻譯成RTL（芯片設計的語言）。RTL必須在仿真中進行驗證，一個漏洞可能導致芯片延遲數月。在英偉達，數千名工程師每年數十億計算小時、數百萬次測試已編寫、運行并調試，一個周期需要團隊數周時間來壓縮其節奏。

現在，這個流程正在被Agent顛覆。Cadence、Dassault Systèmes、Siemens、Synopsys、Flexcompute、Luminary、Neural Concept、nTop、P-1 AI、PhysicsX和Synera等公司率先利用NVIDIA NemoClaw構建自主AI工程師。通過將這些任務委托給始終在線的自主AI工程師，企業可以將原本需要數周才能完成的工程周期壓縮到數小時。

西門子正在將NVIDIA NemoClaw和OpenShell集成到Fuse EDA AI Agent中，這是一個專門構建的自主代理，用于規劃和協調半導體、3D集成電路和印刷電路板系統設計中的多工具工作流程。Synopsys正在與NVIDIA合作，為芯片設計構建始終在線的自主AI工程師，重點是實現完全的工作流程自主性。

Nematron 3 Ultra：重新定義開放模型

在模型層面，黃仁勛發布了Nematron 3 Ultra，英偉達最新的開放模型系列。

這是一款擁有5500億參數的混合專家模型，可為編碼、研究和企業工作流程中的長時間運行Agent提供前沿智能。與同類開放式前沿模型相比，Ultra的推理速度提升高達5倍，成本降低高達30%，使Agent能夠以更低的成本更快地完成任務。

這是世界上首個基于SSM狀態空間模型與混合專家系統混合架構的模型。這種架構意味著什么？黃仁勛說：“我們快速行動，是為了讓你在快速思考時能夠敏捷思考。同樣的成本，更深入的思考。”

更重要的是，英偉達提供的不只是模型，還有完整訓練數據、訓練腳本、長時間運行工具。這才是真正的開放模型——不只是給你一個黑盒，而是給你整個訓練流程，讓你能夠復現和微調。

Nemotron 3 Ultra經過后訓練，可用于領先的Agent平臺和工具，包括Hermes Agent、LangChain Deep Agents、OpenClaw、OpenHands和OpenCode。CrowdStrike正在使用NVIDIA Nemotron模型為其專用Agent持續識別、確定優先級并修復漏洞和策略配置錯誤。Palantir將NVIDIA Nemotron模型集成到其AI FDE（前沿部署工程師）平臺中，以自主執行復雜任務。

黃仁勛宣布完全致力于Nematron 3的生產，并已經在開發Nematron 4。

英特爾、AMD該慌了嗎？

有人說，英偉達現在就是AI時代的“賣鏟人”。只要AI還在發展，就離不開英偉達的芯片。這話對了一半。英偉達確實在賣鏟子，但黃仁勛顯然不滿足于此。他要賣的不只是鏟子，而是整套的礦場——從GPU到CPU，從網絡到存儲，從軟件棧到AI模型。他想把整個AI時代都裝進自己的盒子里。

回顧整個發布會，今天的CPU和RTX Spark將狠狠沖擊PC市場。

Vera CPU這款芯片的定位非常精準，它不是用來替代你臺式機上的x86處理器，而是為AI工廠場景量身打造。英偉達很清楚自己的邊界在哪里：他們不會去搶消費級CPU市場，因為那沒有意義。Vera CPU的價值在于，它是Vera Rubin整個系統里不可或缺的一環。所以黃仁勛其實今天一直在強調，這是“全新的市場”。

再說RTX Spark。這是一個完全不同量級的產品，因為它直接殺進了消費級市場。40年來，PC的核心架構沒有本質變化：x86處理器加Windows操作系統。但RTX Spark 的筆記本電腦改變了這個公式：英偉達RTX Spark加Windows加Agent。英偉達第一次用自家芯片完整定義了PC的架構，而且是從底層到應用層的垂直整合。

這對市場的沖擊不只是“又多了一個芯片選擇”那么簡單。它意味著PC的評判標準被重新定義了。過去你看PC看的是主頻、核心數、內存大小；現在你看的是AI算力、統一內存容量、本地Agent運行能力。

也就是說，是英偉達正在做的事：用自己開發的芯片，替代傳統芯片廠商在PC市場的位置。

這種自我顛覆的可怕之處在于，英偉達在GPU市場已經是絕對王者，他有能力承擔轉型的成本。當他決定進軍CPU市場時，他帶過來的不只是芯片，還有CUDA生態、開發者社區、整套的軟件優化。這是任何新進入者都不具備的優勢。

*聲明：本文系原作者創作。文章內容系其個人觀點，我方轉載僅為分享與討論，不代表我方贊成或認同，如有異議，請聯系后臺。

原文標題 : 爭鋒CPU，角逐PC！黃仁勛臺北炸場，英特爾、AMD該慌了