訂閱
糾錯
加入自媒體

賣鏟人的新戰事:黃仁勛眼中萬億美元的AI“Token工廠”

2026-03-18 11:40
賽博汽車
關注

作者 | 王凌方

編輯 | 章漣漪

在GTC 2026舞臺上,英偉達CEO黃仁勛這次講演的重點不再是芯片,而是向全世界展示了一張圖——一張關于“工廠”的藍圖。

這座工廠不生產鋼鐵,不組裝汽車,它的產品是一種看不見摸不著的東西:Token。黃仁勛告訴在場所有人,到2027年,全球對這座工廠產出的需求,將至少達到1萬億美元。“我確定,實際的計算需求會比這高得多。”

這是對2026財年四季報電話會他透露的增長路徑的具體回應,他用兩個小時拆解了這個需求。

至此,英偉達正式從一家“芯片公司”轉型為“AI基礎設施和工廠公司”。

當然,芯片依然要升級,黃仁勛也在講演中,劇透了下一代架構——Feynman,采用臺積1.6nm制程,引入光通信技術,相比現有架構,將實現算力的大幅提升和能耗的顯著降低,這是支撐百萬倍算力需求的硬件核心。

01

英偉達的身份躍遷

“去年這個時候,我說過,我們看到了5000億美元的高確信度需求,F在,就在此時此地,我看到到2027年至少有1萬億美元的需求。”黃仁勛在演講時這樣說道。

不過,這次敘事邏輯變了,不是賣了多少GPU。他講的是如何建造低成本“Token工廠”。

“每一座數據中心、每一座工廠,從定義上來說都是受電力限制的。一座1GW的工廠永遠不會變成2GW,這是物理和原子的定律。”黃仁勛說,“在固定的功率下,誰的每瓦Token吞吐量最高,誰的生產成本就最低。”

這是一個徹底的思維轉變:數據中心不再是存放文件的倉庫,而是生產Token的工廠。英偉達不再只是提供“生產設備”的供應商,而是整座工廠的設計者、建設者和運維標準的制定者。

Vera Rubin系統的發布正是這一改變的體現。“過去提到Hopper,我會舉起一塊芯片,那很可愛。但提到Vera Rubin,大家想到的是整個系統。”黃仁勛說。

這個100%液冷、徹底消滅傳統線纜的系統,將機架安裝時間從兩天縮短到兩小時。更關鍵的是,1吉瓦AI工廠的token生成速率將從200萬token/秒提升至7億token/秒,提升了350倍。作為對比,摩爾定律在同期的提升幅度,只有約1.5倍。

這不是“賣芯片”的邏輯,這是“賣整廠”的邏輯。

02

Token成為新石油

支撐這1萬億美元預期的,是黃仁勛提出的“Token工廠經濟學”。

他將未來的AI服務劃分為五個商業層級:免費層(高吞吐、低速度)、中級層(約每百萬token3美元)、高級層(約每百萬token6美元)、高速層(約每百萬token45美元)、超高速層(約每百萬token150美元)。

“在這個Token工廠里,你的吞吐量和Token生成速度,將直接轉化為你明年的精確收入。”黃仁勛這樣說道。

這是一套將算力轉化為可定價商品的完整邏輯。Token成為像石油、電力一樣的“大宗商品”,而英偉達的架構,決定了客戶能以多低的成本生產這種商品。

以簡化模型估算,將25%占有率平均分配給四個層級,Grace Blackwell可比Hopper多產生5倍的收入。在最高價值的推理層級,性能提升達到驚人的35倍。

這正是黃仁勛所說的“成本最低的基礎設施”的真正含義。由于英偉達能運行幾乎所有領域的AI模型,這種通用性使得客戶投入的“基建”能夠被充分利用,并保持長久的生命周期。

目前,英偉達60%的業務來自全球前五大超大規模云服務商,剩余40%遍布區域云、主權云、企業、工業、機器人、邊緣計算等各個領域。“AI的覆蓋廣度本身就是其韌性所在,”黃仁勛說,“這毫無疑問是一次全新的計算平臺變革。”

03

硬件、軟件與生態的協同

英偉達的“鏟子”不是單一產品,而是一個硬件、軟件和生態,三位一體的體系,更難取代。

硬件方面,Vera Rubin是一個完整的、端到端優化的系統,專為智能體(Agentic)工作負載設計。

全新Vera CPU是專為極高單線程性能設計,采用LPDDR5內存,兼具卓越能效,是全球唯一使用LPDDR5的數據中心CPU,適合AI智能體工具調用。

存儲系統方面,BlueField 4+CX 9,面向AI時代的全新存儲平臺,全球存儲行業100%加入。

CPO Spectrum X交換機是全球首款共封裝光學以太網交換機,已全面量產。

Kyber機架是全新機架系統,支持144塊GPU組成單一NVLink域,前端計算、后端NVLink交換,形成一臺巨型計算機。

Rubin Ultra作為下一代超算節點,豎插式設計,配合Kyber機架,支持更大規模NVLink互聯。

但更值得關注的,是英偉達對Groq的整合。

Groq芯片擁有500MB的SRAM,而一顆Rubin芯片擁有288GB的內存。兩者特性截然不同。英偉達通過Dynamo軟件系統,將需要海量計算和顯存的“預填充”階段交給Vera Rubin,將對延遲極度敏感的“解碼”階段交給Groq。

“如果你的工作主要是高吞吐,100%使用Vera Rubin;如果你有大量高價值的編程級別的Token生成需求,拿出25%的數據中心規模給Groq。”黃仁勛給出了這樣的配置建議。

據透露,由三星代工的Groq LP30芯片已在量產,預計今年第三季度出貨,而首個Vera Rubin機架已在微軟Azure云上運行。

軟件方面,二十年磨一劍的CUDA護城河。

“今年是CUDA誕生二十周年。”黃仁勛在演講中特別強調。

歷經二十年,全球已積累數億塊運行CUDA的GPU和計算系統,覆蓋所有云平臺,服務于幾乎所有計算機廠商和行業。

“裝機量吸引開發者,開發者創造新算法并取得突破,突破催生全新市場,新市場形成新生態并吸引更多企業加入,進而擴大裝機量——這個飛輪正在持續加速。”

這個飛輪帶來的直接結果是,英偉達GPU的實際使用價值極高。黃仁勛舉了一個反常識的例子:六年前發布的Ampere架構GPU,其云端價格反而在上漲。

“原因顯而易見:NVIDIA CUDA上可運行的應用極為豐富,涵蓋AI生命周期的每個階段、各類數據處理平臺,以及各種科學原理求解器。因此,一旦安裝了英偉達GPU,其使用價值極高。”

在結構化數據處理方面,英偉達推出了cuDF和cuVS兩個基礎庫,與IBM、Dell、GoogleCloud達成合作,幫助Snapchat將計算成本降低近80%。在非結構化數據方面,向量數據庫、PDF、視頻、音頻的處理能力,讓過去無法被利用的數據現在成為AI的養料。

生態方面,與云廠商的深度捆綁。

“英偉達與全球云服務商建立了特殊的合作關系——我們將客戶引入云端,這是一種互利共贏的生態。”

在GoogleCloud,英偉達加速VertexAI和BigQuery,與JAX/XLA深度集成,將Base10、CrowdStrike、Puma、Salesforce等客戶引入生態。

在AWS,英偉達加速EMR、SageMaker和Bedrock,今年更將把OpenAI引入AWS,幫助其擴展區域部署和計算規模。

在Microsoft Azure,英偉達100PFLOPS超算是第一臺部署在Azure上的超算,奠定了與OpenAI合作的重要基礎。英偉達GPU還是全球首批支持保密計算的GPU,可支持OpenAI和Anthropic模型在全球各地區云環境中的保密部署。

在Oracle,英偉達是第一個AI客戶。“我為能夠第一次向Oracle解釋AI云的概念感到自豪。”黃仁勛說。

此外,Core Weave成為全球第一家AI原生云,Palantir與Dell聯合打造了可在任何國家、任何氣隙隔離環境下完全本地化部署的AI平臺。

“英偉達是全球第一家垂直整合、橫向開放的公司。”黃仁勛這樣定義自己的戰略,“我們必須理解應用,理解領域,深刻理解算法,并能夠將其部署在任何場景下——數據中心、云端、本地、邊緣乃至機器人系統。同時,英偉達保持橫向開放,愿意將技術整合進任何合作伙伴的平臺。”

04

重構企業IT與職場規則

黃仁勛將開源項目OpenClaw形容為“人類歷史上最受歡迎的開源項目”,稱其僅用幾周時間就超越了Linux在過去30年取得的成就。他直言:“OpenClaw本質上就是智能體計算機的操作系統。”

OpenClaw能夠管理資源,訪問工具、文件系統和大型語言模型,執行調度和定時任務,將問題逐步分解并調用子智能體,支持任意模態的輸入輸出。

“Windows讓個人計算機成為可能,OpenClaw讓個人智能體成為可能。”黃仁勛說,“每一家企業都需要制定自己的OpenClaw戰略,正如我們都需要Linux策略、HTML策略、Kubernetes策略一樣。”

這帶來的是一場企業IT的全面重塑。黃仁勛斷言:“每一個SaaS公司都將變成AaaS(智能體即服務)公司。”

但智能體能夠訪問敏感數據、執行代碼、與外部通信,這帶來了全新的安全挑戰。為此,英偉達與Peter合作,將安全性融入企業級版本,推出NeMoClaw參考設計和OpenShield安全層。

“這是企業IT的文藝復興,”黃仁勛說,“一個原本2萬億美元規模的產業,即將成長為數萬億美元規模,從提供工具轉向提供專業化的AI智能體服務。”

他甚至描繪了未來職場的新形態:“在未來,我們公司的每一位工程師都需要一個年度Token預算。他們的基礎年薪可能是幾十萬美元,我會在此基礎上再拿出大約一半的金額作為Token額度給他們,讓他們實現10倍效率提升。這已經是硅谷的新招聘籌碼了:你的offer里帶多少Token?”

未來的軟件,不再是 “人操作工具”,而是 “智能代理與人協作”,而英偉達的技術,就是為這種全新的軟件形態打造的核心支撐。

05

未來戰場:物理AI與機器人、太空數據中心

數字智能體在數字世界中行動,而物理AI則是具身化的智能體——機器人。

本次GTC共有110款機器人亮相,幾乎囊括全球所有機器人研發企業。

自動駕駛方面,黃仁勛宣布四家新合作伙伴加入英偉達Robotaxi Ready平臺:比亞迪、現代、日產、吉利,合計年產量1800萬輛。加上此前的奔馳、豐田、通用,陣容進一步壯大。同時與Uber達成重大合作,將在多個城市部署并接入RoboTaxi Ready車輛。

工業機器人方面,ABB、UniversalRobotics、KUKA等企業與英偉達合作,將物理AI模型與仿真系統相結合。

電信領域,卡特彼勒和T-Mobile也在合作之列。未來無線基站將不再是通信節點,而是NVIDIAAerialAIRAN——能夠實時感知流量、調整波束成形,實現節能增效的智能化邊緣計算平臺。

特別引人注目的是與Disney合作的Olaf機器人亮相。這個在Omniverse中學會走路的雪人,基于NVIDIAWarp運行的Newton求解器(與Disney和DeepMind聯合開發),能夠適應真實的物理世界。

“你能想象嗎?未來的迪士尼樂園——所有這些機器人角色在園區里自由漫步。”黃仁勛說。

而更令人遐想的是,英偉達正在進軍太空。Thor芯片已通過輻射認證,正在衛星中運行。此外,英偉達正在研發部署在太空的數據中心計算機“Vera Rubin Space-1”,徹底打開了AI算力向地球之外延伸的想象空間。

回望19世紀的淘金熱,賣鏟人賺到了最多的錢。但今天的英偉達,遠不止是賣鏟人。

它通過一系列技術革新和生態建設,讓全世界相信:挖金子必須用它的鏟子。

在黃仁勛的敘事里,未來的每一家企業——無論是做模型的、做Agent的、造機器人的、開數據中心的——都將成為英偉達“Token工廠”體系中的一個車間。而黃仁勛,站在這個萬億工廠的總控室里,靜靜看著每一度電、每一枚Token,最終變成它的財報數字。

-END-

       原文標題 : 賣鏟人的新戰事:黃仁勛眼中萬億美元的AI“Token工廠”

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號