最新一篇博客背后，黃仁勛的深度思考

2026-03-13 14:17

硅基星芒

關(guān)注

3月10日，英偉達(dá)創(chuàng)始人黃仁勛罕見地發(fā)布了一篇博客，并提出了一個(gè)根本性的范式轉(zhuǎn)換：

AI不再是預(yù)先編寫的軟件，而是實(shí)時(shí)生成的智能。

人工智能也并非單一的模型或應(yīng)用程序，而是如同電力和互聯(lián)網(wǎng)一樣必不可少的基礎(chǔ)設(shè)施。

這一論斷看似超前，但背后卻有一套清晰的架構(gòu)邏輯支撐：

能源→芯片→基礎(chǔ)設(shè)施→模型→應(yīng)用

自下而上遞進(jìn)，上層需求拉動(dòng)下層投入，形成動(dòng)態(tài)傳導(dǎo)的技術(shù)棧。這并非簡(jiǎn)單的分層，而是物理約束逐級(jí)向上傳導(dǎo)的鏈條。

近幾年來，智能已經(jīng)從預(yù)存指令的檢索發(fā)展到實(shí)時(shí)生成的推理，而整個(gè)計(jì)算范式也正在悄無聲息地發(fā)生根本性重構(gòu)。

范式轉(zhuǎn)換：從預(yù)制的軟件到實(shí)時(shí)的智能

氛圍編程（Vibe Coding）概念興起之前，在那些經(jīng)歷過傳統(tǒng)計(jì)算時(shí)代的老一代程序員們眼中，軟件必須依賴于人類預(yù)設(shè)的算法，數(shù)據(jù)必須經(jīng)過結(jié)構(gòu)化處理才能被檢索。

但短短幾年，AI就輕松打破了這個(gè)流傳了幾十年的經(jīng)典模式：

計(jì)算機(jī)已經(jīng)能夠理解圖像、文本、聲音等非結(jié)構(gòu)化信息，并根據(jù)上下文實(shí)時(shí)生成回應(yīng)。

在黃仁勛看來，AI的每次推理都是一次全新的創(chuàng)造實(shí)踐，因此支撐智能生成的底層AI架構(gòu)也必須重新設(shè)計(jì)。

在他設(shè)想的五層架構(gòu)中，能源被置于最底層，而且不存在“抽象層”。

Transformer架構(gòu)中，注意力機(jī)制下生成的每一個(gè)token，本質(zhì)上都是電子流動(dòng)、熱量管理和能量轉(zhuǎn)化為計(jì)算的結(jié)果。

能源不僅是成本，還是物理層面上智能生產(chǎn)規(guī)模的上限。

自此之上，芯片決定算力轉(zhuǎn)化的效率，基礎(chǔ)設(shè)施成為芯片集群的工廠，模型理解多領(lǐng)域的知識(shí)，而應(yīng)用最后承載商業(yè)價(jià)值。

在這個(gè)架構(gòu)上運(yùn)行的鏈條，任何一層存在瓶頸都會(huì)極大程度上制約智能生成的整體規(guī)模。

對(duì)于英偉達(dá)和同在美國(guó)的Google、OpenAI等龍頭企業(yè)來說，芯片、基礎(chǔ)設(shè)施和模型三個(gè)層級(jí)基本已經(jīng)打通，毫無疑問處于世界領(lǐng)先水平，但底層的能源仍是最大的限制。

不惜成本建設(shè)數(shù)據(jù)中心以及積極探索太空算力等舉措足以證明底層能源的限制對(duì)上層應(yīng)用的商業(yè)路徑產(chǎn)生極大阻礙。

如果將這一框架置于國(guó)內(nèi)產(chǎn)業(yè)環(huán)境之中，約束與機(jī)會(huì)同樣并存。

在能源供給方面，中國(guó)在電力基礎(chǔ)設(shè)施上具備絕對(duì)優(yōu)勢(shì)，但芯片和高帶寬內(nèi)存（HBM）等環(huán)節(jié)明顯受制于國(guó)際供應(yīng)鏈，目前國(guó)產(chǎn)算力在訓(xùn)練階段的集群性能和生態(tài)適配上都存在顯著差距，且差距有增加的趨勢(shì)。

但需要注意的是，推理階段的需求已經(jīng)呈現(xiàn)出差異化。通過模型量化、混合專家架構(gòu)等優(yōu)化手段，中端芯片亦可支持多數(shù)應(yīng)用場(chǎng)景，而這正是讓黃仁勛贊不絕口的DeepSeek最擅長(zhǎng)的領(lǐng)域。

但現(xiàn)階段，要在基礎(chǔ)模型能力上追逐國(guó)際頂尖水平仍顯得不切實(shí)際。但結(jié)合此前的判斷：智能體爆發(fā)加上AI能力溢出讓模型之間的差距被壓縮，國(guó)產(chǎn)模型和國(guó)際頂尖模型之間的體驗(yàn)差距已經(jīng)小于參數(shù)差距。

應(yīng)用層若是能精準(zhǔn)定位“夠用就好”的需求區(qū)間，國(guó)產(chǎn)模型憑借極致的性價(jià)比就必然存在局部突圍的可能性。

戰(zhàn)略轉(zhuǎn)向：從硬件綁定到生態(tài)連接

面對(duì)一只龍蝦引起的應(yīng)用層爆發(fā)，英偉達(dá)的策略也發(fā)生了微妙的變化。

根據(jù)Wired報(bào)道，英偉達(dá)也正在走國(guó)內(nèi)AI企業(yè)的養(yǎng)蝦之路，計(jì)劃推出開源AI代理平臺(tái)NemoClaw。

但不同之處在于，國(guó)內(nèi)AI企業(yè)幾乎將幾個(gè)月前手機(jī)助手問世時(shí)的場(chǎng)面原封不動(dòng)又復(fù)刻了一遍：開源項(xiàng)目誕生后，各家接連推出自己的類似功能產(chǎn)品，然后關(guān)閉生態(tài)，各自傾銷自己的滯銷token。

而英偉達(dá)選擇了開源，且無論企業(yè)是否使用英偉達(dá)芯片都可以接入平臺(tái)，同時(shí)提供了安全與隱私工具以應(yīng)對(duì)企業(yè)級(jí)部署的可靠性挑戰(zhàn)。

它沒有做第一批養(yǎng)蝦的企業(yè)，卻從軟件和硬件層面上提供了最適合養(yǎng)蝦的“水缸”。

與此同時(shí)，英偉達(dá)也發(fā)現(xiàn)，如果它在人們心中的印象還是那個(gè)GPU企業(yè)，那就不可能在大模型和智能體領(lǐng)域內(nèi)占據(jù)如今硬件領(lǐng)域的地位。

因此，這一舉措取消了此前的平臺(tái)大多要求企業(yè)使用自家芯片的限制。不過，這并非放棄了硬件層面上的底層優(yōu)勢(shì)，而是通過降低參與門檻，把自身的角色升級(jí)成了“代理生態(tài)的基礎(chǔ)設(shè)施提供方”，試圖成為代理任務(wù)的默認(rèn)運(yùn)行環(huán)境。

在這篇博客中，雖然沒有明說，但黃仁勛想要表達(dá)的意思很明確：

當(dāng)代理任務(wù)成為連接應(yīng)用和底層算力的核心時(shí)，誰能定義調(diào)度規(guī)則，誰就能在五層架構(gòu)的傳導(dǎo)鏈條中占據(jù)上游的議價(jià)權(quán)。

而這里的調(diào)度規(guī)則，至少會(huì)包含以下三個(gè)維度：

一是模型路由：誰能定義路由算法，誰就能決定流量流向哪個(gè)模型廠商；

二是工具與工作流編排：誰定義工具調(diào)用的API和執(zhí)行順序，誰就能決定企業(yè)軟件被AI調(diào)用的方式；

三是算力映射：誰定義任務(wù)對(duì)算力的需求特征，誰就能決定底層芯片的設(shè)計(jì)方向。

與其被動(dòng)響應(yīng)需求，不如主動(dòng)定義需求。

同期的另一項(xiàng)計(jì)劃也顯示出英偉達(dá)轉(zhuǎn)型的決心：

英偉達(dá)預(yù)計(jì)在未來五年內(nèi)投入260億美元開發(fā)一款開放權(quán)重的模型。

所謂開放權(quán)重，就是公開模型的參數(shù)，但保留許可限制，既能滿足企業(yè)對(duì)透明度與定制化的需求，又能憑借最擅長(zhǎng)的軟硬件協(xié)同優(yōu)化能力維持技術(shù)主導(dǎo)權(quán)。

根據(jù)英偉達(dá)高管透露的信息，該模型的研發(fā)除了提供AI能力以外，更重要的目的是對(duì)存儲(chǔ)、網(wǎng)絡(luò)和數(shù)據(jù)中心進(jìn)行一次極限壓力測(cè)試，以此定義下一代硬件架構(gòu)。

據(jù)稱，國(guó)產(chǎn)模型DeepSeek-V4可能完全由華為昇騰系列芯片訓(xùn)練，此后國(guó)產(chǎn)算力可能在國(guó)產(chǎn)模型的訓(xùn)練中所占比重逐步上升；而英偉達(dá)的首款模型預(yù)計(jì)在2026年底或2027年初問世。據(jù)此推算，這一時(shí)間窗口會(huì)與全球算力格局演變的關(guān)鍵周期高度重疊。

應(yīng)用挑戰(zhàn)：從“能執(zhí)行”到“可信執(zhí)行”

當(dāng)黃仁勛口中的“智能”自上而下扎根于物理設(shè)施的同時(shí)，自下而上也在面臨著應(yīng)用層的可靠性挑戰(zhàn)。

NemoClaw平臺(tái)明確指向企業(yè)級(jí)市場(chǎng)的底氣，正是著重強(qiáng)調(diào)的安全與隱私工具。

英偉達(dá)的動(dòng)向，恰好回應(yīng)了當(dāng)前代理技術(shù)最核心的矛盾：模型能力的提升無法直接轉(zhuǎn)化為生產(chǎn)環(huán)境的可靠性。

在實(shí)際的生產(chǎn)環(huán)境中，規(guī)模化運(yùn)營(yíng)的公司絕不會(huì)輕易使用OpenClaw這種高風(fēng)險(xiǎn)的產(chǎn)品。

一周之前，DeepLearning.AI創(chuàng)始人吳恩達(dá)博士在一次訪談中也明確指出：高風(fēng)險(xiǎn)企業(yè)應(yīng)用中，完全自主的模型與生產(chǎn)級(jí)可靠性之間仍有巨大缺口。

無論是此前的大語言模型、如今的智能體還是未來的通用人工智能（AGI），人們對(duì)AI的核心需求其實(shí)從未改變：自動(dòng)化執(zhí)行任務(wù)。

這就意味著，AI產(chǎn)品的設(shè)計(jì)理念中必須包含智能自主決策。智能化和自主化程度越高，離人們的目標(biāo)就越近。

但在實(shí)際業(yè)務(wù)場(chǎng)景中，容錯(cuò)率低的嚇人，系統(tǒng)需要經(jīng)過成千上萬次運(yùn)行后依然保持穩(wěn)定，這需要精細(xì)的工作流設(shè)計(jì)和分布驗(yàn)證，而不僅僅依賴模型的“智商”。

英偉達(dá)在平臺(tái)中引入安全審計(jì)和權(quán)限管控等相關(guān)機(jī)制，是目前國(guó)內(nèi)外各種“Claw產(chǎn)品”最欠缺的部分。

代理工具的價(jià)值早已不是“能否執(zhí)行”，而是如何“可控執(zhí)行”。

Perplexity近期提出的“Everything is Computer”就是這一命題最好的實(shí)證參考。

其企業(yè)級(jí)方案在金融研究場(chǎng)景中實(shí)現(xiàn)了“16000次查詢節(jié)省160萬美元人力成本”效果的同時(shí)，也設(shè)計(jì)了敏感操作審批、完整審計(jì)軌跡、緊急中止開關(guān)等安全機(jī)制，回應(yīng)了企業(yè)對(duì)于代理工具不可預(yù)測(cè)性的擔(dān)憂。

事實(shí)證明，基礎(chǔ)模型在達(dá)到一定閾值后，決定用戶體驗(yàn)的就不再是參數(shù)規(guī)模，而是產(chǎn)品如何管理風(fēng)險(xiǎn)、嵌入流程并驗(yàn)證結(jié)果。

結(jié)語：早期階段的選擇

英偉達(dá)的一系列動(dòng)作，把一個(gè)根本的問題擺在了國(guó)產(chǎn)AI企業(yè)的眼前：

當(dāng)基礎(chǔ)設(shè)施的定義權(quán)已經(jīng)集中于全棧廠商，后來者還有什么機(jī)會(huì)？

吳恩達(dá)提出的觀點(diǎn)或許是這個(gè)問題的最好回答：

垂直領(lǐng)域AI服務(wù)于特定行業(yè)的能力，其增長(zhǎng)速度將遠(yuǎn)超對(duì)AGI的期待。

在訓(xùn)練算力受限、推理算力有替代方案的情況下，放棄高精尖領(lǐng)域，聚焦高頻剛需場(chǎng)景反而容易在體驗(yàn)層面上實(shí)現(xiàn)反超。

就像黃仁勛在博客結(jié)尾所說，人類仍處于AI基礎(chǔ)設(shè)施建設(shè)的早期階段，大語言模型和智能體都不會(huì)是AI發(fā)展的最終形態(tài)，大量機(jī)遇尚未發(fā)掘。

對(duì)于全球絕大部分開發(fā)者而言，復(fù)制全棧巨頭的路徑絕非明智之舉，只會(huì)像OpenClaw一樣營(yíng)造出大量偽需求。

真正的機(jī)會(huì)，是在約束條件下探索更貼合本土場(chǎng)景的智能系統(tǒng)。

當(dāng)應(yīng)用層開始反向定義技術(shù)棧，AI能力溢出就變成了戰(zhàn)略機(jī)會(huì)。

國(guó)產(chǎn)模型在智能體時(shí)代已經(jīng)與國(guó)際頂尖模型縮小了參數(shù)上的差距，后續(xù)發(fā)展的關(guān)鍵就在于產(chǎn)品如何跨越“能用”和“好用”之間的臨界點(diǎn)。