訂閱
糾錯
加入自媒體

最新一篇博客背后,黃仁勛的深度思考

2026-03-13 14:17
硅基星芒
關注

3月10日,英偉達創始人黃仁勛罕見地發布了一篇博客,并提出了一個根本性的范式轉換:

AI不再是預先編寫的軟件,而是實時生成的智能。

人工智能也并非單一的模型或應用程序,而是如同電力和互聯網一樣必不可少的基礎設施。

這一論斷看似超前,但背后卻有一套清晰的架構邏輯支撐:

能源→芯片→基礎設施→模型→應用

自下而上遞進,上層需求拉動下層投入,形成動態傳導的技術棧。這并非簡單的分層,而是物理約束逐級向上傳導的鏈條。

近幾年來,智能已經從預存指令的檢索發展到實時生成的推理,而整個計算范式也正在悄無聲息地發生根本性重構。

01 

范式轉換:從預制的軟件到實時的智能

氛圍編程(Vibe Coding)概念興起之前,在那些經歷過傳統計算時代的老一代程序員們眼中,軟件必須依賴于人類預設的算法,數據必須經過結構化處理才能被檢索。

但短短幾年,AI就輕松打破了這個流傳了幾十年的經典模式:

計算機已經能夠理解圖像、文本、聲音等非結構化信息,并根據上下文實時生成回應。

在黃仁勛看來,AI的每次推理都是一次全新的創造實踐,因此支撐智能生成的底層AI架構也必須重新設計。

在他設想的五層架構中,能源被置于最底層,而且不存在“抽象層”。

Transformer架構中,注意力機制下生成的每一個token,本質上都是電子流動、熱量管理和能量轉化為計算的結果。

能源不僅是成本,還是物理層面上智能生產規模的上限。

自此之上,芯片決定算力轉化的效率,基礎設施成為芯片集群的工廠,模型理解多領域的知識,而應用最后承載商業價值。

在這個架構上運行的鏈條,任何一層存在瓶頸都會極大程度上制約智能生成的整體規模。

對于英偉達和同在美國的Google、OpenAI等龍頭企業來說,芯片、基礎設施和模型三個層級基本已經打通,毫無疑問處于世界領先水平,但底層的能源仍是最大的限制。

不惜成本建設數據中心以及積極探索太空算力等舉措足以證明底層能源的限制對上層應用的商業路徑產生極大阻礙。

如果將這一框架置于國內產業環境之中,約束與機會同樣并存。

在能源供給方面,中國在電力基礎設施上具備絕對優勢,但芯片和高帶寬內存(HBM)等環節明顯受制于國際供應鏈,目前國產算力在訓練階段的集群性能和生態適配上都存在顯著差距,且差距有增加的趨勢。

但需要注意的是,推理階段的需求已經呈現出差異化。通過模型量化、混合專家架構等優化手段,中端芯片亦可支持多數應用場景,而這正是讓黃仁勛贊不絕口的DeepSeek最擅長的領域。

但現階段,要在基礎模型能力上追逐國際頂尖水平仍顯得不切實際。但結合此前的判斷:智能體爆發加上AI能力溢出讓模型之間的差距被壓縮,國產模型和國際頂尖模型之間的體驗差距已經小于參數差距。

應用層若是能精準定位“夠用就好”的需求區間,國產模型憑借極致的性價比就必然存在局部突圍的可能性。

02 

戰略轉向:從硬件綁定到生態連接

面對一只龍蝦引起的應用層爆發,英偉達的策略也發生了微妙的變化。

根據Wired報道,英偉達也正在走國內AI企業的養蝦之路,計劃推出開源AI代理平臺NemoClaw。

但不同之處在于,國內AI企業幾乎將幾個月前手機助手問世時的場面原封不動又復刻了一遍:開源項目誕生后,各家接連推出自己的類似功能產品,然后關閉生態,各自傾銷自己的滯銷token。

而英偉達選擇了開源,且無論企業是否使用英偉達芯片都可以接入平臺,同時提供了安全與隱私工具以應對企業級部署的可靠性挑戰。

它沒有做第一批養蝦的企業,卻從軟件和硬件層面上提供了最適合養蝦的“水缸”。

與此同時,英偉達也發現,如果它在人們心中的印象還是那個GPU企業,那就不可能在大模型和智能體領域內占據如今硬件領域的地位。

因此,這一舉措取消了此前的平臺大多要求企業使用自家芯片的限制。不過,這并非放棄了硬件層面上的底層優勢,而是通過降低參與門檻,把自身的角色升級成了“代理生態的基礎設施提供方”,試圖成為代理任務的默認運行環境。

在這篇博客中,雖然沒有明說,但黃仁勛想要表達的意思很明確:

當代理任務成為連接應用和底層算力的核心時,誰能定義調度規則,誰就能在五層架構的傳導鏈條中占據上游的議價權。

而這里的調度規則,至少會包含以下三個維度:

一是模型路由:誰能定義路由算法,誰就能決定流量流向哪個模型廠商;

二是工具與工作流編排:誰定義工具調用的API和執行順序,誰就能決定企業軟件被AI調用的方式;

三是算力映射:誰定義任務對算力的需求特征,誰就能決定底層芯片的設計方向。

與其被動響應需求,不如主動定義需求。

同期的另一項計劃也顯示出英偉達轉型的決心:

英偉達預計在未來五年內投入260億美元開發一款開放權重的模型。

所謂開放權重,就是公開模型的參數,但保留許可限制,既能滿足企業對透明度與定制化的需求,又能憑借最擅長的軟硬件協同優化能力維持技術主導權。

根據英偉達高管透露的信息,該模型的研發除了提供AI能力以外,更重要的目的是對存儲、網絡和數據中心進行一次極限壓力測試,以此定義下一代硬件架構。

據稱,國產模型DeepSeek-V4可能完全由華為昇騰系列芯片訓練,此后國產算力可能在國產模型的訓練中所占比重逐步上升;而英偉達的首款模型預計在2026年底或2027年初問世。據此推算,這一時間窗口會與全球算力格局演變的關鍵周期高度重疊。

03 

應用挑戰:從“能執行”到“可信執行”

當黃仁勛口中的“智能”自上而下扎根于物理設施的同時,自下而上也在面臨著應用層的可靠性挑戰。

NemoClaw平臺明確指向企業級市場的底氣,正是著重強調的安全與隱私工具。

英偉達的動向,恰好回應了當前代理技術最核心的矛盾:模型能力的提升無法直接轉化為生產環境的可靠性。

在實際的生產環境中,規模化運營的公司絕不會輕易使用OpenClaw這種高風險的產品。

一周之前,DeepLearning.AI創始人吳恩達博士在一次訪談中也明確指出:高風險企業應用中,完全自主的模型與生產級可靠性之間仍有巨大缺口。

無論是此前的大語言模型、如今的智能體還是未來的通用人工智能(AGI),人們對AI的核心需求其實從未改變:自動化執行任務。

這就意味著,AI產品的設計理念中必須包含智能自主決策。智能化和自主化程度越高,離人們的目標就越近。

但在實際業務場景中,容錯率低的嚇人,系統需要經過成千上萬次運行后依然保持穩定,這需要精細的工作流設計和分布驗證,而不僅僅依賴模型的“智商”。

英偉達在平臺中引入安全審計和權限管控等相關機制,是目前國內外各種“Claw產品”最欠缺的部分。

代理工具的價值早已不是“能否執行”,而是如何“可控執行”。

Perplexity近期提出的“Everything is Computer”就是這一命題最好的實證參考。

其企業級方案在金融研究場景中實現了“16000次查詢節省160萬美元人力成本”效果的同時,也設計了敏感操作審批、完整審計軌跡、緊急中止開關等安全機制,回應了企業對于代理工具不可預測性的擔憂。

事實證明,基礎模型在達到一定閾值后,決定用戶體驗的就不再是參數規模,而是產品如何管理風險、嵌入流程并驗證結果。

04 

結語:早期階段的選擇

英偉達的一系列動作,把一個根本的問題擺在了國產AI企業的眼前:

當基礎設施的定義權已經集中于全棧廠商,后來者還有什么機會?

吳恩達提出的觀點或許是這個問題的最好回答:

垂直領域AI服務于特定行業的能力,其增長速度將遠超對AGI的期待。

在訓練算力受限、推理算力有替代方案的情況下,放棄高精尖領域,聚焦高頻剛需場景反而容易在體驗層面上實現反超。

就像黃仁勛在博客結尾所說,人類仍處于AI基礎設施建設的早期階段,大語言模型和智能體都不會是AI發展的最終形態,大量機遇尚未發掘。

對于全球絕大部分開發者而言,復制全棧巨頭的路徑絕非明智之舉,只會像OpenClaw一樣營造出大量偽需求。

真正的機會,是在約束條件下探索更貼合本土場景的智能系統。

當應用層開始反向定義技術棧,AI能力溢出就變成了戰略機會。

國產模型在智能體時代已經與國際頂尖模型縮小了參數上的差距,后續發展的關鍵就在于產品如何跨越“能用”和“好用”之間的臨界點。

可以確信的是,免費奶茶營銷留不住的用戶,缺乏場景耦合的代理工具同樣留不住。

只有找到普通用戶也愿意為之付費的價值點,應用層才能真正拉動下層技術投入,形成正向循環。

智能的物理基座已經開始澆筑,應用層的真實價值將決定基座能承載多大的經濟規模。

       原文標題 : 最新一篇博客背后,黃仁勛的深度思考

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號