新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

侵權投訴
訂閱
糾錯
加入自媒體

特斯拉監督版FSD登陸中國被廣泛關注,技術架構有啥特點?

2026-05-25 11:31
智駕最前沿
關注

2026年5月21日,特斯拉官方宣布了監督版FSD的最新布局,其中明確提到監督版FSD可以在中國使用。消息出來后,引起了大家的廣泛關注,智駕最前沿也第一時間進行了報道(相關閱讀:特斯拉宣布監督版 FSD登陸中國?)。

說實話,關于FSD入華的傳聞在過去一年出現過好幾次,而這次官方下場確認,也讓這一猜測得到了證實。從2024年V12版本徹底轉向端到端神經網絡,到V14整合多模態大模型,FSD這兩年的發展,其底層技術架構已經實現了兩次跨越式升級,與最初基于規則的系統相比,如今的FSD其實已經換了一副骨架。而監督版FSD在北美大規模推送后積累了大量實測數據,也讓外界對它在復雜中國道路上的表現有了更多技術層面的期待。

特斯拉的AI化改造,究竟走到了哪一步?

傳統自動駕駛系統一直沿用模塊化設計,把開車這件事拆成感知、預測、規劃、控制四個獨立環節,每個環節各有一套算法,彼此之間靠人工定義的接口交換數據。感知模塊看到行人,就輸出一個帶速度標簽的矩形框,后面的預測和規劃模塊再依據這個框去做推算和路徑選擇。這種方式工程上可控,每個模塊可以單獨開發和測試,但問題也出在這里,像是一個橫穿馬路的行人,他的注意力在哪、有沒有看到來車、下一步可能怎么走,這些信息到了矩形框里就全丟了。

特斯拉在V11時期攢下了超過30萬行C++控制代碼,試圖靠堆規則彌補信息傳遞中的損失,但現實道路的復雜程度是任何規則庫都覆蓋不過來的。2024年的V12版本推翻了這套架構,直接把8顆攝像頭的原始像素輸入映射到方向盤轉角、油門和剎車指令,中間不再保留人為設定的模塊邊界。這一步把之前那條感知歸感知、控制歸控制的隔離帶拆掉了,讓整個系統能夠作為一個整體來優化。

圖片源自:網絡

真正把這一步推到更徹底位置的,是今年4月在美國開始推送的V14.3版本,此前智駕最前沿已經和大家詳細聊過V14.3(相關閱讀:特斯拉 FSD V14.3,讓AI直接開車?),這里就簡單概括下。FSD V14.3被馬斯克稱為通往全自動駕駛的最后一塊拼圖,它完成了一項此前一直沒有觸及的底層工作,用AI神經網絡徹底替換掉控制車輛的最后那30萬行C++代碼。要知道,在此之前,哪怕FSD的感知和規劃模塊已經大量用了神經網絡,最終負責打方向盤、踩油門剎車的控制層還是靠手寫規則在跑。這也是為什么之前版本會出現黃燈突然急剎、遇到停車標志反復制動這類不夠自然的操作。

為了讓神經網絡直接接管底層控制,特斯拉在V14.3里基于MLIR(多層次中間表示)編譯器框架從零重寫了AI編譯器與運行環境。MLIR這套框架最早由曾在特斯拉短暫執掌過Autopilot團隊的克里斯·拉特納主導開發,現在用在了自家車上,相當于給神經網絡的推理效率做了一次全面重構。官方給出的數據是,這一架構整體反應速度提升了20%。在時速80公里的緊急避讓場景里,20%的反應提升意味著縮短了一米的剎車距離。

V14.3的網絡參數量比前代增加了大約10倍。參數量增長不僅僅意味著模型變大了,更關鍵的是模型現在可以容納更豐富的環境信息。V14.3還搭載了自回歸Transformer技術,給系統帶來了3到5秒的時空記憶和5到10秒的路況預判能力,讓它能記住幾秒前突然切入的車輛并據此調整接下來的軌跡,而不會每次決策都像失憶一樣重新來過。

純視覺方案加上語言推理,這條路能通嗎?

FSD一直堅持純視覺方案,在硬件上不搭載激光雷達,不依賴高精地圖。HW4.0平臺把攝像頭像素從HW3.0的120萬提到了500萬,前向用了雙目感知配置,一共8顆攝像頭做360度覆蓋,視頻輸入可以跑到36Hz全分辨率。芯片算力大約720TOPS,CPU給到了20個核心,分成5個集群運行,給端到端模型的實時推理提供支撐。

此外,FSD還使用占用網絡作為理解三維環境的工具,和傳統目標檢測先識別再避讓的邏輯不同,占用網絡直接把空間切成一個個體素網格,只判斷每個網格有沒有被東西占據,不關心占據網格的是什么。這個思路繞開了目標識別對有限類別標簽的依賴,讓系統可以應對訓練集里從沒出現過的障礙物,像是路上掉落的貨物、臨時擺的錐桶、翻倒的非機動車,都能當作有東西擋著來統一處理。在這個基礎之上,特斯拉還升級了骨骼追蹤模型,能捕捉人體關節點的動作,區分行人是在路邊看手機還是正打手勢示意通行。

圖片源自:網絡

到了V14階段,FSD在感知和決策上也有了提升,V12做的是看見就反應的直覺式駕駛,但這種直覺在面對復雜路況、需要邏輯推演的時候會有短板,V14則引入了VLA架構,讓語言進入了駕駛決策閉環。VLA本質上是把視覺感知、語言理解和動作控制整合在同一個模型里,模型在做駕駛決策的同時會并行輸出一條思維鏈,執行如我減速是因為前方行人正在過馬路或者我在等紅燈,還有3.2秒轉綠這樣的邏輯。

這些文本并不是事后貼上去的解釋標簽,而是在前向推理時就同步生成的,和駕駛決策共享同一個特征空間。語言在這里承載了兩個實質性的功能,一是推理能力,如到了施工路段,FSD不光能識別道路封閉的標志,還能通過上下文推斷出從左邊繞過去的結論;二是可解釋性,也就是給端到端的黑箱模型,開了觀察窗。

有一點要提一下的是,特斯拉在上海臨港建成了中國AI訓練中心,2026年2月已經投入使用,和自建的本土化數據中心打通后,中國道路數據可以做到采集、存儲、訓練、部署全流程不出境。這套本地閉環加上與百度地圖的合作,是目前FSD進入中國市場在合規層面的關鍵支撐。根據特斯拉CFO在2026年一季度財報電話會上的說法,目標是在第三季度拿到監管部門批準。

圖片源自:網絡

還有值得注意的一個動向是,馬斯克在今年Q1財報會上提到,FSD V15最快可能在年底到明年初推出,屆時將對軟件架構做全面重構,目標是在無人監管的情況下大幅提升安全水平。與此同時,特斯拉的訓練基礎設施也在持續擴大,自研Dojo 3芯片項目已經重啟,Cortex 2算力集群也已上線運行訓練任務?吹贸鰜,V14.3遠不是終點,這整套系統的架構還在持續演進中。

和華為、小鵬放到一起比,技術架構有何不同?

FSD進入中國,必然會對國內企業的智駕發展帶來直接沖擊,回看現在國內的智駕發展路線,華為、小鵬就是比較有代表的兩個方向。

華為ADS走的是多傳感器融合路線,最新的ADS 5.0在2026年4月剛發布。這套系統在感知上用了攝像頭、激光雷達和毫米波雷達的多重冗余,搭載的是目前量產里規格最高的896線雙光路激光雷達,暗光下能識別122米外14厘米高的低矮障礙物。ADS 5.0還升級到了WEWA 2.0,云端引入了多智能體博弈機制和在線強化學習,把路上的其他車輛、行人都當作獨立的智能體來做交互推演,訓練強度和效率各提升了10倍。車端則引入了安全風險場理論,通過動能場、勢能場和行為場實時畫出動態風險熱力圖,碰撞風險降低了50%。另外華為還發了面向自動駕駛的操作系統乾崑OS,在底層基礎設施上做標準化布局?偟膩碚f,華為的選擇是在穩健里多留幾分安全冗余,策略上偏保守,寧可多等一輪紅燈也不冒進。

圖片源自:網絡

小鵬XNGP和特斯拉更接近,同樣堅持純視覺方案和端到端模型(對于這兩者的差異,后面會詳細和大家聊一聊)。小鵬在2025年發布了第二代VLA模型,不過和特斯拉的VLA做法不同,小鵬的第二代VLA跳過了語言作為中間轉譯這一步,直接做視覺信號到動作指令的端到端映射,目標是降低推理延遲和算力開銷。從這條路徑來看,小鵬追求的是讓模型足夠輕、足夠快,能直接跑在車上。

把三條路放在一起看,差異和各自的取舍就很清楚了。特斯拉的VLA是語言和控制共享同一個特征空間,讓語言參與推理但不主導決策。小鵬則干脆取消了語言環節,更貼近工程落地的節奏。華為在感知上保留了多傳感器冗余,追求物理層面的安全兜底。需要提醒的是,到現在為止,三家在法律定位上都還屬于L2級輔助駕駛,沒有誰對誰構成代際碾壓。

-- END --

       原文標題 : 特斯拉監督版FSD登陸中國被廣泛關注,技術架構有啥特點?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號