官宣開(kāi)源新模型!OpenAI終于要摸著DeepSeek過(guò)河了
在暗示推出一款開(kāi)源模型的一個(gè)多月后,OpenAI 似乎準(zhǔn)備好「兌現(xiàn)」承諾了。
4 月 1 日,OpenAI CEO 山姆·奧特曼(Sam Altman)在社交平臺(tái) X(原 Twitter)上公開(kāi)宣布:OpenAI 計(jì)劃在接下來(lái)的幾個(gè)月內(nèi),發(fā)布一個(gè)強(qiáng)大的、具備推理能力的開(kāi)放權(quán)重(Open-Weight)大模型。

圖/ X
是 DeepSeek-R1 一樣的推理模型?還是集成推理能力的對(duì)話(huà)模型?這一點(diǎn)還有待揭秘。但至少,如果一切按照計(jì)劃推進(jìn),這款全新的大模型將是自 GPT-2 以來(lái),OpenAI 首款重新開(kāi)放權(quán)重的大模型。
消息一出,海內(nèi)外科技媒體迅速跟進(jìn),不少中文媒體就以「OpenAI 預(yù)告/即將發(fā)布開(kāi)源模型」作為標(biāo)題,一些行業(yè)觀察者也將其視為 OpenAI「重新走向開(kāi)源」的標(biāo)志性一步。

圖/ Google
畢竟,在 DeepSeek-V3/R1 發(fā)布之后開(kāi)源模型社區(qū)變得越發(fā)活躍,而 OpenAI 的封閉也顯得越來(lái)越格格不入。
但如果你仔細(xì)看山姆·奧特曼的原話(huà),會(huì)發(fā)現(xiàn)他并沒(méi)有說(shuō)「open-source」(開(kāi)源),而是用了一個(gè)更謹(jǐn)慎的表述——「open-weight」(開(kāi)放權(quán)重)來(lái)作為新模型的「前綴」。
「開(kāi)放權(quán)重」和「開(kāi)源」可以劃等號(hào)嗎?這也引發(fā)了不少網(wǎng)友的討論乃至爭(zhēng)論。需要指出的是,所謂「開(kāi)放權(quán)重」,是指模型訓(xùn)練完成后所得到的參數(shù)對(duì)外開(kāi)放,開(kāi)發(fā)者可以基于這些權(quán)重進(jìn)行部署、測(cè)試,甚至微調(diào)。但它不包含訓(xùn)練數(shù)據(jù)、不附帶完整訓(xùn)練代碼,也不保證無(wú)門(mén)檻使用。
這與很多人認(rèn)知中的「開(kāi)源」——即代碼、數(shù)據(jù)、方法全面透明、自由使用——明顯還有一段距離。
從這個(gè)意義上說(shuō),「開(kāi)放權(quán)重」其實(shí)更像是一種妥協(xié):保留核心技術(shù)壁壘的同時(shí),釋放一些能力給開(kāi)發(fā)者社區(qū)。它可以降低模型的使用門(mén)檻,但難以滿(mǎn)足真正的可驗(yàn)證性與可重現(xiàn)性需求。
所以 OpenAI 究竟是重新?lián)肀ч_(kāi)源,還是在用模糊語(yǔ)言重新定義「開(kāi)放」?某種程度上,這場(chǎng)關(guān)于「真開(kāi)源」還是「假開(kāi)源」的爭(zhēng)議,可能遠(yuǎn)比一次模型發(fā)布本身更值得關(guān)注。
從阿里 Qwen 到 DeepSeek:「開(kāi)放權(quán)重」模型,就是開(kāi)源模型?
公允地講,OpenAI 新模型「開(kāi)放權(quán)重」的做法其實(shí)并不意外。
事實(shí)上,包括 DeepSeek、Qwen(阿里)、LLaMA(Meta)三家被視為開(kāi)源模型社區(qū)的「主力」,在開(kāi)源策略上雖然各有側(cè)重,但核心共同點(diǎn)也都是——開(kāi)放權(quán)重,允許外部開(kāi)發(fā)者直接部署,提供用于推理代碼、微調(diào)腳本和評(píng)估工具等。

DeepSeek 新聞稿,圖/ DeepSeek
這意味著,開(kāi)發(fā)者可以直接下載模型進(jìn)行本地部署、微調(diào)、做推理服務(wù),而這樣也可以說(shuō)是大模型「開(kāi)源」的最低門(mén)檻。
從這個(gè)角度看,OpenAI 預(yù)告發(fā)布的新模型采用「開(kāi)放權(quán)重」的做法,正是目前開(kāi)源模型社區(qū)的主流方式。甚至可以說(shuō),它在定義上,與今天市面上大多數(shù)被稱(chēng)為「開(kāi)源」的大模型并無(wú)二致。
不過(guò)盡管都是開(kāi)放權(quán)重,但實(shí)際的開(kāi)放程度還是各有不同。
以 DeepSeek 為例,它發(fā)布的 V2、V3、R1 等模型均開(kāi)放了權(quán)重,還有相應(yīng)的技術(shù)報(bào)告。同時(shí),DeepSeek 還采用了限制極少的 MIT 開(kāi)源協(xié)議,允許任何人自由地使用、修改、分發(fā)和商業(yè)化軟件或模型。這也是很多開(kāi)發(fā)者、廠商喜歡采用 DeepSeek 模型的關(guān)鍵之一。
阿里的 Qwen 模型則在開(kāi)放權(quán)重之外采用了同樣比較寬松的 Apache 2.0 開(kāi)源協(xié)議,允許用戶(hù)自由地使用、修改和分發(fā)代碼,包括商業(yè)用途,僅要求保留原始版權(quán)聲明和許可聲明。對(duì)于開(kāi)發(fā)者來(lái)說(shuō),Qwen 系列模型是一個(gè)相對(duì)成熟且兼具性能與靈活性的選擇。

阿里稍早前推出的 QVQ-Max 也采用了 Apache 2.0 協(xié)議,圖/ Github
相比之下,Meta 的 LLaMA 雖然也開(kāi)放了模型參數(shù)和推理腳本,但其使用協(xié)議限制更多。從 LLaMA 2 開(kāi)始,Meta 采用了更寬松的許可證(LLaMA 3.1 又更開(kāi)放了一點(diǎn)),但還是需要開(kāi)發(fā)者申請(qǐng)使用,且不能直接用于某些商業(yè)應(yīng)用或發(fā)布服務(wù),這也導(dǎo)致其在開(kāi)源社區(qū)的熱度雖高,但落地場(chǎng)景有所受限。
總的來(lái)說(shuō),三者雖然都自稱(chēng)「開(kāi)源模型」,但如果把「開(kāi)源」拆解為幾個(gè)維度來(lái)看——開(kāi)放權(quán)重、開(kāi)放代碼、開(kāi)放數(shù)據(jù)、開(kāi)放訓(xùn)練過(guò)程、開(kāi)放使用權(quán)限——你會(huì)發(fā)現(xiàn),沒(méi)有一家是「全開(kāi)」的。沒(méi)有公開(kāi)完整的訓(xùn)練數(shù)據(jù),也沒(méi)有提供可復(fù)現(xiàn)的訓(xùn)練代碼——換句話(huà)說(shuō),你可以用它的模型,但你無(wú)法從零重建它。
從這個(gè)角度看,OpenAI 即將發(fā)布的模型雖然尚未公布開(kāi)源的具體策略,但如果也開(kāi)放模型權(quán)重和推理代碼,支持開(kāi)發(fā)本地部署。那么從行業(yè)實(shí)踐標(biāo)準(zhǔn)來(lái)看,它完全可以被歸入今天「開(kāi)源模型」的范疇之中。
OpenAI 重回開(kāi)源,新模型將是 o3-mini 水平的推理模型
盡管很多人以為 OpenAI 是以開(kāi)源起家,但實(shí)際上至少在 GPT-2 時(shí)期,OpenAI 就有了「閉源路線(xiàn)」的打算。
2019 年初 GPT-2 發(fā)布,OpenAI 開(kāi)始以「惡意使用風(fēng)險(xiǎn)」的名義拒絕公開(kāi)的代碼,但在外界一致認(rèn)為 OpenAI「夸大風(fēng)險(xiǎn)」的輿論下,他們才在 2019 年底公開(kāi)滿(mǎn)血版 15 億參數(shù)的 GPT-2。但不論如何,從 GPT-3 開(kāi)始,OpenAI 徹底走上閉源路線(xiàn),不再公開(kāi)權(quán)重、代碼或訓(xùn)練數(shù)據(jù)。
因此,這一次「重新開(kāi)放」,也可以視為 OpenAI 對(duì)社區(qū)釋放出的一個(gè)信號(hào)。但需要明確的是,從山姆·奧特曼采用「open-weight」的字眼來(lái)看,OpenAI 新模型大概率將和今天的 DeepSeek、Qwen、LLaMA 一樣:開(kāi)放模型權(quán)重與推理代碼,但不包括訓(xùn)練數(shù)據(jù)或完整的訓(xùn)練代碼。

圖/ OpenAI
不過(guò)還是要考慮 OpenAI 采用的開(kāi)源許可類(lèi)型。如果 OpenAI 的新模型和 Qwen 系列一樣采用較為主流的 Apache 2.0 開(kāi)源許可,對(duì)于大部分開(kāi)發(fā)者來(lái)說(shuō)可能就沒(méi)有影響,開(kāi)發(fā)者同樣可以基于權(quán)重進(jìn)行本地部署、推理服務(wù),甚至進(jìn)行微調(diào)適配,只是模型本身的訓(xùn)練依舊是個(gè)「黑盒」。
另外值得期待的是,山姆·奧特曼在今年 2 月就暗示過(guò) OpenAI 開(kāi)源模型的方向?qū)⑹恰竜3-mini 級(jí)別」與「手機(jī)端側(cè)級(jí)別」其中之一。結(jié)合最新推文中提到的「powerful new open-weight model with reasoning」,基本可以推斷出 OpenAI 在開(kāi)源路線(xiàn)上最終選擇了一個(gè)「o3-mini 級(jí)別」模型來(lái)打開(kāi)局面。

圖/ X
這也可以理解,今時(shí)今日推理能力已經(jīng)是大模型發(fā)展的共識(shí),也是外界關(guān)注的重點(diǎn),OpenAI 如果希望借由「開(kāi)源」模型重回開(kāi)源社區(qū),或者是鞏固自己的行業(yè)地位,推出一個(gè)「o3-mini 級(jí)別」的開(kāi)源模型都是更有效的選擇。
當(dāng)然,OpenAI 已經(jīng)開(kāi)始在舊金山、歐洲和亞太地區(qū)組織開(kāi)發(fā)者預(yù)覽活動(dòng),邀請(qǐng)開(kāi)發(fā)者提前試用模型原型,并收集反饋。或許在接下來(lái)的一段時(shí)間內(nèi),我們還會(huì)聽(tīng)到、看到更多關(guān)于 OpenAI 開(kāi)源新模型的消息。
寫(xiě)在最后
對(duì)于 OpenAI 來(lái)說(shuō),這次重返開(kāi)源社區(qū)的意義,遠(yuǎn)不止發(fā)布一個(gè)模型那么簡(jiǎn)單。
過(guò)去兩年,開(kāi)源模型生態(tài)幾乎是在沒(méi)有 OpenAI 參與的情況下迅速繁榮了起來(lái)。Meta、Mistral、Qwen、DeepSeek 輪番上場(chǎng),一邊打造模型,一邊打造生態(tài),甚至逐漸形成了一個(gè)規(guī)模龐大的開(kāi)源模型生態(tài)。
尤其在 DeepSeek-V3/R1 之后,越來(lái)越多硬件、軟件廠商加入開(kāi)源模型的生態(tài)之中,徹底放棄了自主訓(xùn)練大模型的路徑,專(zhuān)心投入到模型微調(diào)、應(yīng)用落地等方面。
對(duì)于 OpenAI 來(lái)說(shuō),這無(wú)疑是一種潛在的「威脅」,就像曾經(jīng) Android(開(kāi)源)生態(tài)對(duì)于 iOS 的威脅。這也就不難理解為什么山姆·奧特曼會(huì)承認(rèn),「OpenAI 的閉源策略站在了錯(cuò)誤的一邊。」
但 OpenAI 畢竟是 OpenAI,GPT/o 系列模型的領(lǐng)先也毋庸置疑,而它即將發(fā)布的開(kāi)源模型,或許也會(huì)改變整個(gè)開(kāi)源模型社區(qū)。
來(lái)源:雷科技
原文標(biāo)題 : 官宣開(kāi)源新模型!OpenAI終于要摸著DeepSeek過(guò)河了
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來(lái)了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線(xiàn)督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹(shù)機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬(wàn)
-

長(zhǎng)安汽車(chē)母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
6月30日立即報(bào)名>> 【直播】 AI X 6G無(wú)線(xiàn)智能與下一代通信測(cè)試論壇
-
6月30日立即申請(qǐng)?jiān)囉?> 【免費(fèi)試用】旭之源工業(yè)電源一一機(jī)器人的穩(wěn)定“心臟“
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來(lái)·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線(xiàn)下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
推薦專(zhuān)題
- 1 人形機(jī)器人“第一股”來(lái)了!宇樹(shù)科技即將上會(huì)
- 2 特斯拉宣布監(jiān)督版FSD登陸中國(guó)?
- 3 Agnes AI 發(fā)布三大模態(tài)核心模型:文本、圖像、視頻
- 4 谷歌2026 I/O大會(huì)完整回顧:模型依然重要,但智能體正在接管一切
- 5 騰訊云宣布調(diào)價(jià):DeepSeek-V4降價(jià)97%
- 6 SpaceX上市拒絕中港投資者:資本開(kāi)啟地緣政治時(shí)代
- 7 特斯拉官宣監(jiān)督版FSD登陸中國(guó)
- 8 2026上半年具身智能復(fù)盤(pán),瘋狂融資潮背后誰(shuí)才是“印鈔機(jī)”
- 9 支付寶推出全球首個(gè)Token Pay服務(wù),AI時(shí)代的支付要變天了?
- 10 我們體驗(yàn)了胡彥斌Vibe Coding的App:方向是對(duì)的,細(xì)節(jié)有點(diǎn)糙
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷(xiāo)售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷(xiāo)售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專(zhuān)家 廣東省/江門(mén)市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





