新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

GPT5.6重奪王位,卻再遭嚴控!AI真的已經走到轉折點

今天鋪天蓋地的新聞,OpenAI發布了新一代模型「GPT-5.6」。

半個多月前,老對手Anthropic剛放出兩個天花板模型Mythos和Fable 5。

風頭正盛的時候,OpenAI一記直拳就打了過來,打在了Anthropic最得意的地方。

OpenAI一口氣放出三款模型,名字有講究,Sol、Terra、Luna,拉丁語里就是太陽、地球、月亮。這是OpenAI頭一回用天文學給模型起名。

太陽Sol是旗艦,最強那一檔,專門啃最難的活兒,復雜推理、科研、寫代碼、網絡安全、生物研究。

地球Terra主打均衡,能力跟上一代GPT-5.5差不多,但成本砍了一半,適合企業日常用。

月亮Luna最快也最便宜,專門接海量、高頻的輕活兒。

命名規則也跟著變了。

數字管代際,5.6就是第幾代;太陽地球月亮管能力層級,各自按自己的節奏往前走。

意思是以后出GPT-5.7、5.8,可能就是Sol升到Sol 2、Terra升到Terra 2,你不用每次都重新比一遍,記住常用哪檔就行。

旗艦Sol還多了兩個新擋位。

一個叫Max,給模型更長的思考時間,對付那種特別難的單個問題。

另一個叫Ultra,更狠,任務太復雜時,主模型會自己派生出好幾個子智能體,分頭并行干活,最后把結果匯總起來。

那它到底有多能打,拿成績說話。

在一個叫Terminal-Bench 2.1的編程測試里,旗艦版Sol超過了對手Anthropic的Mythos預覽模型,開啟Ultra模式后還能再往上走一截。中間檔Terra,表現跟Fable 5打平。連最便宜的Luna,都比Anthropic目前還在公開提供的旗艦強一點。

這就是開頭說的,打在了對手最得意的地方。

你最強的,我用中間檔就接住了。我最強的,再往上踩你一頭。

在網絡安全的一項測試里,Sol的表現跟對手的預覽模型相當,但只用了三分之一的輸出量。

同樣的結論用更少的步驟得到,省的不只是錢,是推理效率的實打實提升。

如果說模型能力是一記直拳,那模型價格就是一個飛踹。

Sol每百萬token輸入5美元、輸出30美元。同樣的活兒,Fable 5要收10美元和50美元。

一半。

舉個例子。假如一個團隊現在每月在對手模型上燒5萬美元做代碼審查和自動化,換到能力相當的Sol,賬單大概只要2萬5。省下的不是零頭,是一半的預算。

講到這,是不是已經熱血沸騰了。我得潑盆冷水,讓你冷靜一下。

因為GPT-5.6只開放給一小撮受信任的合作伙伴,首批大概二十來家機構。

真不是OpenAI自己想這么干,是應美國政府的要求。

劇情是這樣的。

正式發布前,OpenAI先把計劃和模型能力給美國政府過了一遍目。政府的意思是,先小范圍給報備過的伙伴用,之后再慢慢放開。

最微妙的細節在后面。據報道,在這套機制下,有些客戶想用,得政府一個一個批。奧特曼在內部備忘錄里也提到,預覽期間政府會逐個批準客戶的訪問申請。

一客一審。這放在軟件分發的世界里,是相當反常的畫面。

回想一下我們這些年用網絡服務的習慣,注冊、付費、立刻就用。哪怕再貴的企業軟件,簽了合同也就開通了。什么時候輪到過,一家公司能不能用某個工具,要排隊等一張張許可。

為什么會這樣?往大了說,AI模型第一次被當成戰略物資來管了。

就在兩周前,Anthropic的Fable 5上線才三天就火速下線,原因是收到出口管制指令,連他們自己的外籍員工都不許碰,F在輪到OpenAI,政府用的是類似邏輯。

OpenAI的態度很有意思。

它一邊配合,一邊在公告里放了段挺硬的話。

大意是這種政府介入的訪問流程不該變成長期默認做法,因為它把真正需要頂尖工具的開發者、企業、網絡安全防御者擋在了外面。

翻譯一下,這次我先忍了,但別想著一直這么搞。

它還順勢提了個要求。

希望跟美國政府一起定一套清晰、可反復照著執行的流程,而不是讓逐個審批成為行業以后的常態。這步很關鍵,模糊的權力最麻煩的不是嚴,是沒準。

OpenAI想做的,是把說不清的裁量,變成寫得明白的規則。它要的不是放松,是確定。

公告里還有一半篇幅在講安全。

OpenAI給模型搭了一套層層設防的體系,訓練時就教會它拒絕危險請求,生成過程里有實時分類器盯著網絡和生物這些敏感領域,發現不對勁就當場暫停、交給更大的模型復核,確認違規就在送到你眼前之前攔掉,觸發警報的賬號還會被拉去做賬戶級審查。

發布前它做了超過70萬GPU小時的自動化測試,外加大量外部紅隊演練,同時給自己定性,說還沒到必須全面封死的最高危險等級。

這套話術半是技術說明,半是表演給所有人看的信任秀,它在告訴政府、也在告訴你我,這東西我管得住。

說到底,這才是這次發布最值得琢磨的地方。

Anthropic的Fable 5,上線三天就被叫停。OpenAI的GPT-5.6,干脆從一開始就只給二十來家報備過的伙伴,還得政府一客一審。

短短半個月,業內最強的兩家公司,最強的幾個模型,全都撞上了同一堵墻。這就不是偶然了。

一兩家公司被管,是個案。兩家頭部、連著兩次、用的還是同一套邏輯,那是趨勢。

這套邏輯的核心,是美國政府開始把前沿模型,單拎出來當一類需要特殊看管的東西。它甚至給了個名頭,受監管前沿模型,還在張羅一套配套的評估體系。

翻譯過來就是,到了某個能力線以上的模型,發不發、怎么發,不再全是公司自己說了算。

為什么偏偏是現在。

因為這一代模型,第一次出現了讓美國政府睡不著的能力。

會自己找軟件漏洞,能在生物領域幫上忙,還能拉起一隊子智能體連續干上幾十步活兒。這些本事用在正地方是生產力,用歪了就是另一回事。

當一個技術同時具備造福和闖禍的兩副面孔,監管的手伸過來,幾乎是遲早的事。

所以你會看到一個挺擰巴的局面。

公司這邊,玩命想把模型鋪得越廣越好,因為用戶、開發者、企業才是它的命根子。

政府那邊,想在全面放開前先摁一摁,把住國家安全這道閘。一個要快要廣,一個要穩要控,兩股勁擰在一起,就成了今天這個分階段、限量、逐個批的局面。

OpenAI那段話,說穿了就是這種擰巴的外溢。它不敢不配合,又實在不甘心,只能一邊照做一邊喊,這事別成了常態。

往后看,有幾條線也許會成為趨勢。

第一條,分階段發布會從特例變成慣例。

以后但凡夠到那條能力線的重磅模型,先小范圍、再逐步放開,很可能就是默認動作。今天覺得反常的事,過兩年大家就見怪不怪了。

第二條,發布權會慢慢變成一種隱形的牌照。

能不能第一時間拿到最強模型,開始取決于你在不在那張報備名單上。這意味著先拿到權限的少數玩家,會憑空多出一段時間差的領先,而這段領先不是靠技術掙來的,是靠審批給的。

第三條,規則之爭會比能力之爭更要緊。

OpenAI主動要求把逐案審批變成可重復執行的流程,背后是想搶規則的制定權。誰能把模糊的行政裁量,談成一套寫明白的標準,誰就能在下一輪里少受制于人。

這場博弈的贏家,未必是模型最強的那個,而是最會跟監管打交道的那個。

如果你有任何看法,歡迎在評論區一起討論

如果有一點收獲,可以點贊、轉發、推薦文章,關注「AI機器人茶館

       原文標題 : GPT5.6重奪王位,卻再遭嚴控!AI真的已經走到轉折點

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號