訂閱
糾錯
加入自媒體

大模型日報| Gemini首席工程師震驚了

2026-01-05 09:42
硅基星芒
關注

01

重大發布(新模型/產品/開源)

 ① 英偉達平臺引入國產先進模型,GLM-4.7 與 Minimax-M2.1 開放免費調用

近日,隨著國內AI公司智譜與Minimax相繼公布港股上市進程,英偉達迅速跟進,在其NVIDIA NIM API平臺上正式接入兩家公司的最新大語言模型——GLM-4.7與Minimax M2.1。該平臺致力于將大模型封裝為即插即用的微服務,大幅降低開發者的部署與調試門檻。

目前,用戶注冊英偉達賬號并生成API Key后,即可通過編程方式免費調用這兩款模型。盡管在官方模型廣場中尚未直接列出,但實際接口已開放使用。

初期測試顯示,在通用對話場景中,GLM-4.7的響應速度約為每秒25個token,而Minimax-M2.1則可達每秒150個token,推測可能與模型新上線、資源仍在調配有關。

短評:

此舉形成多方共贏:開發者得以規避繁瑣的部署流程,快速集成先進模型能力;國內AI企業則通過英偉達的全球生態,有效提升其技術在國際舞臺的能見度;而對英偉達而言,提供最新模型的免費嘗試,也有助于鞏固其開發者社區與平臺黏性。技術無國界,生態共生長,或為AI全球化協作的一頁新注腳。

② Grok 新版疑似曝光,xAI 神秘模型現身評測榜單

近期,有AI研究者在知名大模型評測平臺LMS Arena及DesignArena中發現數款名稱奇特的新模型記錄,分別為“Vortexshade”“Quantumcrow”與“Obsidian”。

其命名風格與以往xAI產品的代號高度相似,經簡單測試后,多數推測指向它們或為Grok系列即將發布的新版本。

短評:

盡管Grok在智能表現上已接近第一梯隊,但其實際用戶規模與生態影響力仍與GPT、Gemini等頭部產品存在顯著差距。在AI競爭日趨聚焦于實際應用的當下,Grok在多模態與合規安全等方面仍面臨挑戰。

③ OpenAI 布局無屏語音交互,計劃推出對話式AI硬件

據TechCrunch報道,OpenAI正組建專項團隊,研發新一代具備連續、自然對話能力的AI語音設備,目標在2026年推出首款無屏幕個人助理產品。該設備旨在突破當前語音助手“一問一答”的機械交互,支持打斷、重疊對話等更貼近真人交流的溝通方式,如同一位置身耳畔的智能搭檔。

實際上,OpenAI并非唯一聚焦語音賽道的玩家:Meta已在Ray-Ban智能眼鏡中集成多麥克風系統,以提升嘈雜環境下的語音識別;Google正測試“語音摘要搜索”,將文字信息轉化為語音播報;Tesla則于車機系統接入Grok,支持自然語言操控車輛功能。

短評:

從圖形界面到觸控操作,每一次交互方式的變革都重塑著技術入口。OpenAI此次轉向,正是對“后屏幕時代”交互形態的一次前瞻押注。

然而,語音交互硬件之路不乏前車之鑒:Humane AI Pin因體驗不佳折戟,Google的XR探索亦屢遇預期落差?梢,如何將技術能力轉化為流暢、可靠的用戶體驗,仍是所有入局者必須回答的關鍵命題。

02

技術進展(論文/SOTA/算法)

① Claude Code 編程能力震驚業界,被指“一小時完成一年工作量”|

過去24小時內,谷歌Gemini團隊首席工程師Jaana Dogan在社交平臺連續發文,透露其團隊耗時一年研發的“分布式代理編排器”項目,在向Claude Code提出需求后,僅用一小時即獲得一套結構完整、可直接運行的程序代碼。

她對此表示“不是焦慮,而是敬佩”,并指出盡管出于安全考慮,該代碼無法直接用于谷歌核心項目,但其完成度與團隊一年探索的成果已達同一水準。

Dogan同時強調,AI生成的代碼仍須人工審查與迭代優化,但這標志著AI編程能力已從“片段補全”躍升至“系統級意圖理解”階段。

短評:

盡管目前僅為個案分享、未公開完整代碼,但其揭示的趨勢已足夠清晰:AI編程正以指數速度進入“系統級輔助”新階段。程序員或許不會因此失業,但駕馭AI工具以提升效率,必將成為未來開發者的必備素養。

從“不重復造輪子”到“不重復造整車”,高質量代碼的自動化生成,很可能成為AI技術商業化落地最為順暢的領域之一。

03

算力與基礎設施(芯片/云/數據中心)

① Anthropic 豪擲210億美元,向博通采購百萬顆TPU芯片

據半導體分析機構SemiAnalysis披露,Anthropic已與博通達成協議,采購約100萬個TPU v7p芯片,用于自建數據中心集群。這批芯片由谷歌與博通聯合設計,但此次交易中博通將直接向Anthropic提供整機架系統,谷歌則以IP授權方身份獲取相應費用。

博通CEO在12月投資者會議上證實,Anthropic的AI相關訂單總額已達210億美元,且因整機架出貨模式,該批訂單毛利率有所降低。

短評:

這一采購動向,折射出AI算力供應鏈的深層演變:博通從芯片設計商轉向系統集成供應商,谷歌則從硬件銷售轉為知識產權授權。

隨著谷歌、OpenAI、Anthropic等頭部公司紛紛與博通簽署大額訂單,并大規模采用自研或定制芯片(如TPU),長期以來英偉達在高端AI算力市場的“單一主導”局面,正悄然呈現出多元化解構的趨勢。

       原文標題 : 大模型日報| Gemini首席工程師震驚了

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號