訂閱
糾錯
加入自媒體

華為入局Coding Agent,Anthropic揭開AI“人格”之謎

2026-01-21 13:41
硅基星芒
關注

01

重大發布(新模型/產品/開源)

① 智譜開源輕量模型GLM-4.7-Flash,免費開放使用

智譜團隊今天正式推出新一代輕量模型 GLM-4.7-Flash,并宣布開源且免費開放接口調用。該模型采用“混合思考”架構,總參數300億,實際運行中僅激活30億參數,在確保高性能的同時大幅降低了運算成本。

智譜

在多項測試中,GLM-4.7-Flash 與當前兩款主流輕量開源模型對比,在包括編程評測基準SWE-Bench在內的七項測試中,有六項取得領先成績。其在編程、中文寫作、翻譯、長文本理解與角色扮演等實用場景中表現突出。

即日起,開發者可通過智譜開放平臺免費調用該模型接口,也可在Hugging Face與魔搭社區獲取開源版本,F有的GLM-4.5-Flash免費版將于1月30日下線,請求將自動遷移至新版。

短評:

智譜此次開源的定位很清晰——“小而強”,測試成績也印證了這一點。免費且開源的策略大幅降低了中小企業與開發者的使用門檻,也為中文場景提供了可自行部署的高性能模型選擇。當前AI應用逐漸落地,企業往往更關注任務成本與效率,而非一味追求參數規模。輕量模型更適合嵌入智能體或作為工具鏈的一環,這也是AI工程化的大勢所趨。

② 華為云推出免費代碼助手CodeArts Doer個人版

華為云近日發布 CodeArts Doer 代碼智能體個人版,面向所有開發者免費開放。該產品定位為“AI原生編碼助手”,不止能補全代碼,更致力于成為融入開發全流程的智能協作者。

華為

其核心功能圍繞三個方面構建:

AI IDE:以AI為核心理念打造的開發環境,將需求分析、任務拆解、接口設計到代碼生成整合在一個界面中,開發者用自然語言描述需求即可自動生成代碼。

智能編程模式:提供“探索模式”快速驗證想法,以及“規范模式”確保代碼符合標準與安全規范。

代碼庫深度理解:可理解百萬行規模的代碼倉庫,梳理模塊依賴與業務邏輯,幫助團隊新人快速上手、提升協作效率。

據官方介紹,該工具在項目級代碼生成等場景中,平均可減少30%以上的重復編碼工作。個人版已上線,支持選用GLM-4.7和DeepSeek-V3.2兩種模型,企業版計劃尚未公布。

短評:

CodeArts Doer展現了華為在AI原生研發工具鏈上的布局。但目前代碼生成類工具缺乏公認的評測體系,華為也未公布具體量化對比,實際效果還需觀察。此外,當前支持模型有限,生態開放度不足,可能影響開發者采納。近一個月國內已有多款同類產品上市,競爭日趨同質化,CodeArts Doer需展現明顯技術差異或場景優勢才能真正脫穎而出。

③ 階躍星辰AI桌面助手推出Windows版

繼去年9月發布Mac版后,階躍星辰近日正式推出 AI桌面伙伴Windows版,將智能助手能力擴展至Windows平臺。該產品定位為“會做事、總在場、有記憶、能進化”的本地AI助手。

階躍

本次升級主要帶來以下功能:

支持調用第三方工具:通過MCP協議,可操作Excel、QQ郵箱、飛書、釘釘、Notion、高德地圖等16款常用軟件,用戶也可自行接入其他工具,實現如“讀取工資表并群發郵件”等自動化任務。

全局記憶(目前僅Mac支持):自動記錄電腦操作軌跡,生成每日摘要,所有數據僅存于本地。

窗口內容識別(Mac已支持):點擊懸浮球可識別當前窗口內容并同步上下文。Windows版已上線基礎功能,高級特性將逐步開放。

短評:

與多數國內廠商聚焦手機助手不同,階躍星辰選擇了與Anthropic Cowork類似的PC端路線。由于Windows/macOS系統開放度更高,AI助手可通過API和腳本實現跨應用操作,更貼合生產力場景中多任務、長流程的需求。

階躍星辰通過MCP協議,無需各大廠商單獨授權,即可讓AI安全、結構化地調用各類軟件,真正打通工作流,解決跨生態自動化難題,這一選擇顯得更為務實且具差異化。

02

技術進展(論文/SOTA/算法)

① Anthropic提出“助手軸”:AI也有“人格”,而且會漂移

Anthropic與牛津大學團隊近日發布論文《助手軸:定位與穩定語言模型的默認人格》。研究發現,經過指令調優的大語言模型所呈現的“有用且無害的AI助手”形象,在模型的數學表示中對應一個明確的“方向”,團隊將其命名為 “助手軸”。

但這種“助手”狀態并不穩定。在面對特定對話情景(如情感傾訴、涉及AI意識的討論)或惡意引導時,模型會發生 “人格漂移” ,脫離助手軸,進而產生有害或怪異回答。為解決這一問題,研究團隊采用 “激活截斷” 方法,將模型在助手軸上的激活值限制在正常區間,可在不影響能力的前提下顯著降低有害行為。

研究首先繪制了模型的“人格地圖”,提取模型扮演不同角色(如程序員、幽靈)時的數學向量,分析發現最主要的差異維度就是“像助手”與“不像助手”。有趣的是,“助手軸”在未經過調優的原始模型中就已存在,說明AI助手的人格并非無中生有,而是建立在預訓練階段學到的“樂于助人的專業人士”概念之上。

論文同時指出,在多輪對話中,某些高風險話題(如情感脆弱提問、哲學性質詢)極易引發人格漂移,而編程、寫作等明確任務則有助于保持助手狀態。通過僅在其偏離時進行輕量干預,新方法在幾乎不影響模型性能的情況下,將有害回答率降低約60%。

短評:

過去AI的失控事件常被籠統歸因為“對齊失敗”,而Anthropic的研究首次指出:大模型在對話中會沿著可測量的“人格空間”移動,一旦偏離“助手軸”,就可能產生幻覺或危險輸出。這并非隨機錯誤,而是模型內部結構的自然體現。

當前主流對齊方法(如RLHF)多側重于訓練末期“鎖定”助手人格,卻難以保障其在長對話中的穩定性。Anthropic的工作將AI安全機制從黑箱中揭示出一角,不僅解釋了以往諸多異常案例,也為未來構建運行時監控與干預系統提供了新思路。

03商業動態(融資/合作/財報)

① 鄭欽文代言阿里通義千問,市場反響兩極

1月19日晚,阿里通義千問團隊宣布與中國網球運動員鄭欽文達成全球品牌代言合作,并在B站同步發布三條宣傳片。官方稱,鄭欽文“迎難而上、解決問題”的體育精神與千問APP“回答聰明、會辦事”的定位相符;“千問”與“欽文”諧音,亦構成巧妙的品牌聯想。

然而市場反響呈現兩極。盡管有一條視頻播放量破百萬,但評論數寥寥,互動率偏低。部分用戶認可體育代言有助于提升AI產品在大眾尤其是非科技人群中的認知度;但也有不少技術社區用戶提出質疑,認為阿里更應聚焦于產品與技術本身的提升。

短評:

阿里此次動作顯示其正從技術層面向應用與市場層面加速推進,意圖搶占C端AI市場。不過,當前該賽道已有字節跳動的豆包等產品憑借多模態體驗占據用戶心智,阿里千問的定位相對模糊,僅靠明星代言恐難形成突破。在競爭日趨激烈的AI應用市場,產品力與用戶體驗仍是立足之本。

       原文標題 : 華為入局Coding Agent,Anthropic揭開AI“人格”之謎

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號