訂閱
糾錯
加入自媒體

字節“挖角”阿里千問核心骨干

3月12日,原阿里巴巴通義實驗室Qwen大模型后訓練負責人郁博文,已正式加入字節跳動,擔任Seed團隊視覺模型與多模態交互團隊后訓練負責人。

這距離郁博文3月7日透露離職消息僅過去五天,沒錯,他的離職和阿里千問靈魂人物林俊旸的告別發生在同一天。而郁博文并非第一位從阿里千問核心團隊出走并加入字節的骨干——2024年7月,原通義千問技術負責人周暢已被字節以千萬年薪收入囊中。

連續兩次技術骨干離職后加入字節,這讓人不得不懷疑字節背后的AI戰略意圖?還有,后訓練專家為何成為大模型競爭中的關鍵稀缺資源?

從“阿里星”到后訓練負責人

公開資料顯示,郁博文本科畢業于中南大學,后考入中國科學院信息工程研究所攻讀研究生,2022年獲得中國科學院大學博士學位。在讀期間,他專注于自然語言處理與信息抽取領域研究,曾在ACL、EMNLP等國際頂級學術會議上發表多篇論文,并提出將信息抽取任務轉化為圖結構問題的創新思路。憑借突出的學術表現,他曾榮獲中國科學院院長獎。

2022年博士畢業后,郁博文以阿里集團最高級別校招項目“阿里星”身份加入阿里巴巴達摩院,擔任算法專家(P7)。入職初期即深度參與通義千問大模型的早期訓練與研發,迅速成長為千問團隊核心骨干,并最終擔任后訓練(Post-training)負責人。

作為后訓練負責人,郁博文在大模型的“對齊”與“精調”領域貢獻卓著。他主導了Qwen系列Chat模型的研發,通過監督微調(SFT)、強化學習(RLHF)、直接偏好優化(DPO)等技術,將通用大模型轉化為符合人類價值觀和使用習慣的對話模型。

針對不同規模模型,他設計了“四階段進化論”和“知識蒸餾”策略,使Qwen模型在長文本生成、復雜推理及多模態理解等任務上表現優異。

從“阿里星”到后訓練負責人,郁博文的成長軌跡映射出中國AI人才培養的縮影,也讓他發展成行業爭搶的稀缺資源。

離職導火索

業內猜測,郁博文的離職導火索在于阿里的架構調整。

3月初,阿里通義實驗室啟動了組織架構調整,計劃將原本垂直整合的Qwen團隊拆分為預訓練、后訓練、文本、多模態等多個平行的水平分工模塊。這一調整導致郁博文的管理范圍大幅縮小,且與其堅持的“預訓練與后訓練必須深度耦合”的技術理念產生沖突。

與此同時,阿里高層對千問團隊施加的商業化考核壓力也在加劇團隊內部的分歧。有內部人士透露,阿里讓基礎大模型研發的開源團隊將日活躍用戶數(DAU)作為重要考核指標,這讓團隊被迫將大量精力放在做紅包活動、簡化模型功能、對接阿里生態的消費場景上。

這種從技術優先轉向業務優先的調整,與林俊旸、郁博文等核心技術人員堅持的“極致開源、商用零成本”理念有著直接的沖突。林俊旸曾多次在內部強調,預訓練、后訓練乃至Infra和訓練團隊應該更緊密地結合和溝通。

字節的算盤

郁博文加入的字節Seed團隊,是字節跳動AI研發的核心部門,目前負責人為吳永輝博士,此前曾任Google DeepMind研究副總裁,參與Gemini大模型研發。吳永輝于2025年2月正式加入字節跳動,并接管Seed團隊,直接向字節跳動CEO梁汝波匯報。

Seed部門研究方向涵蓋大語言模型(LLM)、語音、視覺、世界模型、基礎架構、AI Infra及下一代AI交互等領域,其研發的豆包大模型已應用于50余個場景。該團隊聚焦多模態技術突破,已迭代推出Seed 2.0系列基礎模型、Seedance 2.0視頻生成模型、Seed3D 1.0 3D生成模型等核心成果。

郁博文的加入無疑將強化字節在視覺與多模態交互方面的后訓練能力。他在Qwen系列Chat模型研發中積累的監督微調、強化學習、直接偏好優化等技術經驗,正是字節在多模態模型對齊和精調方面急需的核心能力。

值得注意的是,郁博文將加入的“多模態交互與世界模型”部門,正是由前阿里千問技術負責人周暢所在。也就是說,字節正在系統性地構建一個由阿里千問核心骨干組成的多模態技術團隊。

在大模型競爭進入深水區的今天,后訓練專家的價值正在被重新評估和爭奪。

預訓練決定了模型的知識廣度和基礎能力,而后訓練則決定了模型的實際可用性、安全性和用戶體驗。一個優秀的后訓練專家,能夠通過精妙的算法設計和工程實現,將龐大的基礎模型轉化為真正可用的產品。

字節連續挖角阿里千問后訓練核心骨干,反映出其在AI戰略上的清晰思路。不僅要追趕基礎模型能力,更要在模型實用化、產品化方面建立優勢。這與字節一貫的產品驅動文化高度契合。

后記

在這場沒有終點的AI競賽中,唯一不變的是對頂尖人才的渴望與爭奪。而那些能夠為頂尖人才提供技術理想與成長空間的企業,將在長期競爭中占據優勢。

正如《三體》中所言,“給歲月以文明,而不是給文明以歲月”。在AI這場技術革命中,真正稀缺的不是算力與數據,而是那些能夠“給模型以靈魂”的后訓練專家。當大模型從“大力出奇跡”走向“精雕細琢”時,決定勝負的已不再是參數規模,而是讓AI真正理解人類意圖的那雙“看不見的手”。

聲明: 本網站所刊載信息,不代表OFweek觀點。刊用本站稿件,務經書面授權。未經授權禁止轉載、摘編、復制、翻譯及建立鏡像,違者將依法追究法律責任。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號