AI視頻生成，狂飆洗牌九十天

模型能力和商業化落地狂飆猛進的三個月。

文｜任曉漁

編｜徐鑫

過去90多天里，AI視頻生成賽道經歷了一場密集競速和狂飆。

“我們產品版本每天都在更新，恨不得上午一個版，下午一個版”，AI視頻創作平臺MovieFlow聯合創始人梁巍告訴數智前線，今年以來他們更新迭代速度非常迅猛，一個邀測版本推出不久，后面還有五六個版本排隊等發布。

這種緊迫感并非個例。

基模廠商自不必提。從年初Seedance 2.0刷新行業標準，到賽道開啟者OpenAI關停Sora，之后是可靈AI在3月快手財報會上披露ARR突破3億美元，進入4月伊始匿名黑馬HappyHorse 1.0登頂Artificial Analysis視頻競技場排行榜后阿里認領……過去三個月，這條賽道在模型能力和商業化落地上正經歷著一場劇烈震蕩。

伴隨著基模以周為單位的更新迭代，圍繞著多模態生成的產業鏈中下游也隨之產生了連鎖反應。

一方面，基模能力進步正快速拉高創作者的下限，一些此前受限于團隊下限很難實現的多團隊快速協同現在有了實現可能，AI影視等場景里工業化流程正加速到來。

另一方面，中下游的應用服務商也在這場競速中加速卷起來，產品推新節奏加快，行業的轉化鏈路都也被極快催化，比如AI短劇賽道快速洗牌，一些公司入場即退場。下游的產品使用者們也敏銳追蹤著模型和產品能力的最新，一位用戶告訴數智前線，一旦確認某類場景里性能更優、價格更劃算，他們“不會有任何包袱，會在一夜之間完成切換”。

各領風騷一百天

過去三個月里，多模態生成賽道可謂風云變幻。

年初Seedance 2.0橫空出世，評測視頻刷屏之后，不少業界人士都將之視作劃時代的產品。

“這是人類歷史上第一次AI視頻有可能完全代替人類傳統影視工作流的起點。AI真正做到了自動化地把剪輯、特效后期等傳統流程都在中前期直接融合。"有好萊塢特效從業背景、現任某AI影視公司特效總監的姜來在一檔播客節目提到，Seedance2.0將極大加速AI影視的工業化進程。

電商爆款視頻AI工具企業Create OK合伙人張錦也在Seedance2.0發布一周測了幾個實操過的Case，感受到了它的SOTA能力。張錦告訴數智前線，“在真人感上跟Sora2差不多，相比之前的Seedance 1.5有質的提升。而且根據參考圖/參考視頻的demo，可以精確地參考人物形象和視頻動作，生成特定的打斗動作，當時其他模型完全做不到這一點”。

但行業領先者的出現并不意味著戰爭已經結束。實際上，今年以來這一賽道的迭代和演進反而前所未有的加速，正以周為單位高速輪替。

從1月底可靈3.0和Vidu Q3先后落地，到2月初xAI Grok Imagine以低價切入投流場景，再到2月中Seedance 2.0以斷檔領先的表現重置行業認知——這一切發生在不到四周之內。

3月，谷歌Veo 3.1 Lite和Grok同步把海外API定價壓到0.05美元每秒，同月Sora正式關停。4月，阿里密集出牌：Wan 2.7落地、HappyHorse匿名屠榜后揭曉身份、月底灰度上線開放API。其間愛詩科技發布影視專項模型PixVerse C1，百度開源ERNIE-Image。不到三個月，全球主要玩家幾乎都有動作，實現了一個完整的代際輪替。

領先模型的能力，在快速更迭下很快就成為了行業標配。比如音畫同步，從去年底可靈2.6落地到今年1月Vidu Q3和可靈3.0跟進，2月Seedance 2.0將其做到"原生聯合生成"高度，4月HappyHorse又以開源姿態加入，不到半年，這項能力已從“差異化賣點”變成了行業標配。

另外，多參模式曾是Vidu在影視內容生產時鎖定生成畫面一致性的殺手锏，但很快Seedance等頭部模型就跟進整合到了最新版本里。

愛詩科技企服負責人孫偉哲在今年3月的一場行業峰會演講中將基模的進步和快速迭代描述為“各領風騷一兩個月”。孫偉哲稱行業高速迭代是這一領域常態，“過去兩年行業一直在快速迭代，一兩個月之后時間窗口也就過去了。”

與基模快速迭代同步的是商業化挑戰也前所未有——3月底OpenAI正式宣布關停Sora。作為視頻生成賽道的開啟者，也是全球AI視頻產品標桿，此前Sora2上線2個月時曾傳出其60天用戶留存率接近零。海外媒體還報道Sora日均推理成本約1500萬美元，總生命周期收入僅約210萬美元。

目前大模型落地應用標桿在代碼生成等場景，Anthropic旗下的Claude Code今年年初ARR突破25億美元，有分析稱OpenAI關停Sora原因之一也是要聚焦精力到收益轉化更為突出的企業級產品如代碼生成等賽道。

隨著Sora關停，在算力成本是文本大模型數十倍甚至上百倍的多模態生成賽道，如何更好完成商業化落地和應用是所有廠商的必答題。Sora的失敗揭示了獨立的消費級視頻產品在當前算力成本下的挑戰，倒逼其他廠商加速構建閉環鏈路。

海外，Google 3月底在Marketing Live大會上宣布，正式將生成式視頻模型Veo整合至Google Ads的素材工坊（Asset Studio）中。國內廠商字節先是在剪映等字節跳動系產品里內測產品，之后又宣布將Seedance模型整合到了國際版capcut之中，并且字節采取了B端和C端兩條腿并重的策略，推出了分層定價方案，隨著C端需求火爆模型調用價格還出現了多次調整和上漲。

AI視頻創業公司也在今年重視與行業和場景需求更緊密結合。愛詩科技孫偉哲提到，他們去年開始強調落地，今年加速貼近場景和需求端，將企業服務作為重要方向，推出面向影視行業的C系列專有模型，同時與芒果TV、掌閱等內容平臺深度合作。

這些動作意味著，生態優勢和內容-流量-變現的閉環對于多模態生成場景的競爭已經越來越重要。IDC一份報告中也指出，炫技時代結束，實用、可控、可落地才是核心競爭力國產模型廠商清空了浮躁的對標焦慮，卻也讓全球賽道進入了更殘酷的“自研淘汰賽”。

抽卡率下降十倍，價格漲了近五倍

伴隨著基模領域高速迭代和商業落地提速的，是中下游應用生態的快速變化。

一方面，隨著模型能力快速提升，在影視制作場景工業化進程大大加速，完成了從原來的“開盲盒”到“工業化精準創作”的轉變，這將拓寬AI視頻的應用場景。

AI影視創作者姜來提到，以前“想做多團隊快速協同是很復雜和困難的事情，生產質量可能參差不齊，效率很容易被個體的下限所拖累”。而基模能力提升，像Seedance 2.0這樣的模型具備了自動分鏡、音畫同步、多鏡頭敘事等能力，“模型的鏡頭語言已經比普通分鏡師的質感要好”。

這讓多團隊以動態分鏡為核心進行標準化協作有了可能，大大加速AI影視的工業化流程。以前AI視頻領域是自媒體創作者之間競爭，今年專業影視制作團隊會下場，姜來認為，今年是專業AI從業者與個人創作者之間會拉開水平差距的一年。

誼燊影視創始人楊晨亮告訴數智前線，seedance 2.0大大降低了抽卡率，影視制作場景從開盲盒，有望走向精準創作，“Seedance 2.0出來后，整個AI短劇領域鏈條的運作模式都變了”。

在此之前，模型能力不夠導致做成想要的畫面需要大量抽卡，抽卡比例最差時達到1:20。這使得短劇或漫劇制作需要大量抽卡師。這種機制下不少承制方甚至跟一些高校合作，用實習生來降低人力成本，通過實習生來完成抽卡。

而模型能力大幅提升后，抽卡的比例大幅下降到了1:2左右，經常只要有一兩次抽卡就能出現符合目標的場景和畫面。這使得抽卡師的角色不再必要，但是來負責生成的角色需要有導演思維、鏡頭感、畫面審美的執行導演來完成。

“抽卡率大幅下降，但是單次調用的成本變高了，比如Seedance 2.0，720P畫質1秒1元左右，它相比之前大概貴了五倍左右，廢片率比之前降低十倍，可用性大幅提升。”不過，楊晨亮也認為，雖然工具在不斷迭代升級，影視制作還是要做資產，分鏡等，無論工具迭代速度如何，最終決定生產質量的依然是制作人員的影視制作專業能力。

“今年到明年，傳統影視里面AI畫面占比會占到50%左右。”MovieFlow聯合創始人梁巍觀察，基模能力提升不只是Seedance獨有，全球范圍內多模態模型的快速進化迭代，將使得接下來影視制作方式有望發生極大變化。一部電影原來從交劇本到拍攝，籌備的過程大概要幾個月，現在完全可以5天用AI要拍攝的電影先做一遍，然后再去看真正實拍的部分哪些要拍，哪些不用拍。

同樣的邏輯也在電商廣告場景里上演。多模態基模能力進步，讓長時長、自由態數字人的復雜指令控制變得可能，電商數字人場景今年數字人正從“站樁念稿”能做到“手持商品、實時換裝”。一位電商直播數字人服務商此前告訴數智前線，從業者估算2026年直播數字人市場規模相比去年會翻倍。

另一方面，基模快速迭代，內容供給端能力打開，吸引了更多元的入局者，這帶來了模型調用量劇烈增長和內容產能大爆炸。但需求端并未隨之同步增長，下游的商業變現競爭激烈程度不言而喻。

騰訊視頻孫忠懷此前就提到，在AI時代，內容供給將出現十倍甚至百倍級增長，但觀眾注意力不會同比增長。

DataEye數據則顯示，2025年全年上線漫劇60946部，其中播放量破億的僅96部，爆款率只有0.16%。到2026年2月，在播漫劇數量已暴漲至12萬部，一個月的規模是去年全年的兩倍水平，但破億作品不足150部，爆款率進一步跌至0.12%。

這也造就了過去幾個月AI視頻賽道里的生存奇觀——Token調用規模量攀升，生成時間大排隊，調用價格一再上漲，但AI漫劇分成比例下調，超九成AI短劇公司在虧損。

整個賽道狂飆猛進，產業鏈上下游快速磨合，“行業迭代速度很快，快到你根本沒辦法在這么短的時間內定出一個模式來。等有了初步的熟悉模式，發現技術又迭代了，模式馬上又要變。”楊晨亮說。

縫隙里吹氣球和正在擴大的市場

AI視頻創作應用過去幾個月里也在快速調整和適應市場的變化。

Sora退出，就讓一些應用商快速調整了產品介紹和定位。數智前線觀察，有廠商此前主打Sora2工作流來服務下游電商用戶，Sora2線下后，他們很快改了產品介紹頁面，更突出產品能力和實現的效果而不是基模。

基模能力的快速進步，也在吞噬一些原本屬于應用層的harness能力，它要求AI視頻應用要快速調整業務的工作流。

CreatOK張錦介紹，以前模型一致性能力不夠，分鏡的理解也不高，復雜的片段只能用首尾幀一個片段一個片段地生成，再組合。這幾個月里大多場景可以一次生成了，這使得他們改變了原來的拼接工作流，把生成這個環節更多交給模型。“這是好事，讓我們盡可能早的避免去做一些必定會被模型淹沒的事。”張錦說。

市場快速演進之下，應用廠商的產品更新速度和頻次也在加快。MovieFlow最近推出的Studio版是一個面向專業創作者推出的高階產品線，對影視工業化流程能精細控制，支持從前期預演、分鏡規劃到多鏡頭敘事的全鏈路操作。梁巍告訴數智前線，目前Studio版還處于邀請碼內測階段，但后面已經等著五六個版本要發，“真的是每天都在更新。我們現在網站每天發版，恨不得上午一個版本，下午一個版本。”

這種迭代速度已成當下大模型應用創業的一個突出特點。梁巍認為，目前全社會感知到AI能力的只是一小撮人，但技術進步的奇點到來的速度前所未有地迅猛，這倒逼創業者的認知和行動都得跟上，也形成了巨大的考驗，“你要能承受住這么大的節奏和壓力”。

外界還觀察到，基模廠商為構建閉環鏈路，在AI應用端的動作也不少，也有可能擠壓中間層應用商的生存空間。比如字節的即夢、剪映和豆包（最近的付費會員版）都集成了Seedance2.0的核心視頻生成能力，阿里的千問內也整合了Wan和HappyHorse的能力。

這考驗應用平臺如何在市場和基模能力之間構建差異化的產品和服務。

不過，梁巍認為，大模型再怎么持續進步，距離真正到場景用戶手里，變成一個用戶真正能用的產品，中間還是有縫隙的。這個縫隙可能會隨著時間推移和模型能力進步而相對會越來越窄，但它將始終存在。

“我們相當于在縫里面吹氣球，要把這個氣球吹起來，考驗的是能多快速地把氣球構建起來。”他用了一個比喻，認為應用方要在技術和市場之間去找到一個平衡，然后快速行動。

張錦也坦言，純做生成的價值會逐漸變小，模型會生成一切，但用戶要的始終是交付某個場景下的結果。未來模型能力是平權的，比的是誰更好駕馭模型以及用在對的地方。“我們要做和積累的是更深刻的洞察用戶場景、更多的積累公域和用戶數據、讓模型更方便的獲得優質的用戶上下文，生成能力則全部交還給模型。”

應用服務商們看到的并非全是壓力和挑戰，還有一個正在打開的巨大的市場空間。

雖然隨著模型進步，相對的縫隙在變小，但是整個多模態生成模型和應用構建的生態的想象空間在持續擴大。整個多模態模型的應用市場才剛剛打開，這也使得不少從業者認為，應用層還遠未到你死我活的飽和競爭狀態。

比如，梁巍看到，多模態能力還有望成為一種新的藝術載體，創造新的內容消費方式。他認為，今年三季度，視頻多模態模型將徹底解決表演問題，AI生成的人物表演將與真人難以區分。隨著多模態能力到位，除了影視制作能開拍前預演，大大提升影視工業化水平，許多從來沒機會得到呈現的故事也有可能基于多模態能力而被呈現到大眾面前，也會打開新的市場空間。

“漫劇可能只是模態生成能力的1%應用，另外的99%的潛力還沒有真正意義上展現出來。”梁巍提到，他們從今年二季度開始在產品端快速動作之外，也在加大市場推廣和營銷動作。

無論是大眾場景還是企業端視頻制作需求以及廣告制作場景，多模態模型能力滲透才剛剛開始，“AIdeo時代的諾蘭、張藝謀、郭帆都還沒有出現”，梁巍說。