22/05/2026 15:25
【AI】美團開源數字人視頻生成模型LongCat-Video-Avatar 1.5,生成10秒視頻僅需1分鐘
美團(03690)技術團隊今日正式開源了其數字人視頻生成模型LongCat-Video-Avatar 1.5。該版本在唇形同步、物理合理性、長視頻穩定性、多人互動及推理效率方面均實現了升級,旨在推動數字人視頻生成從「高擬真」走向「真可用」的商業化場景。該版本在1.0版本的基礎上完成全面升級,定位從「開源SOTA」走向「商業級應用」。
據介紹,這一版本在基礎體驗上進行了強化,能夠應對長句、快語速、歌唱等複雜語音輸入,使唇部運動更精準平滑,同時面部表情、頭部姿態與肢體動作也更為協調。
在場景支持方面,借助高質量數據體系,模型可穩定處理真人、動漫、動物等多種主體,並在多人對話場景中自然區分說話者與聆聽者。
推理部署方面,LongCat-Video-Avatar 1.5採用DMD蒸餾技術,將生成步數從50步壓縮至8步,推理效率提升約15倍,生成一段10秒視頻僅需約1分鐘。
《經濟通通訊社22日專訊》
據介紹,這一版本在基礎體驗上進行了強化,能夠應對長句、快語速、歌唱等複雜語音輸入,使唇部運動更精準平滑,同時面部表情、頭部姿態與肢體動作也更為協調。
在場景支持方面,借助高質量數據體系,模型可穩定處理真人、動漫、動物等多種主體,並在多人對話場景中自然區分說話者與聆聽者。
推理部署方面,LongCat-Video-Avatar 1.5採用DMD蒸餾技術,將生成步數從50步壓縮至8步,推理效率提升約15倍,生成一段10秒視頻僅需約1分鐘。
《經濟通通訊社22日專訊》
【你點睇?】據報英國首相施紀賢正考慮辭任,你認為英國政局短期內會否持續動盪? ► 立即投票
-
上一篇
《中國要聞》王毅下周赴美主持聯合國安理會高級別會議,隨後訪問加拿大 22/05/2026 15:30
-
下一篇
《提振消費》深圳:對購買智能家居產品補貼15%,每人每件最高1500元 22/05/2026 15:16
-
《駐京專電》商務部等5部門調整《向特定國家出口易製毒化學品管理目錄》 22/05/2026 16:02
-
《中國監管》AI驅動股價上漲引監管關注,傳多家上市公司被問詢 22/05/2026 15:52
-
《大灣區》中科宇航創新研究院落地廣州黃埔,重點布局太空製造等 22/05/2026 15:46
-
《B股行情》上證B股指數收升0.8%,深證B平收 22/05/2026 15:09
-
《A股行情》滬綜指收升0.87%返四千一,本周仍跌0.5%連挫兩周 22/05/2026 15:03