22/05/2026 15:25
【AI】美團開源數字人視頻生成模型LongCat-Video-Avatar 1.5,生成10秒視頻僅需1分鐘
美團(03690)技術團隊今日正式開源了其數字人視頻生成模型LongCat-Video-Avatar 1.5。該版本在唇形同步、物理合理性、長視頻穩定性、多人互動及推理效率方面均實現了升級,旨在推動數字人視頻生成從「高擬真」走向「真可用」的商業化場景。該版本在1.0版本的基礎上完成全面升級,定位從「開源SOTA」走向「商業級應用」。
據介紹,這一版本在基礎體驗上進行了強化,能夠應對長句、快語速、歌唱等複雜語音輸入,使唇部運動更精準平滑,同時面部表情、頭部姿態與肢體動作也更為協調。
在場景支持方面,借助高質量數據體系,模型可穩定處理真人、動漫、動物等多種主體,並在多人對話場景中自然區分說話者與聆聽者。
推理部署方面,LongCat-Video-Avatar 1.5採用DMD蒸餾技術,將生成步數從50步壓縮至8步,推理效率提升約15倍,生成一段10秒視頻僅需約1分鐘。
《經濟通通訊社22日專訊》
據介紹,這一版本在基礎體驗上進行了強化,能夠應對長句、快語速、歌唱等複雜語音輸入,使唇部運動更精準平滑,同時面部表情、頭部姿態與肢體動作也更為協調。
在場景支持方面,借助高質量數據體系,模型可穩定處理真人、動漫、動物等多種主體,並在多人對話場景中自然區分說話者與聆聽者。
推理部署方面,LongCat-Video-Avatar 1.5採用DMD蒸餾技術,將生成步數從50步壓縮至8步,推理效率提升約15倍,生成一段10秒視頻僅需約1分鐘。
《經濟通通訊社22日專訊》
【香港好去處】2026去邊最好玩?etnet為你提供全港最齊盛事活動,所有資訊盡在掌握!► 即睇
-
上一篇
恒指升219點收報25606再失牛熊線,北水流出65億元,環球鼓舞惟港股連續第二周下跌 22/05/2026 16:13
-
下一篇
恒指半日升309點報25696,聯想季績極振奮股價飆,資金輪動內需股失落 22/05/2026 12:06
-
《異動股》海底撈插7%康師傅挫5%,資金輪換下內需股集體捱沽 22/05/2026 10:31
-
恒指高開255點報25641返牛熊線僅三藍籌跌,聯想績後高開近半成 22/05/2026 09:22
-
《盤前攻略》美伊消息混亂惟環球傾向樂觀,港股目標守穩25200及修復牛熊線 22/05/2026 09:10
-
科技股|阿里稱AI業務進入商業化回報周期,股價不升反跌,舊科技股未屆吸納時? 21/05/2026 17:28
-
【科技股】阿里稱AI業務進入商業化回報周期,股價不升反跌,舊科技股未屆吸納時? 21/05/2026 16:30
備註︰
即時報價更新時間為 22/05/2026 18:00
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站