22/05/2026 15:25
【AI】美團開源數字人視頻生成模型LongCat-Video-Avatar 1.5,生成10秒視頻僅需1分鐘
美團(03690)技術團隊今日正式開源了其數字人視頻生成模型LongCat-Video-Avatar 1.5。該版本在唇形同步、物理合理性、長視頻穩定性、多人互動及推理效率方面均實現了升級,旨在推動數字人視頻生成從「高擬真」走向「真可用」的商業化場景。該版本在1.0版本的基礎上完成全面升級,定位從「開源SOTA」走向「商業級應用」。
據介紹,這一版本在基礎體驗上進行了強化,能夠應對長句、快語速、歌唱等複雜語音輸入,使唇部運動更精準平滑,同時面部表情、頭部姿態與肢體動作也更為協調。
在場景支持方面,借助高質量數據體系,模型可穩定處理真人、動漫、動物等多種主體,並在多人對話場景中自然區分說話者與聆聽者。
推理部署方面,LongCat-Video-Avatar 1.5採用DMD蒸餾技術,將生成步數從50步壓縮至8步,推理效率提升約15倍,生成一段10秒視頻僅需約1分鐘。
《經濟通通訊社22日專訊》
據介紹,這一版本在基礎體驗上進行了強化,能夠應對長句、快語速、歌唱等複雜語音輸入,使唇部運動更精準平滑,同時面部表情、頭部姿態與肢體動作也更為協調。
在場景支持方面,借助高質量數據體系,模型可穩定處理真人、動漫、動物等多種主體,並在多人對話場景中自然區分說話者與聆聽者。
推理部署方面,LongCat-Video-Avatar 1.5採用DMD蒸餾技術,將生成步數從50步壓縮至8步,推理效率提升約15倍,生成一段10秒視頻僅需約1分鐘。
《經濟通通訊社22日專訊》
獨家優惠【etnet x 環球海產】用戶專享全場95折,特價貨品更可折上折。立即使用優惠代碼【ETN1WWS】,選購五星級酒店級海鮮► 立即瀏覽
-
上一篇
《本港樓市》經絡:料下月美聯儲議息會議按兵不動,HIBOR… 22/05/2026 15:33
-
下一篇
《異動股》聯想集團-R曾升逾兩成破頂,現報13﹒71人幣 22/05/2026 15:22
-
恒指升219點收報25606再失牛熊線,北水流出65億元,… 22/05/2026 16:13
-
《本港樓市》中原CCL按周升0.86%,連升5周共2.49%,今年樓價升幅近一成 22/05/2026 16:02
-
《本港樓市》嘉里合作發展海盈山第4B期最快下月推價單單位 22/05/2026 15:34
-
《異動股》聯想升幅擴大至近兩成,花旗讚產品組合表現佳及ISG毛利率轉正 22/05/2026 15:15
-
《異動股》聯想集團(992)曾升逾兩成破頂,現報15﹒78元 22/05/2026 15:15
備註︰
即時報價更新時間為 22/05/2026 17:35
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站