22/05/2026 15:25
【AI】美團開源數字人視頻生成模型LongCat-Video-Avatar 1.5,生成10秒視頻僅需1分鐘
美團(03690)技術團隊今日正式開源了其數字人視頻生成模型LongCat-Video-Avatar 1.5。該版本在唇形同步、物理合理性、長視頻穩定性、多人互動及推理效率方面均實現了升級,旨在推動數字人視頻生成從「高擬真」走向「真可用」的商業化場景。該版本在1.0版本的基礎上完成全面升級,定位從「開源SOTA」走向「商業級應用」。
據介紹,這一版本在基礎體驗上進行了強化,能夠應對長句、快語速、歌唱等複雜語音輸入,使唇部運動更精準平滑,同時面部表情、頭部姿態與肢體動作也更為協調。
在場景支持方面,借助高質量數據體系,模型可穩定處理真人、動漫、動物等多種主體,並在多人對話場景中自然區分說話者與聆聽者。
推理部署方面,LongCat-Video-Avatar 1.5採用DMD蒸餾技術,將生成步數從50步壓縮至8步,推理效率提升約15倍,生成一段10秒視頻僅需約1分鐘。
《經濟通通訊社22日專訊》
據介紹,這一版本在基礎體驗上進行了強化,能夠應對長句、快語速、歌唱等複雜語音輸入,使唇部運動更精準平滑,同時面部表情、頭部姿態與肢體動作也更為協調。
在場景支持方面,借助高質量數據體系,模型可穩定處理真人、動漫、動物等多種主體,並在多人對話場景中自然區分說話者與聆聽者。
推理部署方面,LongCat-Video-Avatar 1.5採用DMD蒸餾技術,將生成步數從50步壓縮至8步,推理效率提升約15倍,生成一段10秒視頻僅需約1分鐘。
《經濟通通訊社22日專訊》
【你點睇?】據報英國首相施紀賢正考慮辭任,你認為英國政局短期內會否持續動盪? ► 立即投票
-
上一篇
恒指升219點收報25606再失牛熊線,北水流出65億元,環球鼓舞惟港股連續第二周下跌 22/05/2026 16:13
-
下一篇
《異動股》聯想集團-R曾升逾兩成破頂,現報13﹒71人幣 22/05/2026 15:22
-
騰訊(00700)今斥5億回購113﹒2萬股 22/05/2026 17:39
-
《鍾之日記》智譜靠譜,聯想走揚 22/05/2026 17:00
-
【旅遊平台股】同程旅行首季多賺17%仍遭大行降目標,股價急插半成與攜程齊尋底,仍未可沾手? 22/05/2026 16:30
-
《異動股》聯想升幅擴大至近兩成,花旗讚產品組合表現佳及IS… 22/05/2026 15:15
-
《異動股》聯想集團(992)曾升逾兩成破頂,現報15﹒78元 22/05/2026 15:15
備註︰
即時報價更新時間為 22/05/2026 18:00
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站