21/08/2025 17:48

【ＡＩ】百度升級蒸汽機視頻生成模型，多人有聲視頻一體生成

　　《經濟通通訊社駐京記者黃燕明２１日北京專電》百度（０９８８８）舉行發布會宣布，蒸
汽機（ＭｕｓｅＳｔｅａｍｅｒ）音視頻一體化模型完成重大升級，在行業內首次實現多人有聲
視頻一體化生成。其Ｔｕｒｂｏ版、Ｌｉｔｅ版、Ｐｒｏ版及全系有聲版全面開放，用戶可通過
百度搜索「百度蒸汽機」或登錄「繪想」平台體驗，企業用戶可在千帆平台享受高性能視頻生成
服務。　
　
　　百度蒸汽機於７月２日正式發布，發布首日平均每分鐘超百人申請，２周內註冊用戶超３０
萬。
　
＊已在多個場景落地應用，定價低至行業７０％＊
　
　　據介紹，百度蒸汽機是全球首個中文音視頻一體化生成的Ｉ２Ｖ模型，其首創多模態潛在空
間規劃技術（Ｌａｔｅｎｔ　Ｍｕｌｔｉ－ＭｏｄａｌＰｌａｎｎｅｒ），能夠自主協調多角色
身份、情感與互動邏輯；同時深度中文場景適配，以超９８％的還原度精準呈現中文語音細節與
情感表達。在效果上能夠實現電影級高清視頻畫面、逼真環境音效和自然人物語音的同步輸出。
百度同時表示，該系列大模型已經在百度搜索、營銷等多個場景落地應用，且定價低至行業
７０％。
　
　　業內人士認為，除了質量提升，百度蒸汽機２﹒０也帶來了創作成本大幅下降。國際知名視
效指導姚騏在此次發布會現場展示了其用百度蒸汽機２﹒０製作的科幻短片《歸途》，並指「蒸
汽機讓好萊塢級大片鏡頭不再需要百萬預算」。

