【ＡＩ】阿里發布兩款語音新模型，可定制角色及模擬背景音

02/03/2026 14:16

　　3月2日，阿里發布兩款語音新模型，基於參考音頻的聲音克隆模型Fun-CosyVoice3.5和無參考音頻的音色設計模型Fun-AudioGen-VD。兩款模型均引入「指令遵循」能力，自由控制聲音的情感、語速、場景等，可用freestyle（自由風格模式）定制角色，適用於有聲書、遊戲、客服、播客、教育、直播等多個場景。即日起，用戶可在阿里雲百煉調用這兩款最新模型。

　　據了解，兩款模型在同尺寸模型的基準評測中斬獲多項SOTA。在Seed-TTS基準測試的中文「困難案例」指標中，Fun-CosyVoice3.5表現搶眼，詞錯誤率(Word Error Rate, WER)和說話人相似度(Speaker Similarity, SSIM)，均為最佳。同時，因為優化了「困難案例」的發音，生僻字句錯率由15.2%降低到5.3%。

　　官方介紹稱，兩款模型均支持通過自然語言指令控制語音生成，但應用方向不同：Fun-CosyVoice3.5支持自由風格模式指令控制，Fun-AudioGen-VD則專注「從無到有」的音色設計，其不僅能根據描述定制音色和情感，還能同步模擬複雜的聽覺環境。此外，Fun-CosyVoice3.5所用的tokenizer幀率減半，提高了訓練效率，並且首包延遲降低35%，大幅提升了實時交互體驗。
《經濟通通訊社2日專訊》

【說說心理話】「開心果」賈思樂於媽媽離世後患上抑鬱症，幸得朋友及早發現：「當你不開心的時候，最重要第一時間找朋友聊聊天」► 即睇

【ＡＩ】阿里發布兩款語音新模型，可定制角色及模擬背景音

《本港樓市》經絡：恒生銀行推３年定息按揭，買家有更多選擇對… 02/03/2026 14:32

《Ａ股焦點》比亞迪周四召開「顛覆性」技術發布會，ＡＨ股齊急漲 02/03/2026 14:14

其他相關新聞

【中東戰火】大新溫嘉煒:對香港經濟衝擊未必很大，維持今年香港經濟增長預測2.6% 02/03/2026 14:59

《Ａ股異動》中國石化Ａ漲停，現報７﹒１１元人幣 02/03/2026 14:57

【中東戰火】攜程、飛豬、去哪兒網、同程等助受影響用戶退款退訂 02/03/2026 14:44

《異動股》比亞迪曾升逾５％突破１００天線，現報９９﹒５元 02/03/2026 14:09

《異動股》比亞迪逆市升４％，上月交付量急跌惟將召開顛覆性技… 02/03/2026 14:04