05/12/2025 16:57

【AI】豆包語音識別模型2.0發布,推理能力提升,支持日韓德等13種外語

  火山引擎今日正式發布豆包語音識別模型2.0(Doubao-Seed-ASR-2.0)。

  據介紹,該模型依托Seed混合專家大語言模型架構構建,2.0版本模型推理能力提升,可以通過深度理解上下文完成精準識別,上下文整體關鍵詞召回率提升20%;支持多模態視覺識別,在「聽得懂」的同時「看得懂」,通過單圖和多圖等視覺信息輸入提升文字識別精準度。

  同時,該版本支持日語、韓語、德語、法語等13種海外語種的識別,並且重點針對專有名詞、人名、地名、品牌名稱及易混淆多音字等複雜場景進行了升級。
《經濟通通訊社5日專訊》

【你點睇?】大埔宏福苑五級火造成嚴重死傷,你認為是否涉及重大監管漏洞?全港仍有多幢舊樓及屋邨正進行維修,為防慘劇重演,你認為應當如何加強承建商防火責任及規管?► 立即投票

專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

etnet初心不變 風雨無阻 與你並肩投資路,立即加入成為etnet YouTube頻道會員!

獨家優惠【etnet x 環球海產】 用戶專享全場95折,特價貨品更可折上折,立即選購五星級酒店御用海鮮!

樂本健 x etnet健康網購 | 購物滿額即送免費禮品

貨幣攻略

大國博弈

關稅戰

說說心理話

Watch Trends 2025

北上食買玩

Wonder in Art

理財秘笈

山今養生智慧

輕鬆護老

照顧者 情緒健康