02/12/2025 08:30

【AI】DeepSeek發布兩款新模型,推理能力直逼GPT-5

  昨日晚間,DeepSeek發布兩款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

  據了解,V3.2在工具呼叫能力上達到目前開源模型最高水平,大幅縮小開源模型與閉源模型的差距。在推理能力方面,V3.2在數學基準(AIME 2025)測試中達到93.1%的通過率,接近GPT-5的94.6%和Gemini-3.0-Pro的95%。V3.2-Speciale是V3.2的長思考增強版,具備更好的指令跟隨、數學證明與邏輯驗證能力。

  V3.2的目標是平衡推理能力與輸出長度,適合日常使用,例如問答場景和通用Agent任務場景。V3.2-Speciale的目標是將開源模型的推理能力推向極致,探索模型能力的邊界。

  DeepSeek表示,目前,DeepSeek-V3.2-Speciale僅供研究使用,不支持工具調用,暫未針對日常對話與寫作任務進行專項優化。
《經濟通通訊社2日專訊》

【你點睇?】大埔宏福苑五級火造成嚴重死傷,你認為是否涉及重大監管漏洞?全港仍有多幢舊樓及屋邨正進行維修,為防慘劇重演,你認為應當如何加強承建商防火責任及規管?► 立即投票

專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

etnet初心不變 風雨無阻 與你並肩投資路,立即加入成為etnet YouTube頻道會員!

獨家優惠【etnet x 環球海產】 用戶專享全場95折,特價貨品更可折上折,立即選購五星級酒店御用海鮮!

樂本健 x etnet健康網購 | 購物滿額即送免費禮品

貨幣攻略

大國博弈

關稅戰

說說心理話

Watch Trends 2025

北上食買玩

Wonder in Art

理財秘笈

山今養生智慧

輕鬆護老

照顧者 情緒健康