DeepSeek發布兩款新模型，推理能力直逼GPT-5 - etnet 經濟通 Mobile|香港新聞財經資訊和生活平台

02/12/2025 08:30

【ＡＩ】DeepSeek發布兩款新模型，推理能力直逼GPT-5

　　昨日晚間，DeepSeek發布兩款新模型：DeepSeek-V3.2和DeepSeek-V3.2-Speciale。

　　據了解，V3.2在工具呼叫能力上達到目前開源模型最高水平，大幅縮小開源模型與閉源模型的差距。在推理能力方面，V3.2在數學基準(AIME 2025)測試中達到93.1%的通過率，接近GPT-5的94.6%和Gemini-3.0-Pro的95%。V3.2-Speciale是V3.2的長思考增強版，具備更好的指令跟隨、數學證明與邏輯驗證能力。

　　V3.2的目標是平衡推理能力與輸出長度，適合日常使用，例如問答場景和通用Agent任務場景。V3.2-Speciale的目標是將開源模型的推理能力推向極致，探索模型能力的邊界。

　　DeepSeek表示，目前，DeepSeek-V3.2-Speciale僅供研究使用，不支持工具調用，暫未針對日常對話與寫作任務進行專項優化。
《經濟通通訊社2日專訊》

【你點睇？】大埔宏福苑五級火造成嚴重死傷，你認為是否涉及重大監管漏洞？全港仍有多幢舊樓及屋邨正進行維修，為防慘劇重演，你認為應當如何加強承建商防火責任及規管？► 立即投票

【ＡＩ】DeepSeek發布兩款新模型，推理能力直逼GPT-5

【ＡＩ】英偉達斥２０億美元入股新思科技 02/12/2025 08:59

【ＡＩ】小紅書據報繞道使用英偉達高階AI晶片，安裝於日本數據中心 01/12/2025 15:56

其他ＡＩ

【ＡＩ】蘋果AI表現欠佳，負責人John Giannandrea將卸任 02/12/2025 13:19

【ＡＩ】阿里巴巴Qwen-Image模型更新，千問App首發接入 02/12/2025 12:02

【ＡＩ】福建：推進算力基建，加強與粵港澳大灣區算力資源對接引流 02/12/2025 11:34

【ＡＩ】中興手機搭載豆包ＡＩ，可跨平台比價點外賣、自動回消息 01/12/2025 14:50

【ＡＩ】「豆包」１０月下載量達１１４０萬次，穩居榜首 01/12/2025 09:51