DeepSeek | FOCUS | DeepSeek-V3.2再革新,硬撼閉源算力躍進

02/12/2025

  OpenAI旗下閉源大模型ChatGPT迎來3歲生日之際,中國「開源之神」DeepSeek周一(1日)傍晚發布兩款新模型「贈興」--DeepSeek-V3.2及DeepSeek-V3.2-Speciale,不僅完美展示思考有多快、推理有多深,且續維持令人驚嘆的成本效益,被視作開源大模型引領AI平權的又一里程碑。

 

GPT5用戶破8億,惟接連翻車

 

  當ChatGPT的周活躍用戶突破8億,8月登場的旗艦模型GPT‑5卻接連翻車,包括將簡單方程「5.9 = X + 5.11」解作「X=-0.21」,把俄勒岡州(Oregon)標為「Onegon」……引發僅是GPT-4o「換皮」、實則毫無突破的猜疑。

 

DeepSeek  | FOCUS | DeepSeek-V3.2雙模革命,硬撼閉源算力大躍進

8月登場的旗艦模型GPT‑5接連翻車。

 

 

  不過,剛橫空出世的DeepSeek-V3.2,不僅正確解答「猴子有666根香蕉,每次最多背66根香蕉,可是猴子每走1米就要吃1根香蕉,問猴子最多能走多遠?」這樣的經典「燒腦」題,更問鼎全球首個斬獲2025年「頂尖四賽(國際奧數、中國奧數、國際大學生設計總決賽、國際信息學奧林匹克)」金牌的大模型。

 

「稀疏注意力」機制提升效率

 

  能答題或許不算特殊本領,畢竟谷歌旗下Gemini 3亦擅長跑分/屠榜,並獲數學家陶哲軒認證,以10分鐘解決百年數學難題(Erdosproblem/367)。今次V3.2的最大突破,當屬引入「DeepSeek 稀疏注意力(DSA)」機制,大幅提升處理長上下文的效率。

 

DeepSeek  | FOCUS | DeepSeek-V3.2雙模革命,硬撼閉源算力大躍進

DeepSeek稀疏注意力(DSA)在MLA架構下的工作流程。

 

  例如,試想像DSA是位圖書館館長,當讀者提出「通俗解釋量子糾纏」的查詢,其既不會讀完圖書館裏每一本書的每一頁,來搜尋「量子糾纏」這個關鍵詞,也不會死板地徑直前往擺放物理學分類的書架,而是融會貫通精選科學、人文、歷史等適配書籍,並深度處理如何「通俗」解釋。

 

  此得益於V3.2配置的「閃電索引器(lightning indexer)」微型神經網絡,以及「細粒度選擇機制(fine-grained token selection mechanism)」,既大幅降低計算量,亦保持高準確率。

 

想得更深,成本僅為對手零頭

 

  除了V3.2又快、又好、又省,同日推出的V3.2-Speciale更旨在探究延伸思考的潛力,在強化學習中移除長度懲罰(length penalty),並整合早前DeepSeekMath-V2的數據集和獎勵機制,允許猜想、試錯、修正、自我驗證,相當於模拟人類探索式的深度推理。此正正是其在國際奧數、哈佛MIT數學競賽等跑贏GPT-5 High和Gemini-3 Pro的原因,惟世界級編程競賽等推理任務仍略輸於Gemini-3。

 

DeepSeek  | FOCUS | DeepSeek-V3.2雙模革命,硬撼閉源算力大躍進

DeepSeek-V3.2-Speciale在國際奧數、哈佛MIT數學競賽等跑贏GPT-5 High和Gemini-3 Pro。

 

  按每百萬Token輸出計,GPT-5需10美元,而DeepSeek-V3.2及V3.2-Speciale僅為0.42美元,相當於前者的零頭,再次印證中國開源大模型能憑藉獨特架構和訓練範式,超越西方閉源大模型單純的算力、參數軍備競賽。

 

  值得一提的是,DeepSeek僅將今次版本命名為V3.2(V3、V3.1分別為去年12月、今年8月發布),或意味就挑戰閉源模型的複雜任務(DeepSeek坦言,過去數個月,閉源模型和開源模型之間的效能差距正在擴大),V4將成扭轉戰局的關鍵一役,且拭目以待。

撰文:金子安

【說說心理話】認真地是旦、是旦地認真!精神科專科醫生許龍杰:一包薯片救宇宙?!要學會於物理上及心理上為自己建立一個「護城河」► 即睇

延伸閱讀

More
  • 道瓊斯工業平均指數
    升 48,044.36
    +193.42 (+0.404%)
  • 標準普爾500指數
    升 6,879.26
    +22.14 (+0.323%)
  • 納斯達克綜合指數
    升 23,593.25
    +88.12 (+0.375%)
精選預託證券 More
02318 中國平安
按盤價(HKD)︰升60.372
變動率︰+7.113%
較港股︰-0.13%
00688 中國海外發展
按盤價(HKD)︰升13.281
變動率︰+4.314%
較港股︰+0.77%
00001 長和
按盤價(HKD)︰跌55.701
變動率︰-2.520%
較港股︰-0.71%
00003 香港中華煤氣
按盤價(HKD)︰跌7.045
變動率︰-8.586%
較港股︰-1.88%
精選中資美股 More
BIDU 百度
按盤價(USD)︰升125.550
變動率︰+5.753%
GDS 萬國數據
按盤價(USD)︰升35.330
變動率︰+4.589%
ZTO 中通快遞
按盤價(USD)︰升21.815
變動率︰+3.832%
TAL 好未來
按盤價(USD)︰升11.275
變動率︰+1.577%
精選美股 More
MRNA
Moderna
按盤價(USD)︰升27.095
變動率︰+6.297%
CRM
賽富時
按盤價(USD)︰升260.910
變動率︰+5.435%
INTC
英特爾
按盤價(USD)︰升42.055
變動率︰+3.840%
NFLX
奈飛
按盤價(USD)︰跌99.705
變動率︰-3.405%
美國指數之報價延遲最少15分鐘。
美股之報價延遲最少15分鐘。
美國時間為 : 05/12/2025 13:47 EST
港股之報價延遲最少15分鐘,更新時間為:05/12/2025 17:59
美國指數之報價延遲最少15分鐘。
美國時間為 : 05/12/2025 13:47 EST
顯示更多
緊貼市況
  • 01380 中國金石
  • 0.670
  • 02477 經緯天地
  • 13.040
  • 03692 翰森製藥
  • 41.940
  • 01792 CMON
  • 0.059
  • 02587 健康之路
  • 4.860
  • 01050 嘉利國際
  • 2.800
  • 目標︰$4.00
  • 00883 中國海洋石油
  • 22.080
  • 目標︰$23.30
  • 02588 中銀航空租賃
  • 72.750
  • 目標︰$80.00
  • 03993 洛陽鉬業
  • 19.000
  • 目標︰$20.00
  • 02153 達豐設備
  • 0.990
  • 目標︰--
  • 01810 小米集團-W
  • 42.780
  • 09988 阿里巴巴-W
  • 155.000
  • 00700 騰訊控股
  • 610.000
  • 01024 快手-W
  • 69.200
  • 02318 中國平安
  • 60.450
  • 00762 中國聯通
  • 8.890
  • 目標︰$10.00
  • 02858 易鑫集團
  • 2.550
  • 目標︰$3.30
  • 00241 阿里健康
  • 5.440
  • 目標︰$6.70
品味生活
備註: 本地指數之報價為即時更新,資料更新時間為 05/12/2025 17:59
中國指數之報價為即時更新,資料更新時間為 05/12/2025 16:30
期指之報價為即時更新,資料更新時間為 06/12/2025 02:46
緊貼市況之報價延遲最少15分鐘,資料更新時間為 05/12/2025 16:40
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站
放大顯示
精選影片
人氣文章
財經新聞
評論
專題
  • 生活
  • DIVA
  • 健康好人生
專業版
HV2
精裝版
SV2
串流版
IQ 登入
強化版
TQ
強化版
MQ

etnet初心不變 風雨無阻 與你並肩投資路,立即加入成為etnet YouTube頻道會員!

獨家優惠【etnet x 環球海產】 用戶專享全場95折,特價貨品更可折上折,立即選購五星級酒店御用海鮮!

樂本健 x etnet健康網購 | 購物滿額即送免費禮品

貨幣攻略

大國博弈

關稅戰

說說心理話

Watch Trends 2025

北上食買玩

Wonder in Art

理財秘笈

山今養生智慧

輕鬆護老

照顧者 情緒健康