27/04/2026 14:25
【FOCUS】魚翅VS蘿蔔,成本降維加持「token經濟」
【FOCUS】短短48小時,AI界迎來兩大前沿模型「上新」--OpenAI旗下GPT-5.5,以及DeepsSeek-V4。「誰更聰明」見仁見智,但「誰更便宜」一目了然--以每百萬token輸出價格計,前者高達30美元,後者低至6元人民幣,可謂「魚翅VS蘿蔔」。放在內地日均token調用量突破140萬億(截至3月)的背景下,或意味北京的策略方向,已從算力追趕,變為token轉化。
*區分精讀跳讀,百萬上下文成標配*
「今天你用了多少token?」被內地官方譯作「詞元」的Token,是AI理解自然語言指令的最小單位。例如,「example」相當於1個token;而向DeepsSeek-V4上傳三部曲,則約消耗54萬個token。換言之,無論是輸入還是生成,token相當於串聯所有指令、數據、場景的核心。
面對晶片的物理制約,尤其是中國自身的算力瓶頸,如何極緻優化調用token的效率,正正是今次DeepsSeek版本更新的最大看點。以專業版的DeepsSeek V4-Pro為例,憑藉全新的混合注意力架構(壓縮稀疏注意力+高度壓縮注意力),將處理每百萬token上下文的FLOPs(相當於算力)、KV cache(相當於內存),降至上一代版本V3.2的27%、10%。
這種對強關聯的token「精讀」,對弱關聯的token「跳讀」的做法,令其成本僅為GPT-5.5的零頭,難怪DeepsSeek宣布,「從現在開始,百萬上下文將是DeepSeek所有官方服務的標配。」
*軟硬協同反制壟斷,利規模化落地*
值得一提的是,就在DeepSeek V4發布約一小時後,華為宣布V4將於旗下昇騰平台首發,緊接著英偉達聲稱,V4已在Blackwell平台完成適配,意味老黃苦心經營的「硬件(GPU)+軟件(CUDA生態)」,遭DeepSeek、華為聯手撕開一道缺口。而更引發遐想的是,DeepSeek提及,預計下半年昇騰950超節點批量上市後,V4-Pro模型價格會大幅下調。
有何意義?儘管在推理能力上仍落後GPT-5.5等閉源模型,但看看中國的雄心壯志--到2027年,推動3至5個通用大模型在製造業深度應用,推廣500個工業領域典型應用場景--更具成本競爭力的token,無疑將推動大模型商業化落地,以及「token經濟」規模化。
此外,更低成本的實現,亦將倒逼各家大模型公司加速業務重組,例如阿里(09988)3月宣布成立Alibaba Token Hub業務單元,小米(01810)最新MiMo v2.5大模型聲稱較月之暗面的Kimi K2.6節省42% Token。畢竟,未來誰控制最有性價比的token,誰將從源頭擁有優勢地位。
*區分精讀跳讀,百萬上下文成標配*
「今天你用了多少token?」被內地官方譯作「詞元」的Token,是AI理解自然語言指令的最小單位。例如,「example」相當於1個token;而向DeepsSeek-V4上傳三部曲,則約消耗54萬個token。換言之,無論是輸入還是生成,token相當於串聯所有指令、數據、場景的核心。
面對晶片的物理制約,尤其是中國自身的算力瓶頸,如何極緻優化調用token的效率,正正是今次DeepsSeek版本更新的最大看點。以專業版的DeepsSeek V4-Pro為例,憑藉全新的混合注意力架構(壓縮稀疏注意力+高度壓縮注意力),將處理每百萬token上下文的FLOPs(相當於算力)、KV cache(相當於內存),降至上一代版本V3.2的27%、10%。
這種對強關聯的token「精讀」,對弱關聯的token「跳讀」的做法,令其成本僅為GPT-5.5的零頭,難怪DeepsSeek宣布,「從現在開始,百萬上下文將是DeepSeek所有官方服務的標配。」
*軟硬協同反制壟斷,利規模化落地*
值得一提的是,就在DeepSeek V4發布約一小時後,華為宣布V4將於旗下昇騰平台首發,緊接著英偉達聲稱,V4已在Blackwell平台完成適配,意味老黃苦心經營的「硬件(GPU)+軟件(CUDA生態)」,遭DeepSeek、華為聯手撕開一道缺口。而更引發遐想的是,DeepSeek提及,預計下半年昇騰950超節點批量上市後,V4-Pro模型價格會大幅下調。
有何意義?儘管在推理能力上仍落後GPT-5.5等閉源模型,但看看中國的雄心壯志--到2027年,推動3至5個通用大模型在製造業深度應用,推廣500個工業領域典型應用場景--更具成本競爭力的token,無疑將推動大模型商業化落地,以及「token經濟」規模化。
此外,更低成本的實現,亦將倒逼各家大模型公司加速業務重組,例如阿里(09988)3月宣布成立Alibaba Token Hub業務單元,小米(01810)最新MiMo v2.5大模型聲稱較月之暗面的Kimi K2.6節省42% Token。畢竟,未來誰控制最有性價比的token,誰將從源頭擁有優勢地位。
【你點睇?】日本放寬武器出口限制,原則上允許出口具殺傷力武器,你認為中國會否推出強力反制措施? ► 立即投票
-
上一篇
《行業數據》信通院:3月內地市場手機出貨2115萬部,同比下降7.1% 27/04/2026 16:30
-
下一篇
《一周部署》鮑威爾任內最後一舞,中資股密集發布首季業績 27/04/2026 09:00
-
《盤後部署》港股成交回升有利大市打底,華能國電績前成交偏強有望突破 27/04/2026 17:00
-
小米集團(01810)上周五斥1.4億元回購450萬股,每股最高價31.34元 27/04/2026 08:18
-
《鍾之日記》芯片股炒上,汽車股承壓 24/04/2026 17:00
-
晶片股強勢恒指轉升62點收報25978,北水連續四日流入,全周跌182點斷三連升 24/04/2026 16:16
-
《大手成交》小米兩手共200萬股非自動對盤,涉資6220萬元 24/04/2026 14:53
備註︰
即時報價更新時間為 27/04/2026 17:59
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站