27/04/2026 14:25
【FOCUS】魚翅VS蘿蔔,成本降維加持「token經濟」
【FOCUS】短短48小時,AI界迎來兩大前沿模型「上新」--OpenAI旗下GPT-5.5,以及DeepsSeek-V4。「誰更聰明」見仁見智,但「誰更便宜」一目了然--以每百萬token輸出價格計,前者高達30美元,後者低至6元人民幣,可謂「魚翅VS蘿蔔」。放在內地日均token調用量突破140萬億(截至3月)的背景下,或意味北京的策略方向,已從算力追趕,變為token轉化。
*區分精讀跳讀,百萬上下文成標配*
「今天你用了多少token?」被內地官方譯作「詞元」的Token,是AI理解自然語言指令的最小單位。例如,「example」相當於1個token;而向DeepsSeek-V4上傳三部曲,則約消耗54萬個token。換言之,無論是輸入還是生成,token相當於串聯所有指令、數據、場景的核心。
面對晶片的物理制約,尤其是中國自身的算力瓶頸,如何極緻優化調用token的效率,正正是今次DeepsSeek版本更新的最大看點。以專業版的DeepsSeek V4-Pro為例,憑藉全新的混合注意力架構(壓縮稀疏注意力+高度壓縮注意力),將處理每百萬token上下文的FLOPs(相當於算力)、KV cache(相當於內存),降至上一代版本V3.2的27%、10%。
這種對強關聯的token「精讀」,對弱關聯的token「跳讀」的做法,令其成本僅為GPT-5.5的零頭,難怪DeepsSeek宣布,「從現在開始,百萬上下文將是DeepSeek所有官方服務的標配。」
*軟硬協同反制壟斷,利規模化落地*
值得一提的是,就在DeepSeek V4發布約一小時後,華為宣布V4將於旗下昇騰平台首發,緊接著英偉達聲稱,V4已在Blackwell平台完成適配,意味老黃苦心經營的「硬件(GPU)+軟件(CUDA生態)」,遭DeepSeek、華為聯手撕開一道缺口。而更引發遐想的是,DeepSeek提及,預計下半年昇騰950超節點批量上市後,V4-Pro模型價格會大幅下調。
有何意義?儘管在推理能力上仍落後GPT-5.5等閉源模型,但看看中國的雄心壯志--到2027年,推動3至5個通用大模型在製造業深度應用,推廣500個工業領域典型應用場景--更具成本競爭力的token,無疑將推動大模型商業化落地,以及「token經濟」規模化。
此外,更低成本的實現,亦將倒逼各家大模型公司加速業務重組,例如阿里(09988)3月宣布成立Alibaba Token Hub業務單元,小米(01810)最新MiMo v2.5大模型聲稱較月之暗面的Kimi K2.6節省42% Token。畢竟,未來誰控制最有性價比的token,誰將從源頭擁有優勢地位。
*區分精讀跳讀,百萬上下文成標配*
「今天你用了多少token?」被內地官方譯作「詞元」的Token,是AI理解自然語言指令的最小單位。例如,「example」相當於1個token;而向DeepsSeek-V4上傳三部曲,則約消耗54萬個token。換言之,無論是輸入還是生成,token相當於串聯所有指令、數據、場景的核心。
面對晶片的物理制約,尤其是中國自身的算力瓶頸,如何極緻優化調用token的效率,正正是今次DeepsSeek版本更新的最大看點。以專業版的DeepsSeek V4-Pro為例,憑藉全新的混合注意力架構(壓縮稀疏注意力+高度壓縮注意力),將處理每百萬token上下文的FLOPs(相當於算力)、KV cache(相當於內存),降至上一代版本V3.2的27%、10%。
這種對強關聯的token「精讀」,對弱關聯的token「跳讀」的做法,令其成本僅為GPT-5.5的零頭,難怪DeepsSeek宣布,「從現在開始,百萬上下文將是DeepSeek所有官方服務的標配。」
*軟硬協同反制壟斷,利規模化落地*
值得一提的是,就在DeepSeek V4發布約一小時後,華為宣布V4將於旗下昇騰平台首發,緊接著英偉達聲稱,V4已在Blackwell平台完成適配,意味老黃苦心經營的「硬件(GPU)+軟件(CUDA生態)」,遭DeepSeek、華為聯手撕開一道缺口。而更引發遐想的是,DeepSeek提及,預計下半年昇騰950超節點批量上市後,V4-Pro模型價格會大幅下調。
有何意義?儘管在推理能力上仍落後GPT-5.5等閉源模型,但看看中國的雄心壯志--到2027年,推動3至5個通用大模型在製造業深度應用,推廣500個工業領域典型應用場景--更具成本競爭力的token,無疑將推動大模型商業化落地,以及「token經濟」規模化。
此外,更低成本的實現,亦將倒逼各家大模型公司加速業務重組,例如阿里(09988)3月宣布成立Alibaba Token Hub業務單元,小米(01810)最新MiMo v2.5大模型聲稱較月之暗面的Kimi K2.6節省42% Token。畢竟,未來誰控制最有性價比的token,誰將從源頭擁有優勢地位。
【香港好去處】2026去邊最好玩?etnet為你提供全港最齊盛事活動,所有資訊盡在掌握!► 即睇
-
上一篇
恒指全日跌52點收報25925,騰訊跌3%,晶片股高走中芯收升6% 27/04/2026 16:11
-
下一篇
AI大模型概念股|DeepSeek新模型大減價,MINIMAX智譜獲大行力撐照樣急跌,可以點部署? 27/04/2026 13:29
-
《盤後部署》港股成交回升有利大市打底,華能國電績前成交偏強有望突破 27/04/2026 17:00
-
螞蟻國際:本港的士司機接受AlipayHK等程式支付車資日均交易金額增逾1.6倍 27/04/2026 16:30
-
【AI】百度文庫網盤發布通用智能體GenFlow4.0,為首個全端可用「AI工作台」 27/04/2026 16:24
-
《午市前瞻》議息及業績料對港股刺激有限,煤價走強緩和神華業績壓力 27/04/2026 12:45
-
DeepSeek新模型大減價,MINIMAX智譜獲大行力撐照樣急跌,可以點部署? 27/04/2026 12:30
備註︰
即時報價更新時間為 27/04/2026 17:59
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站