22/05/2026 11:33
【AI】智譜(02513)開放GLM-5.1高速版API予部分企業客戶
智譜(02513)宣布,面向部分企業客戶開放GLM-5.1高速版API,模型輸出速度達每秒400 tokens。
公司稱,實測數據顯示,高速版能力突出,代碼生成效率提升約10倍,可同步理解工程上下文並輸出方案;3D場景建模可實現文字輸入與場景即時聯動;還能即時生成匹配需求的工具與交互,具備新型作業系統雛形。而今次發布的高速版亦毋須為回應速度犧牲模型質量,可實現「即問即答」,改變傳統模型多輪調用耗時久的痛點。
該API由智譜GLM團隊與TileRT團隊聯合打造,經推理引擎、調度系統、基礎設施三層優化。其核心突破在於TileRT引擎,通過編譯期靜態編排與Tile級微任務調度,消除冗餘開銷,逼近硬件物理極限。目前,GLM-5.1高速版已適配AI編程、實時交互、商業決策、即時語音等高敏感場景,在智譜MaaS平台定向開放。
智譜稱,未來將持續優化推理引擎,擴大高速服務覆蓋,為企業提供低延遲、高智能的生產級AI能力,鞏固國產大模型在全球技術前沿的領先地位。
《經濟通通訊社22日專訊》
公司稱,實測數據顯示,高速版能力突出,代碼生成效率提升約10倍,可同步理解工程上下文並輸出方案;3D場景建模可實現文字輸入與場景即時聯動;還能即時生成匹配需求的工具與交互,具備新型作業系統雛形。而今次發布的高速版亦毋須為回應速度犧牲模型質量,可實現「即問即答」,改變傳統模型多輪調用耗時久的痛點。
該API由智譜GLM團隊與TileRT團隊聯合打造,經推理引擎、調度系統、基礎設施三層優化。其核心突破在於TileRT引擎,通過編譯期靜態編排與Tile級微任務調度,消除冗餘開銷,逼近硬件物理極限。目前,GLM-5.1高速版已適配AI編程、實時交互、商業決策、即時語音等高敏感場景,在智譜MaaS平台定向開放。
智譜稱,未來將持續優化推理引擎,擴大高速服務覆蓋,為企業提供低延遲、高智能的生產級AI能力,鞏固國產大模型在全球技術前沿的領先地位。
《經濟通通訊社22日專訊》
【你點睇?】牛頭角的士奪命車禍釀1死4傷,涉事70歲司機被捕,你認為當局應否收緊高齡職業司機發牌要求?► 立即投票
-
上一篇
恒指半日升309點報25696,聯想季績極振奮股價飆,資金輪動內需股失落 22/05/2026 12:06
-
下一篇
《外資精點》智譜(02513)推出ZCube組網架構,大摩:緩解推理算力瓶頸重要創新 22/05/2026 10:46
-
《異動股》智譜等2家公司上午10:17異動 22/05/2026 10:18
-
【恒指季檢】分析料智譜、MiniMax有望納入恒生科指,或吸引數十億美元資金流入 22/05/2026 10:13
-
《異動股》智譜飆14%稀宇升至近700元,憧憬獲納入恒生科指 22/05/2026 10:09
-
亞太股市急漲惟恒指半日跌2點報25648,熱錢換乘外圍晶片股,科網板塊齊捱沽 21/05/2026 12:07
-
【開市Go】聯儲明確加息可能,英偉達營收勝預期,萬國數據首季盈利飆 21/05/2026 08:32
備註︰
即時報價更新時間為 22/05/2026 16:58
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站