22/05/2026 11:33
【AI】智譜(02513)開放GLM-5.1高速版API予部分企業客戶
智譜(02513)宣布,面向部分企業客戶開放GLM-5.1高速版API,模型輸出速度達每秒400 tokens。
公司稱,實測數據顯示,高速版能力突出,代碼生成效率提升約10倍,可同步理解工程上下文並輸出方案;3D場景建模可實現文字輸入與場景即時聯動;還能即時生成匹配需求的工具與交互,具備新型作業系統雛形。而今次發布的高速版亦毋須為回應速度犧牲模型質量,可實現「即問即答」,改變傳統模型多輪調用耗時久的痛點。
該API由智譜GLM團隊與TileRT團隊聯合打造,經推理引擎、調度系統、基礎設施三層優化。其核心突破在於TileRT引擎,通過編譯期靜態編排與Tile級微任務調度,消除冗餘開銷,逼近硬件物理極限。目前,GLM-5.1高速版已適配AI編程、實時交互、商業決策、即時語音等高敏感場景,在智譜MaaS平台定向開放。
智譜稱,未來將持續優化推理引擎,擴大高速服務覆蓋,為企業提供低延遲、高智能的生產級AI能力,鞏固國產大模型在全球技術前沿的領先地位。
《經濟通通訊社22日專訊》
公司稱,實測數據顯示,高速版能力突出,代碼生成效率提升約10倍,可同步理解工程上下文並輸出方案;3D場景建模可實現文字輸入與場景即時聯動;還能即時生成匹配需求的工具與交互,具備新型作業系統雛形。而今次發布的高速版亦毋須為回應速度犧牲模型質量,可實現「即問即答」,改變傳統模型多輪調用耗時久的痛點。
該API由智譜GLM團隊與TileRT團隊聯合打造,經推理引擎、調度系統、基礎設施三層優化。其核心突破在於TileRT引擎,通過編譯期靜態編排與Tile級微任務調度,消除冗餘開銷,逼近硬件物理極限。目前,GLM-5.1高速版已適配AI編程、實時交互、商業決策、即時語音等高敏感場景,在智譜MaaS平台定向開放。
智譜稱,未來將持續優化推理引擎,擴大高速服務覆蓋,為企業提供低延遲、高智能的生產級AI能力,鞏固國產大模型在全球技術前沿的領先地位。
《經濟通通訊社22日專訊》
【你點睇?】據報英國首相施紀賢正考慮辭任,你認為英國政局短期內會否持續動盪? ► 立即投票
-
上一篇
恒指半日升309點報25696,聯想季績極振奮股價飆,資金輪動內需股失落 22/05/2026 12:06
-
下一篇
《外資精點》智譜(02513)推出ZCube組網架構,大摩:緩解推理算力瓶頸重要創新 22/05/2026 10:46
-
【恒指季檢】MiniMax及智譜納入恒生科技指數成分股,剔除金蝶及金山軟件 22/05/2026 18:06
-
《鍾之日記》智譜靠譜,聯想走揚 22/05/2026 17:00
-
恒指升219點收報25606再失牛熊線,北水流出65億元,環球鼓舞惟港股連續第二周下跌 22/05/2026 16:13
-
《異動股》智譜等2家公司上午10:17異動 22/05/2026 10:18
-
【恒指季檢】分析料智譜、MiniMax有望納入恒生科指,或吸引數十億美元資金流入 22/05/2026 10:13
備註︰
即時報價更新時間為 22/05/2026 18:00
港股即時基本市場行情由香港交易所提供; 香港交易所指定免費發放即時基本市場行情的網站