《經濟通通訊社３０日專訊》昨日ＤｅｅｐＳｅｅｋ宣布正式發布ＤｅｅｐＳｅｅｋ－

Ｖ３﹒２－Ｅｘｐ模型僅４分鍾後，寒武紀（滬：６８８２５６）旗下微信公眾號發文稱，寒武

紀已同步實現對深度求索公司最新模型ＤｅｅｐＳｅｅｋ－Ｖ３﹒２－Ｅｘｐ的適配，並開源大

模型推理引擎ｖＬＬＭ－ＭＬＵ源代碼。



寒武紀表示，公司一直高度重視大模型軟件生態建設，支持以ＤｅｅｐＳｅｅｋ為代表的所

有主流開源大模型。借助長期活躍的生態建設和技術積累，寒武紀得以快速實現對

ＤｅｅｐＳｅｅｋ－Ｖ３﹒２－Ｅｘｐ這一全新實驗性模型架構的ｄａｙ ０適配和優化。此外

，公司一直重視芯片和算法的聯合創新，致力於以軟硬件協同的方式，優化大模型部署性能，降

低部署成本。



此前，寒武紀對ＤｅｅｐＳｅｅｋ系列模型進行了深入的軟硬件協同性能優化。針對本次的

ＤｅｅｐＳｅｅｋ－Ｖ３﹒２－Ｅｘｐ新模型架構，寒武紀通過Ｔｒｉｔｏｎ算子開發實現了快

速適配，利用ＢａｎｇＣ融合算子開發實現了極致性能優化。寒武紀強調，依托

ＤｅｅｐＳｅｅｋ－Ｖ３﹒２－Ｅｘｐ帶來的全新ＤｅｅｐＳｅｅｋ Ｓｐａｒｓｅ

Ａｔｔｅｎｔｉｏｎ機制，疊加寒武紀的極致計算效率，可大幅降低長序列場景下的訓推成本。

（ｗｎ）

