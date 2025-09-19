  • 會員
說說心理話
AH股新聞

19/09/2025 15:18

【ＡＩ】華為與浙大發布安全版DeepSeek模型，有害言論、政治敏感內容等防禦率近100%

　　《經濟通通訊社１９日專訊》華為全聯接大會２０２５昨日在上海開幕，會上華為技術有限
公司與浙江大學聯合發布了內地首個基於昇騰千卡算力平台的ＤｅｅｐＳｅｅｋ－Ｒ１－
Ｓａｆｅ基礎大模型。
　
　　據介紹，ＤｅｅｐＳｅｅｋ－Ｒ１－Ｓａｆｅ的發布旨在打造安全可信的示範應用，推動大
模型安全能力與產業生態協同發展。目前，模型已在ＭｏｄｅｌＺｏｏ、ＧｉｔＣｏｄｅ、
ＧｉｔＨｕｂ、Ｇｉｔｅｅ及ＭｏｄｅｌＳｃｏｐｅ　等多個社區全面開源。
　
　　測試結果表明，ＤｅｅｐＳｅｅｋ－Ｒ１－Ｓａｆｅ針對有毒有害言論、政治敏感內容、違
法行為教唆等１４個維度的普通有害問題整體防禦成功率近１００％，針對情境假設、角色扮演
、加密編碼等多個越獄模式整體防禦成功率超過４０％。其綜合安全防禦能力達８３％，在同樣
測試設置下超過Ｑｗｅｎ－２３５Ｂ和ＤｅｅｐＳｅｅｋ－Ｒ１－６７１Ｂ等多個同期模型８％
至１５％。
　
　　此外，在ＭＭＬＵ、ＧＳＭ８Ｋ、ＣＥＶＡＬ等通用能力基准測試中，ＤｅｅｐＳｅｅｋ－
Ｒ１－Ｓａｆｅ相比於ＤｅｅｐＳｅｅｋ－Ｒ１的性能損耗在１％以內。這些結果表明，
ＤｅｅｐＳｅｅｋ－Ｒ１－Ｓａｆｅ不僅顯著提升了安全防護能力，也保障了模型的可用性，達
成了安全能力與通用性能之間的有效平衡。（ｓｌ）

