







未来生命研究所今日发布2025冬季AI安全指数报告。
? 本期评估对象
- Anthropic
- OpenAI
- DeepMind
- xAI
- Meta
- 智谱AI
- DeepSeek
- 阿里云
今年共有五家领先企业首次完整提交详细问卷,披露了此前未公开的关键安全信息。
? 六个评估维度
- 风险评估
- 现实危害
- 安全框架
- 生存风险
- 治理结构
- 信息共享
由独立专家小组对全球主要AI公司的安全实践进行系统评估。
?️ 报告执行摘要
- 顶尖公司与其他公司之间仍存在明显差距。Anthropic、OpenAI和Google DeepMind与其他受评公司最大的差距在于风险评估、安全框架和信息共享,其原因是信息披露有限、系统性安全流程证据不足以及稳健评估实践等。
- 生存风险仍然是该行业的核心结构性缺陷。所有受评公司都在竞相迈向AGI/ASI,但并未提出任何明确的计划来控制或协调这种超越人类智能的技术,最严重的风险实际上并未得到有效解决。
- 尽管企业公开做出承诺,但其安全实践仍未能达到新兴的全球标准。虽然许多企业在一定程度上符合这些新兴标准,但实施的深度、细则和质量仍参差不齐,导致其安全实践尚未达到欧盟CoP等框架所设想的严格性、可衡量性和透明度。
? 方法与视角上值得商榷
- 指数明显更偏向美式自愿安全措施,如自愿发布安全框架、披露安全评估等,而中国企业更多受强制性法规和标准约束。虽然报告承认中方监管带来了更强的基础问责,但在评分中并未充分体现,也忽略了阿里、DeepSeek、智谱等签署的行业安全承诺。
- 指数过度依赖企业自我披露的信息来源,例如系统卡和FLI调研问卷,却未提及DeepSeek R1的《自然》论文公开安全评估——这是首个做到这点的主流大模型。此外,许多由中国公司发布的开放权重模型,在透明度上的价值也几乎未被承认。
- 从改进建议到评测基准,这份报告也带有明显的西方中心视角,例如建议中国公司对标欧盟规范、使用以英语和西方议题为主的安全基准。
- 当然,中国在失控风险这类前沿生存风险议题上的重视度仍有提升空间。但现实是:中国模型在能力与潜在风险维度上,正迅速接近美国前沿模型。如安远AI“前沿AI风险监测平台”的观察。
最后我想说,问题或许不在于谁更安全,而在于谁在定义什么是安全。
? 参考资料
FLI, AI Safety Index Winter 2025 Edition
? 本期评估对象
- Anthropic
- OpenAI
- DeepMind
- xAI
- Meta
- 智谱AI
- DeepSeek
- 阿里云
今年共有五家领先企业首次完整提交详细问卷,披露了此前未公开的关键安全信息。
? 六个评估维度
- 风险评估
- 现实危害
- 安全框架
- 生存风险
- 治理结构
- 信息共享
由独立专家小组对全球主要AI公司的安全实践进行系统评估。
?️ 报告执行摘要
- 顶尖公司与其他公司之间仍存在明显差距。Anthropic、OpenAI和Google DeepMind与其他受评公司最大的差距在于风险评估、安全框架和信息共享,其原因是信息披露有限、系统性安全流程证据不足以及稳健评估实践等。
- 生存风险仍然是该行业的核心结构性缺陷。所有受评公司都在竞相迈向AGI/ASI,但并未提出任何明确的计划来控制或协调这种超越人类智能的技术,最严重的风险实际上并未得到有效解决。
- 尽管企业公开做出承诺,但其安全实践仍未能达到新兴的全球标准。虽然许多企业在一定程度上符合这些新兴标准,但实施的深度、细则和质量仍参差不齐,导致其安全实践尚未达到欧盟CoP等框架所设想的严格性、可衡量性和透明度。
? 方法与视角上值得商榷
- 指数明显更偏向美式自愿安全措施,如自愿发布安全框架、披露安全评估等,而中国企业更多受强制性法规和标准约束。虽然报告承认中方监管带来了更强的基础问责,但在评分中并未充分体现,也忽略了阿里、DeepSeek、智谱等签署的行业安全承诺。
- 指数过度依赖企业自我披露的信息来源,例如系统卡和FLI调研问卷,却未提及DeepSeek R1的《自然》论文公开安全评估——这是首个做到这点的主流大模型。此外,许多由中国公司发布的开放权重模型,在透明度上的价值也几乎未被承认。
- 从改进建议到评测基准,这份报告也带有明显的西方中心视角,例如建议中国公司对标欧盟规范、使用以英语和西方议题为主的安全基准。
- 当然,中国在失控风险这类前沿生存风险议题上的重视度仍有提升空间。但现实是:中国模型在能力与潜在风险维度上,正迅速接近美国前沿模型。如安远AI“前沿AI风险监测平台”的观察。
最后我想说,问题或许不在于谁更安全,而在于谁在定义什么是安全。
? 参考资料
FLI, AI Safety Index Winter 2025 Edition


