作为人工智能时代的新型计算基础,智算已经成为各国竞争的核心战略。2025年,我国智算的规模达到1037.3 EFLOPS,比去年增加42%,而智算的安全问题也日益突出,建立一个安全可靠的智算系统已成为业界的共识。

目前,智算安全事故频繁发生,安全风险遍及整个智算系统的产业链。运营方面,Cloudflare由于配置问题导致全球宕机,ChatGPT更是出现了8小时的断网事件,充分暴露了运维弹性的不足;在体系结构层次上,恶意软件“ShadowInit”利用了GPU的安全漏洞对集群进行了入侵,每次入侵耗费了6400个GPU小时的计算资源;供应链层面上,Deepseek公司因第三方元器件的安全漏洞而暴露敏感信息,进口芯片的“后门”问题引起了政府的高度重视;在服务方面,Anthropic支付了15多亿美元的数据源违规赔偿,而深度造假技术已经给企业带来了巨大的损失。这些事件说明智算的安全风险已经渗透到基础架构,资源,平台和应用的全层次。

智算安全可信核心内涵主要集中在四个方面:安全,是抵御内外威胁、保障数据和计算资源安全的基本保障;稳定是操作的保障,提高了系统的抗干扰性,保证了服务的连续性;质量的核心是可靠性,确保供应链完整,产品输出达到预期效果;透明是建立信任的前提,要做到流程可追溯,责任明确。这四个内涵与智算系统的各个层次进行深度对应,构成全局保护网络。

在建设途径上,从下至上构建动态安全体系结构:计算层采用微分片+零信任网的方式实现全局可信;应用层构建整个生命周期的安全保护机制,提高模型的健壮性和界面管理;稳定保证主要依靠高可用体系结构和智能运维技术,利用故障注入训练提高系统的容错性;供应链要可靠,需推动硬件国产化和开源管理,建立两个供应商的供货体系;透明就是要建立健全数据的审计溯源和跨域的信任机制,并对各参与方的安全责任进行明确。
在技术开发上,“安全防御”、“稳定保障”、“可信执行”、“透明合规”4个领域的技术框架已经形成,“零信任”、“TEE可信环境”、“国密算法”、“区块链溯源”等相关技术也在陆续实现。今后,应以政策引导、行业协同、技术攻坚等多种治理模式,通过完善基线标准,建立运行监控机制,建立责任分担机制,促进智能计算安全实现从被动防御到主动防范的转变,培养“AI+安全”复合型人才,促进智算产业的健康发展。



















点击阅读原文获取《行业观察|智算安全可信进入全域防护时代:核心逻辑与发展方向》


