

火山引擎《2025 年火山方舟大模型服务安全白皮书》核心结论显示,大模型安全已进入 “全链路防护、原生安全嵌入、责任共担” 的新阶段。火山方舟以可信安全沙箱为核心,构建覆盖模型、平台、应用的全栈安全体系,通过机密计算、全链路加密、细粒度权限控制等技术,实现 “数据唯你可见、唯你所用、唯你所有”,为企业级 AI 应用落地筑牢安全底座。
一、核心安全威胁:大模型落地的三大挑战
多维攻击风险凸显:涵盖提示词注入、模型投毒、算力盗用等 LLM 特有威胁,同时面临 DDoS 攻击、供应链漏洞等传统安全问题,攻击路径沿 “基础设施 - 模型 - 智能体” 延伸。 数据安全痛点突出:超大规模模型的强记忆能力带来数据泄露风险,生成式创作引发数据确权难题,“黑盒” 特性对操作透明化提出更高要求。 合规压力持续升级:全球 AI 监管框架日趋严格,中国 “三法一条例” 与欧盟《人工智能法案》明确要求,需满足内容合规、算法备案、数据隐私保护等多重要求。
二、全栈安全体系:六大核心防护能力
可信安全沙箱:基于云原生容器隔离、TEE 硬件隔离等技术,构建从传输、存储到运行的全环节防护,支持 GPU 加速加解密,不影响推理效率。 全链路数据加密:默认开启网络层 HTTPS/mTLS 加密,支持应用层端到端会话加密,精调场景可启用用户自持密钥(HYOK),实现数据全生命周期加密。 细粒度访问控制:基于 IAM 体系划分多角色权限,API Key 支持 IP 白名单、项目隔离等配置,严格控制模型与数据访问权限。 大模型防火墙:防御 OWASP LLM Top10 风险,包括提示词攻击检测、算力消耗防护、敏感信息过滤等,精准拦截恶意请求。 内容安全护栏:构建 “模型原生安全 + 平台默认防护 + 增值服务” 三级体系,支持输入输出双向审核,动态迭代风险规则库。 全生命周期审计:提供沙箱操作日志、KMS 访问日志、用户操作日志等多维度审计能力,支持安全事件溯源与合规校验。
三、创新安全实践:MaaS 原生安全能力
机密推理服务:行业率先推出 MaaS 原生机密推理,基于 TEE 可信执行环境实现芯片级隔离,提供可离线验证的远程证明报告,确保运行环境可信。 智能体与 MCP 安全:建立 MCP 全生命周期安全架构,上线前严格安全准入检测,运行时集成 AgentArmor 防护,防范工具调用风险。 数据零留存机制:除合规要求或用户授权外,不存储任何推理会话数据,任务结束后沙箱销毁,实现会话无痕。
四、未来展望:安全与效率协同演进
未来,火山方舟将持续深化 “安全原生、灵活可配、透明可信” 三大方向。
技术上,将优化机密计算性能,推动端云互信能力落地,实现全链路密态隔离;产品上,将开放更多自定义安全策略,支持企业按需配置防护规则;生态上,将参与更多 AI 安全标准制定,共建行业安全生态。随着安全能力与模型能力的深度融合,大模型将在安全可控的前提下,释放更大产业价值,护航 AI 应用规模化落地。











