
论文旨在解决“传统访问控制(AC)机制无法胜任大模型智能体系统动态、高语境交互”这一核心问题。具体而言,其关注以下痛点:
静态规则与二元 allow/deny 逻辑难以应对智能体在复杂任务中产生的动态信息流;
传统 IFC(Information Flow Control)无法处理隐含语义、角色漂移、多轮语境变化等语义级风险;
现有安全补丁或 prompt 层防护易被提示注入、工具调用劫持、多智能体消息篡改等攻击绕过。
为此,作者提出“Agent Access Control (AAC)”范式,将访问控制从“外部安全门”重构为“智能体内部的认知能力”,目标是把权限问题转化为信息流的语境化治理问题,实现:
多维语境评估:身份、关系、场景、任务意图、规范合规度一体化建模;
自适应响应生成:通过摘要、删失、语义改写等手段动态塑形输出,而非简单阻断;
独立推理引擎:以“认知良知”角色与主 LLM 分离,确保 least-privilege 与 need-to-know 原则在生成、工具调用、记忆访问等全链路中被持续强制执行。
静态规则与二元 allow/deny 逻辑难以应对智能体在复杂任务中产生的动态信息流;
传统 IFC(Information Flow Control)无法处理隐含语义、角色漂移、多轮语境变化等语义级风险;
现有安全补丁或 prompt 层防护易被提示注入、工具调用劫持、多智能体消息篡改等攻击绕过。
为此,作者提出“Agent Access Control (AAC)”范式,将访问控制从“外部安全门”重构为“智能体内部的认知能力”,目标是把权限问题转化为信息流的语境化治理问题,实现:
多维语境评估:身份、关系、场景、任务意图、规范合规度一体化建模;
自适应响应生成:通过摘要、删失、语义改写等手段动态塑形输出,而非简单阻断;
独立推理引擎:以“认知良知”角色与主 LLM 分离,确保 least-privilege 与 need-to-know 原则在生成、工具调用、记忆访问等全链路中被持续强制执行。


