推广 热搜: 采购方式  滤芯  带式称重给煤机  甲带  气动隔膜泵  减速机型号  无级变速机  链式给煤机  履带  减速机 

AI 幻觉深度研究报告

   日期:2026-05-12 16:17:07     来源:网络整理    作者:本站编辑    评论:0    
AI 幻觉深度研究报告
深度研究报告

AI 幻觉深度研究报告

可测量证据 · 链接文本 · 核验机制 · 警示标识 · 风险警报

不准确 · 基于政府与监管来源核验的机制、风险、治理与抑制幻觉工程研究

@ 清新研究团队 | 2026年4月21日

核心结论速览

结论一:幻觉不可被彻底消灭
❌ 神话:零幻觉模型
宣称"零幻觉"的完美模型并不存在。NIST 将幻觉表述为 confabulation,强调它来自统计生成机制本身,而非少数异常案例。
✅ 现实:持续治理
不存在永不产生虚构输出的模型。治理重点应是:测试、监测、反馈和人类控制
治理目标:可识别、可约束、可追责、可持续优化 —— 而非"零幻觉"宣传
结论二:高可信品牌会放大幻觉风险

GOV.UK Chat 实验中,用户满意度并不低,但官方仍观察到若干幻觉案例。官方特别提醒:GOV.UK 品牌的可信度让用户低估系统失真风险,形成过度信任。

场景
用户态度
治理需求
高可信品牌
(政府/医院/高校/金融)
过度信任
低估风险
更需要显性护栏
普通聊天场景
不确定
谨慎对待
护栏相对灵活
结论三:抑制幻觉会带来新的权衡

MHRA 案例表明,RAG 可显著压低重大幻觉,但更严格的护栏也可能提高遗漏率。"压低幻觉率"不自动等于"提升系统有效性",必须处理两者之间的平衡。

场景
幻觉率
遗漏率
治理策略
高风险场景
压低(优先)
容忍较高
可容忍更多拒答
低风险创意场景
容忍较高
压低(优先)
可容忍更高生成自由度

第一章:什么是 AI 幻觉?

NIST 定义:使用 confabulation 一词,指模型自信地呈现错误或虚假的内容,也包括偏离提示和前后矛盾。幻觉不仅等于"事实错",还包括"逻辑错""引用错"和"上下文错"。

生成模型追求的是高概率文本,而不是外部世界的真值证明。语言流畅、结构完整、语气笃定,会让用户把表达质量误判为事实质量

六种典型幻觉类型

① 事实性幻觉 · 编造事实

直接编造事实、数字、事件或对象。在开放问答和陌生主题里较常见,但因用户有戒心,反而较容易被识别。

② 引用性幻觉 · 伪造"已有证据"的错觉

伪造、错配或误引法规、判例、论文、页码、链接和脚注。一旦进入PPT、政策文件、学术写作,会从"模型错误"变成"组织知识污染"。

③ 语境性幻觉 · 答案"看起来对,但用错了地方"

答案在一般常识上似乎没错,但对当前国家、行业、时间点或任务边界并不适用。越像"专家陈述",越不容易意识到推理链建立在证据空白上。

④ 逻辑性幻觉 · 空转补出解释链

模型在证据不足时补出一套连贯、顺滑、貌似严密的解释链条。迷惑性极强。

⑤ 行动性幻觉 · 错误调用工具

常见于 Agent 或工具调用:不仅说错话,还会调用错工具、传错参数、误触发流程。危害从"误导"升级为"执行错误"。

⑥ 遗漏性幻觉 · 关键信息缺失

系统为安全而频繁不回答,导致关键信息缺失。过度保守的护栏同样会造成风险——遗漏有时并不比幻觉更轻。


第二章:幻觉的五个根因机制

理解根因的意义:抑制幻觉不能只靠改一个提示词或换一个模型,而要系统性地打断从"生成"到"采信"到"执行"的链条。
根因一:统计生成机制

模型的本职是根据分布生成最可能的后续文本,而非自动连接外部真值。只要现实约束没有被及时注入,模型就会用语言概率去填补知识空白。"能接着说下去"本身就是幻觉的结构起点。

根因二:知识边界与专业断层

通用模型更擅长平均化知识,不擅长处理实时、版本敏感、组织内部或强专业语境的问题。幻觉并非均匀分布,而是在专业边界处显著升高。

根因三:提示不充分与指令冲突

很多幻觉并非"模型故意乱说",而是系统把"必须回答"当成默认目标。如果系统没有设计拒答逻辑,模型会倾向于继续补全,而不是承认自己不知道。

根因四:组织对"速度感"与"完整感"的偏好

很多团队把"回复快、看起来全、语气像专家"当作优秀体验,却忽略了可验证性。这种激励会把系统推向更强的生成姿态,结果:越像"聪明助手",越可能在关键时刻给出不该被执行的答案。

根因五:检索—生成错配

RAG 的核心价值是把回答锚定到权威知识源,但它并不自动保证真实。如果检索内容召回不完整、文档版本过期、来源互相矛盾,生成层仍可能拼出似是而非的回答。RAG 是降幻觉的工程路线,不是幻觉治理的终点


第三章:真实世界案例

案例一:GOV.UK Chat —— 品牌会放大幻觉风险

官方对157名用户的后续调查显示:近70%认为有用,略低于65%表示满意。但官方同时观察到若干幻觉案例。

教训:高满意度并不自动等于高可信度。权威界面的品牌信任会让用户低估系统失真风险,形成过度信任。公共服务、医院、高校、金融机构等权威界面,比普通聊天场景更需要显性护栏。

另一教训:很多幻觉不是在答案端发生的,而是在问题端被放大的。问题重写、澄清询问、范围收缩与引导式交互,是前置减险的重要环节。

案例二:联邦机构 —— 采用加速,治理滞后

GAO 报告显示,2024年11个联邦机构报告的生成式AI用例为282个,较2023年的32个约增长9倍。同期总体AI用例从571增至1110。

282个生成式AI用例中,61%集中在内部使命支持,15%用于政府服务,9%用于健康医疗。

教训:生成式AI首先渗透的是"写、读、搜、总、跟踪"等日常流程。越是高频、低摩擦、被默认为是"只是辅助"的环节,越需要前置的幻觉护栏。当采用加速而治理滞后时,幻觉问题就会从"试验风险"变成"运营风险"。

案例三:FDA 与 MHRA —— 医疗高风险边界

FDA 指出,生成式AI在医疗中有巨大潜力,但当输出边界不清时,会增加对预期用途和风险分类的监管困难。FDA 官员表示,已授权超过1200个 AI-enabled medical devices,说明高风险行业中的AI使用已进入规模化监管阶段。

MHRA 的临床问答对比结果(333次测试):

系统
重大幻觉
遗漏情况
GPT 模型(基线)
6次(7.5%)
SmartGuideline(RAG+强护栏)0次(0%)
35次测试出现10次遗漏(28.5%)

教训:RAG与强护栏能压低重大幻觉,但也可能引入遗漏风险。抑制幻觉工程必须把"遗漏风险"与"幻觉风险"在同一张决策表上权衡。


第四章:幻觉治理六层栈

六层栈不是并列技巧清单,而是从"能不能回答"一直延伸到"出了错谁负责"的完整链条。组织一旦跳过底层治理,只做表层提示优化,就很难稳定降低真实风险。
第一层:任务分级

先画任务风险矩阵,按"后果风险"分级:健康/安全/权利/财务 → 禁止或降级使用;专业辅助/一般问答/创意草拟 → 允许模型辅助。只有先做任务分级,才知道护栏强度该放在哪里。

任务类型
后果风险
模型角色
护栏强度
健康/安全/财务/法律
禁止单独处理
强护栏
专业辅助/研究/分析
建议+人工审核
中护栏
创意草拟/一般问答
允许
低护栏
第二层:知识锚定(RAG)

优先使用受控知识源、版本化文档、内部知识库与RAG,让答案尽量回溯到可验证证据上。RAG的目标不是让回答更长,而是让回答更能被审计,减少面对陌生问题时的编造。

第三层:生成约束(允许拒答)

在系统指令中明确规定:"找不到就拒答,不要伪造来源"。一个不能承认自己不知道的系统,必然会用语言去填补空白。对于研究、政策、法律、医疗和公共服务,"拒答"往往比"乱答"更有价值。

⚠️ 组织要在文化上接受:不知道不是系统失败,而是可信系统的重要特征。
第四层:验证校正

对高风险输出做事实校验、引用核对、规则匹配、结构化比对和异常检测。对正式文稿与对外材料,要求关键事实必须能回链到原始来源。验证不是把模型输出全盘否定,而是把"可直接采信"降到最低。

第五层:上线监控与日志

记录提示、模型版本、检索来源、回答文本、人工修订、用户反馈和异常案例。上线没有日志,组织就无法回放错误链条,也无法判断问题出在模型、检索、提示还是流程。日志是"下次不再犯同样错误"的基础设施。

第六层:责任治理(最后一道护栏)

永远不是模型,而是组织如何分配权力与责任。明确业务 owner、模型 owner、审核责任人、供应商边界、升级通道与事故响应机制。一旦责任模糊,幻觉就会在组织中被放任地方式和责任的方式被放任。


第五章:Agent 时代的特殊风险

Prompt Injection:为什么不是 SQL 注入的简单翻版

NCSC 指出,提示注入不是 SQL 注入的简单翻版,因为 LLM 天生不稳定地区分指令与数据。只要 Agent 系统摄入了外部文本,就可能把恶意内容当作新指令执行。

Agent 场景的核心不是"回复像不像人",而是"系统边界能不能守得住"。当模型能调用工具,"说错"和"做错"之间的距离就会大幅缩短。

Agent 系统必须同时做:
     ✓ 最小权限(Least Privilege)
     ✓ 外部内容标注(External Content Labeling)
     ✓ 关键动作确认(Critical Action Confirmation)
     ✓ 确定性校验(Deterministic Validation)
     ✓ 可熔断设计(Circuit Breaker Design)

第六章:原创概念与行动路线图

五个原创概念(清新研究团队提出)

① 概率真相陷阱(Probability-Truth Trap)

把"最像真的输出"误认为"接近真实的答案"。治理意义:要把证据、来源和不确定性显式前置,拆掉"语言=真实"的默认心理。

② 引用幻影链(Citation Mirage Chain)

模型先伪造、错配或误引来源,再用脚注、链接、判例名把缺失证据包装成"已核验链条"。治理意义:来源必须能回链到原文,关键场景禁止无检索生成参考文献。

③ 低置信高伤害区(Low Confidence High Consequence Zone)

模型自己并无稳定依据,组织却让它介入高后果任务。对这些区域,要么禁用生成式AI单独处理,要么把它降格为辅助工具。

④ 幻觉跷跷板(Hallucination Seesaw)

收紧护栏能压低幻觉率,却可能抬高遗漏率、拒答率和信息不全率;反之亦然。不同场景必须配置不同阈值,不能用一套参数治理所有任务。

⑤ 责任折扣门(Responsibility Discount Door)

组织表层设置了 human-in-the-loop,但人工审核既不充分也不可证真,最后既没控住风险,也没形成责任归属。人工审核必须有明确职责、训练标准、升级路径与日志留痕。

行动路线图(30-60-90天)

? 30天:先识别最危险的任务
  • 标出哪些输出会进入正式文稿、数据库、审批流程或自动化执行链

  • 先找"低置信高伤害区",再谈模型扩展

? 60天:补上知识锚定与拒答机制
  • 为高风险问答场景接入受控知识源、版本化文档与 RAG

  • 把"找不到就拒答""必须附来源""引用不可伪造"写进系统指令与产品规则

  • 把错误反馈入口产品化,形成可追踪的工单和案例库

? 90天:把人工复核和日志做成制度
  • 明确谁审、审什么、怎么升级、如何留痕,避免责任折扣门

  • 对关键输出建立抽检、复盘回放与红队测试流程

  • 让每次幻觉事件都能被解释、被归因、被修正——形成组织的幻觉治理资产


结语:真正的水岭,不是会不会用模型

真正有竞争力的组织,不是让模型看起来无所不知,
     而是让模型在不知道时停下来、在高风险时退后一步。

幻觉治理的对象不是某句错话,而是一整条从生成到执行的链条。

@ 清新研究团队 | 2026年4月21日

本文提供75完整版文件下载,请点击文末“阅读原文”。

智盾矩阵·大模型安全智库帮会是FreeBuf知识大陆的重量级帮会,目前已入选FreeBuf钻石星选帮会——官方认证高信誉与高质量,帮会聚焦人工智能与大模型安全领域,致力于打造全球视野下的专业资源聚合平台。截止目前帮会已累计更新4100+文档资源,为从业者提供从理论到实践的全维度知识支持

公众号已发表帮会资源展示:

①政策、标准

香港生成式人工智能技术及应用指引

网络安全技术 生成式人工智能服务安全基本要求

网络安全技术 生成式人工智能数据标注安全规范

网络安全技术 生成式人工智能预训练和优化训练数据安全规范

网络安全标准实践指南——人工智能生成合成内容标识方法

网络安全标准实践指南——人工智能生成合成内容检测技术指南

关于通用人工智能模型提供者义务范围澄清指南的制定开展针对性咨询

通用人工智能模型提供者指南

政务大模型应用安全规范(征求意见稿)

人工智能通用大模型合规管理体系 指南

人工智能算法安全评估规范(征求意见稿)

工业和信息化领域人工智能安全治理标准体系建设指南(2025版)

生成式人工智能开发和利用个人信息处理指南

移动智能终端端侧大模型安全实施指南

安全应急大模型标准(征求意见稿)

政务大模型应用安全规范

《人工智能安全治理框架》2.0版

智能终端大模型应用评估规范

人工智能生成合成内容标识管理能力要求

智能体信任评估实施指南(征求意见稿)

生成式人工智能模型训练合规技术规范

智能终端大模型应用评估规范

智能体行为安全要求

大模型一体机产品安全基本要求

人工智能计算平台安全框架

人工智能数据处理伦理要求

人工智能通用大模型合规管理体系指南

生成式人工智能服务安全应急响应指南

大模型一体机产品安全基本要求

人工智能训练数据清洗安全指南

人工智能应用安全指引 总则

人工智能应用安全指引 广播电视和网络视听

用户使用人工智能服务安全指南

智能体安全评测规范

智能体任务执行安全要求

生成式AI内容安全与伦理审查规范

人工智能网络安全框架规范

智能体人工智能模型治理框架

网络安全标准化技术研究报告-智能体安全标准化研究

②行业解决方案

大模型时代下的安全挑战及应对

腾讯大模型安全治理实践

360集团应用安全和基础安全建设实践

大模型与智能体安全风险治理与防护

AIGC安全评估解决方案

京东云大模型安全实践

安全大模型发展路径洞察与实践

LLM-WAF:大模型安全防护

供应链风险决策大脑:驱动供应链风控迈向智能决策时代

③行业技术报告

Agentic AI安全技术应用报告

AI 组织责任:治理、风险管理、合规与文化方面

人工智能安全作为全球公共产品:影响、挑战与研究重点

AI应用于进攻性安全

人工智能法律政策图景研究报告(2025年)

云上人工智能安全发展研究报告(2025)

大模型训练数据安全研究报告

智能体安全实践报告

前沿人工智能风险管理框架

生成式人工智能与著作权:训练、创作及监管

AI风险缓解措施的研究报告

安全优先的大模型研究报告

AI赋能主动防御技术应用指南(2025版)

AI时代数字身份安全技术应用指南

AI时代网络安全产业人才发展报告(2025年)

端侧大模型安全风险与治理研究

人工智能治理案例集(2025)

机密计算保障人工智能系统安全研究报告

算力网络数据安全研究报告

人工智能安全研究报告——技术视角下的安全风险梳理与应对(2025)

金融大模型应用安全研究报告(2025)

AI模型风险管理框架

智能化安全运营中心应用指南

大模型组件漏洞与应用威胁安全研究报告

安全智能体魔方:成熟度模型评价研究报告

金融生成式AI多模态内容鉴伪与安全防御报告(2025)

2025全球可信AI治理与数据安全报告

AI时代Agent原生企业崛起-现状、趋势与风险控制(2025版)

AI安全:构建负责任且可靠的系统

Google Gemini AI安全性与红队报告

AI安全指数报告

人工智能安全与治理现状报告

开源大模型法律风险及防范

2025年度全球人工智能治理报告

智能物联网(AIoT)安全技术与应用研究报告(2025年版)

通信行业人工智能数据治理实践指南

人工智能推动金融数据治理转型升级研究报告

人工智能安全治理研究报告(2025年)

数据治理研究报告-端侧大模型数据治理法律要点研究

人工智能3.0:智能浪潮下的法律、博弈与战略报告

行业数智化AI安全实践研究报告

人工智能用户权益保护关键问题研究报告

人工智能安全指数报告

人工智能治理研究报告(2025年)

OpenClaw运行机制与安全威胁研究

2026年国际人工智能安全报告

2026前沿人工智能风险管理框架报告

最全企业级安全养虾教程

Openclaw安全实战指南

AI与数据合规-境内外资讯三月刊

行业技术白皮书

终端智能体安全2025

AI风险控制实践白皮书

医疗健康大模型伦理与安全白皮书

人工智能安全治理白皮书

AI基础设施安全白皮书(2025)

AI智能体安全治理白皮书

大模型安全密码应用白皮书

金融人工智能发展与安全白皮书(2025)

阿里云百炼安全白皮书(2025)

智慧城市低空应用人工智能安全白皮书

AI 隐私安全白皮书

大模型安全白皮书

华为算力基础设施安全技术白皮书

AIGC全生命周期业务风控白皮书

AI-R-SOCC AI就绪的安全合成管理中心白皮书

低空智能网联网络与数据安全体系白皮书(2025)

以新质战斗力引领“AI+”时代网络安全

中国Data&AI数据基础设施白皮书

人工智能安全风险测评(2025 年)-白皮书

生成式 AI 安全白皮书

移动终端智能体隐私安全白皮书

AI安全合规白皮书

AI时代数据治理白皮书2025

AI 网络爬虫安全白皮书

AI智能体的实践应用:评估与治理基础框架白皮书

具身智能安全技术白皮书:机器人篇

火山方舟大模型服务安全白皮书解读:全周期安全可信,会话无痕

行业技术论文

在MCP驱动的智能代理系统中识别和缓解第三方安全风险

LLM驱动的AI Agent通信:协议、安全风险与防御对策

实务手册指南

⼤模型及多智能体系统安全⻛险分析和洞察

AI 安全⻛险评估和控制指南

生成式AI红队百次测试经验白皮书

大语言模型Prompt攻击手册

AI迷思录(应用与安全指南)

Agentic AI 红队测试指南

AI安全的红队测试方法指南

AI安全与数据保护中的法律与合规

涉及个人数据的安全AI系统基础

大型语言模型 (LLM) 安全风险、案例与防御策略

LLM越狱攻击与防御框架

生成式人工智能服务备案表&登记表

AI智能体运行安全测试标准

大模型安全威胁框架

大模型安全开发手册

人工智能安全承诺实践披露

人工智能控制矩阵

大模型 私域部署安全落地参考手册

人工智能系统开发测试与评估指南

前沿人工智能模型安全框架示例

红队AI:攻击与防御智能系统

prompt越狱手册

覆盖700余种风险,MIT发布最全AI风险数据库

人工智能系统风险管理指南

AI大模型合规100问

OWASP 智能体应用 Top 10 2026

智能体应用程序安全指南

AI智能体—威胁与缓解措施

生成式人工智能服务合规备案指南(2026年)

OpenClaw极简安全实践指南

OpenClaw网络安全风险分析和防护措施指南

OpenClaw(龙虾)专项安全风险预警以及建议防护方案-奇安信

OpenClaw安全风险分析及防护建议-启明星辰

AI安全新人扫盲

OpenClaw安全部署与实践指南(360护航版)

云上养虾(OpenClaw)安全指南

OpenClaw安全操作指南

AI Red攻防指南

⑦行业大会分享PPT
Deepseek应用场景中需要关注的十个安全问题和防范措施
大型语言模型(LLMs)安全防护指南

大模型驱动安全升级:腾讯代码安全应用实践

百度端侧大模型的安全建设:如何在算力与保障之间找到平衡

京东大模型安全挑战与实践:构建AI时代的安全防线

大模型平台与应用安全防护

LLM内容安全性的挑战与优化从数据到算法

MCP协议标准化研究工作沙龙—— 大模型与智能应用的信息交互主题精彩回顾

DeepSeek R1技术复现与大模型的治理与安全

AI重构全球数字基建:美的多云统一数字化底座与出海的安全合规建设

金融AIGC安全攻防构建大模型时代的数字内容风控体系

教育大模型评测体系构建与场景化测试实践

大模型幻觉检测在垂域任务的应用实践

AI赋能eBay支付风控:从用户行为到交易安全的全面智能化

大模型驱动的账户风险管理

代码大模型的安全问题 - 终端用户与模型供应商的双重视角

论如何控制大模型

大模型驱动的数据清洗与数据合规

百度基于大模型安全运营的质效提升实践

大模型上线备案&算法备案全析

AI Agent应用攻击面漫谈

LLM 间接提示注入 漏洞解析与防御路线

大模型合规安全审计

LLM&Agent安全防护实战:业务落地视角下的风险管控与解决方案

AI安全提示词注入分享

火山引擎AI安全保障实践

AI赋能红队的技术实践与效能突破

组件安全:AI检测与漏洞利用路径预测

智体赋能:基于大模型Agent的自动化渗透测试框架设计与实践

腾讯大模型安全治理实践

大模型驱动的自动化渗透测试边界突破实践

AI大模型在数据安全领域的实践探索

AI算法可信安全:如何从根本上打破AI黑盒

在幻觉与超能中前行:大模型参与安全运营的应用探索

微步安全AI实践

AI智能体安全治理的认识和实践

大语言模型中的事实性幻象

大模型安全治理与评测体系化研究与实践

人工智能时代的个人信息保护:挑战与机遇

AI赋能的DevSecOps自动化安全实践

LLMAgent安全攻防战从架构风险到应用实战剖析

AI生成代码安全边界测绘与选型指南

百度大模型 原生安全构建之路

大模型安全考量:安全的大模型解决方案

DeepSeek赋能安全运维智能化转型的实践之道

AI数据资产体系建设:从数据处理到模型评估的全生命周期闭环

从技术赋能到范式革新:快手安全大模型驱动内容审核智能化重塑

面向AI场景:可观测平台在安全运营体系建设中的实践

APP隐私合规检测-AI隐私文本分析模型

大模型安全风险与对抗实践培训

AI赋能红队的新优势

OWASP大模型安全Top 10分析与实践

智能体应用和大模型安全评测实践

检测与响应:大模型与SOAR驱动的自动化漏扫运营

攻防加速:大模型赋能 VxWorks 漏洞分析与验证效能革新

大小模型协同驱动安全升级-基于大小模型协同的数字内容风控实践

面向未来的DevSecOps:Kodem如何用AI重塑应用安全

隐私不上云,模型放心用:通过结构化语义标签实现隐私防火墙

基于Spec Driven范式,开发安全可控的SRE智能体

NLP类AI系统鲁棒性评测挑战与实践

AI驱动的智能体、车端协议与供应链安全闭环

LLM白盒检测水平越权漏洞实践

AI辅助整车信息安全TARA分析探索

大模型供应链安全的熵增效应:风险挖掘与熵减策略

AI与安全的双向赋能:从对抗到防御

基于大模型Agent构建自动化渗透测试平台的探索

AI落地软件开发的实践与挑战(华为)

攻击者视角下的业务智能体渗透

构筑智能化攻防格局_网络安全实验室的战略与未来蓝图

企业内部的渗透测试自动化探索

机遇和挑战:大模型及其生态的安全性和脆弱性

AI红队攻防实践

大模型应用落地安全风险和防护实践

轻装上阵_Javassist聚焦代码审计关键点实践

安全领域大模型构建范式与实践

安全智能重构:大模型安全应用研究前沿

基于大模型的安全智能中心CIC Pro

SecGPT赋能网络安全-MCP助力下的创新与挑战

大模型供应链安全风险技术拆解与案例复现

从应用落地到安全护航:Agent系统的开发实践与可信防御

揭秘黑灰产AI的潘多拉魔盒

大模型及其智能体安全

产品视角下的安全革新:AI漏洞猎人如何破解代码漏洞挖掘痛点

智算安全可信行业观察

Fuzzing4LLM:撬动大语言模型的安全对齐机制

AI 渗透的蜂群思维-轻量级多Agent协同与实战复盘

AI驱动二进制安全-从静态到动态的探索

Agentic AI时代下的应用安全演进

基于AI的车联网渗透及法规检测

多智能体协同驱动的自主进化渗透测试系统

大模型驱动下的稳定与安全双螺旋——从“事后救火”到“主动免疫”的技术进化

Cruiser:CTF Agent实现探索

AI上车的安全合规分析与实践

AI时代的新型威胁-企业防范AI投毒与AI幻觉指南

360基于大模型赋能的网络安全解决方案

AI 红队智能进化大模型与智能体驱动的自动化渗透测试及安全验证

AI驱动下石油石化行业的安全新挑战与协同应对

人工智能安全与可信赖AI验证技术

企业网络安全智能防御体系建设与实践

Skill赋能安全测试:AI Agent安全能力扩展实战指南

企业智能应用研管平台的建设及安全防护策略研究

智能革命时代:自主智能体兴起与安全范式重塑

免责声明:以上报告均系通过公开、合法渠道获得,版权归原撰写/发布机构所有,如涉侵权, 请联系及时删除;内容为推荐阅读仅供参考学习,如对内容存疑请与原撰写/发布机构联系。
戳底部“阅读原文”或扫描上面交流群群主二维码扫码加入获取文档,打广告者勿扰

点分享

点收藏

点在看

点点赞

 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON