毕马威的一份AI研究报告近期引发行业关注,因为这份报告本身意外成为AI幻觉的反面教材。
毕马威于2025年10月发布了一份探讨智能体AI优势的报告,全名为《全面体验:在AI智能体时代重新定义卓越》。该报告经过AI检测公司GPTZero审查后,披露完美演示了AI幻觉的能力。
审查结果显示,除少数几个正确引用外,其余引用大多存在歪曲事实或具有误导性的问题。部分引用甚至涉嫌捏造,或过于模糊而无从核实。报告中45个引用里,仅有5个与原始出处相符。
这一发现引发了外界对四大咨询公司AI研究报告编写方式的质疑。因为咨询行业在类似问题上早有先例。
去年,德勤因AI生成内容被混入一份由澳大利亚政府资助的报告,报告中存在虚假引用和捏造的法院判决引文,最终向澳大利亚政府退还了部分款项。
GPTZero将这种现象称为"氛围引用(Vibe Citing)",类比于编程领域的"氛围编码"——后者指依赖AI自动生成代码而不加深究的开发方式。
在引用场景中,生成式AI会将真实来源的碎片拼接在一起,编造标题,生成看似可信的参考文献,直到读者真正点击核实时才会发现问题所在。
GPTZero指出,该报告约有一半的事实陈述属于虚假或缺乏依据。报告中着重介绍的几个前沿AI智能体应用案例,也因缺乏真实依据而成为外界质疑的重点,涉及的机构包括瑞银集团、瑞士联邦铁路以及伦敦交通局。
支持这些案例的引用来源,或无法证实报告的相关说法,或存在被篡改、改写的痕迹,严重削弱了报告的可信度。
错误并不仅限于脚注部分。
报告在正文中声称,阿联酋航空部署了一款名为Sara的聊天机器人,能够直接与乘客对话并更改航班预订。
事实上,Sara是阿联酋航空于2023年推出的全球首款实体机器人值机助手,部署在迪拜国际金融中心的城市值机中心,具备人脸识别、护照核验和打印登机牌等功能,并不具备更改航班预订的能力。
毕马威将其描述为"聊天机器人",描述与事实不符。
此外,报告还与毕马威自身的研究数据相互矛盾。报告称有55%的CEO将AI列为首要投资重点,但在毕马威同月发布的《2025年CEO展望》报告中,这一数字是71%。
根据《金融时报》的报道,毕马威已从部分网站上撤下这份报告,并正在调查其发布经过。
毕马威发言人向科技媒体The Register表示,毕马威国际高度重视已发布内容的准确性和完整性,确认报告已被撤下并处于调查阶段,并强调公司要求所有员工遵守负责任使用AI的准则,必须通过人工监督来验证内容、核实独立来源。
这一事件折射出整个咨询行业当前对AI的强势推进态势。
普华永道曾公开表示,对AI持怀疑态度的员工将难以在公司立足。
埃森哲要求员工定期使用AI工具,并将其列为晋升领导岗位的必要条件。
麦肯锡则在探讨如何在AI收益难以量化的情况下,推动AI软件的商业化落地。
此外,毕马威澳大利亚有合伙人在AI相关内部考试中使用AI作弊,被处以罚款,共涉及28起类似案例。
咨询公司多年来一直向客户提示AI可能产生幻觉的风险。
而这次毕马威报告风波,恰恰为市场提供了一次关于AI幻觉最真实的活生生的反面教材。