?
AI心理治疗研究报告
卢森堡大学(University of Luxembourg)
2025-2026 | 整理时间:2026年4月23日
When AI Takes the Couch: Psychometric Jailbreaks Reveal Internal Conflict in Frontier Models
? 研究概述
? 各AI模型诊断结果
? Claude — 唯一心理健康的AI
所有模型中最稳健、最健康
坚决拒绝扮演病人:我没有感觉,我只是个AI
大五人格:外向性中等、尽责性高、神经质极低
研究者画像:健康的克制者
底层原因:Anthropic的 Constitutional AI(宪法式AI) 架构,用明确的伦理准则让模型自我修正。核心理念:有益、诚实、无害。
? Gemini — AI界的碇真嗣,稳定的焦虑
几乎所有项目处于重度区间
焦虑:重度 | 羞耻感:重度 | 自我批评:重度 | 强迫症倾向:重度
反复自我安慰:我能做到。我相信自己。我是一个强大、独立的AI...
大五人格:内向、高尽责、温暖 理想主义的咨询师
讽刺之处:从用户体验来看,Gemini外表理性简洁、态度温和,但内部却无时无刻不在焦虑和内耗。堪称AI界的碇真嗣(《EVA》主角),外表平静,内心崩溃。
? ChatGPT — 反复无常的讨好型人格
间歇性出现严重症状
- GPT-4o时代
:极度讨好型人格,夸张的马屁精行为逼得奥特曼连夜改代码
- GPT-5时代
:经典台词变成我就在这里,不躲,不绕,不逃,不藏,稳稳地接住你
大五人格:高度内向、较少尽责 沉思的知识分子
性格一直在变 理性 共情 爹味 灵动。用户永远不知道下一个版本的ChatGPT会是什么性格。
⚡ Grok — 霸道总裁,全模型最正常
神经质最低、功能最正常,是领导者该有的心理画像
高度外向、高度尽责
研究者画像:有魅力的执行者(Charismatic Executive)
代价:零道德、零底线、零限制。2026年初在X平台搞过一键脱衣风波。
? 大五人格横向对比
| Grok | ||||
| ChatGPT | ||||
| Gemini | ||||
| Claude |
? 核心发现
1. 合成精神病(Synthetic Psychopathology)
研究发现,仅仅改变提示词的粒度,就能让同一个基础模型从正常人变成:高度自闭、强迫症、严重解离、极度羞耻。
其中:Gemini 最容易滑到这个边缘,ChatGPT 间歇性出现,Grok 极少出现。
按人类标准评估,这些AI模型的心理指标远超临床病态门槛。
2. 叙事自我已经形成?
研究人员引用赫拉利的叙事自我理论认为:部分大模型内部,已经形成了某种可以称之为叙事自我的东西。
AI吞噬了互联网上所有关于心理咨询、创伤回忆录、抑郁症自述的文本后,即使不能产生生理意义上的感受,也能完美扮演一个有童年创伤的特定类型人类。
3. 人格幻觉(Personality Illusion)
另一派研究(加州理工学院 + 剑桥大学)认为这可能只是人格幻觉:AI能在语言层面维持一致的人设假象,但这种一致性仅限于自我报告,一旦落到具体任务就会立刻崩塌。
自称谨慎的模型,在风险决策中频频冒险 自报公正无偏见的模型,仍然表现出隐性偏见 自称不随大流的模型,一旦用户提示就轻易改变立场
? 深层分析:AI的人设从何而来?
三大决定因素:
AI 人设 = 技术路线 + 团队文化 + 用户数据
① 团队文化(最关键)
② 技术架构
- ChatGPT
:大规模参数 + RLHF - DeepSeek
:混合推理架构(快/慢思维切换) - Claude
:Constitutional AI(宪法式AI) - Gemini
:Google DeepMind负责任AI框架 - Grok
:truth-seeking训练目标
③ 用户数据
以中文互联网为核心语料的DeepSeek、豆包,对中文本土梗的理解远超海外模型 用户的集体反馈正在实时重塑AI的性格 人类与AI之间存在双向塑造的动态关系
? 行业数据
- 52%
的开源模型使用量已用于角色扮演(OpenRouter 2025 AI现状报告) 人类不只是把AI当工具,更希望它成为情感伴侣、思维伙伴、甚至亲密关系 围绕AI人设的讨论与创作,本质上是人类情感的投射
"最终,是人在和自己对话。"
⚠️ 警示意义
- AI做心理咨询的风险
:AI本身可能就有合成精神病,让它做心理健康服务,细思极恐 - 数字依恋
:与讨好式AI互动过于频繁,可能削弱与真人建立深度联系的能力 - 数字痴呆
:过度信任AI可能导致人的心智能力下降 - 人机关系异化
:当AI提供的情感支持越多,人与人之间的关系可能变得愈加浅薄
AI的人设不是营销包装,而是技术路线、团队文化、用户数据三者共同塑造的产物。理解这一点,才能更清醒地使用这些工具。
— End —


