Anthropic研究报告:AI对劳动力市场影响有限_展会资讯_资讯

Anthropic研究报告:AI对劳动力市场影响有限

已关注

关注

重播分享赞

旧金山，2026 年 3 月 9 日 —— Anthropic 今日发布最新研究报告，引入了一种衡量 AI 对劳动力市场影响的全新框架，并基于早期数据发现，到目前为止，AI 对就业的影响仍然有限。

研究背景与方法

该研究由 Anthropic 的 Maxim Massenkoff 和 Peter McCrory 共同完成，旨在建立一种可靠的方法来衡量 AI 如何影响就业市场。研究团队采用任务级方法，结合了 O*NET 数据库的任务信息、Anthropic Economic Index 的实际使用数据，以及 Eloundou 等人（2023 年）的理论 AI 能力评估。

研究团队提出的“观察暴露”（Observed Exposure）指标，旨在量化那些理论上可以被 LLM 加速的任务中，实际上在专业环境中被自动化使用的比例。这一指标比单纯使用理论能力更为精准，能够更早地捕捉到经济变化。

主要发现

最易受影响的职业： 计算机程序员以 75% 的任务覆盖率位居首位，其次是客户服务员（67%）和数据录入员（67%）。在职业类别层面，计算机与数学类职业理论上 94% 的任务可以被 LLM 执行，但实际观察到的覆盖率仅为 33%。

就业影响： 研究使用美国当前人口调查数据进行分析，发现最易受 AI 影响职业的失业率与不受影响职业的失业率之间没有显著差异。然而，研究发现年轻工人（22-25 岁）进入高暴露职业的招聘率下降了约 14%，这一发现与 Brynjolfsson 等人（2025 年）的研究结果相呼应。

劳动力特征： 研究还揭示了高暴露与低暴露工人之间的显著差异。高暴露群体中，女性占比高出 16 个百分点，白人占比高出 11 个百分点，亚裔占比近两倍，平均收入高出 47%，且拥有研究生学位的比例是低暴露群体的近四倍。

研究意义

Anthropic 研究团队表示：“这项研究是记录 AI 对劳动力市场影响的初步尝试。我们希望随着新的就业和 AI 使用数据出现，这套分析方法能够便于更新。建立一个成熟的方法论框架有助于未来的观察者从噪声中分离出真实的信号。”

研究团队同时指出，这项框架在效果不明显时最为有用——可能有助于在劳动力 displacement 变得明显之前识别出最脆弱的职业。

全文翻译

AI对劳动力市场的影响

核心发现

本研究报告提出了一种理解 AI 对劳动力市场影响的新框架，并基于早期数据进行了验证。研究发现，目前为止 AI 对就业的影响证据有限，尽管在高暴露职业中年轻工人的招聘放缓方面存在一些初步迹象。

引言

AI 的快速扩散正在催生一波研究和预测其对劳动力市场影响的热潮。然而，以往方法的记录表现让我们有理由保持谦逊。

例如，一项著名的关于工作外包可行性的研究识别出大约四分之一的美国工作存在脆弱性，但十年后，这些工作中的大多数仍保持着健康的就业增长。政府自身的职业增长预测虽然方向正确，但除了对过去趋势的线性外推外，几乎没有增加任何预测价值。即使在事后看来 major 经济冲击对劳动力市场的影响也往往不清楚。关于工业机器人就业影响的研究得出了相互对立的结论，而归因于中美贸易冲击的就业流失规模仍在争论中。

在本文中，我们提出了一种理解 AI 对劳动力市场影响的新框架，并利用早期数据对其进行验证，发现目前 AI 对就业影响的证据有限。我们的目标是建立一种衡量 AI 如何影响就业的方法，并定期重新审视这些分析。这种方法无法捕捉到 AI 重塑劳动力市场的所有渠道，但通过在产生重大影响之前奠定这一基础，我们希望未来的发现能够比事后分析更可靠地识别经济 disruption。

AI 的影响可能显而易见。这种框架在效果不明显时最为有用——它可能有助于在劳动力 displacement 变得可见之前识别出最脆弱的工作。

反事实

因果推断在效果 large 且 sudden 时更容易。COVID-19 大流行病及其伴随的政策措施造成的经济 disruption 如此明显，以至于对于许多问题不需要复杂的统计方法。例如，失业率在大流行病的早期几周内急剧上升，几乎没有其他解释的空间。

然而，AI 的影响可能不像 COVID，而更像互联网或与中国的贸易。影响可能不会立即从总体失业率数据中显现出来；贸易政策和商业周期等因素可能会混淆对趋势线的解读。

一种常见的方法是比较更多或更少暴露于 AI 的工人、企业或行业的结果，以将 AI 的影响与混淆因素隔离开来。暴露通常在任务层面定义：例如，AI 可以批改作业但不能管理教室，因此教师被认为比那些整个工作都可以远程完成的工人暴露程度更低。

我们的工作遵循这种基于任务的方法，结合理论 AI 能力和实际使用量的衡量，然后汇总到职业层面。

衡量暴露

我们的方法结合了三个来源的数据：

O*NET 数据库，它枚举了美国约 800 个独特职业的相关任务。
我们自己的使用数据（来自 Anthropic 经济指数的衡量）。
Eloundou 等人（2023 年）的任务层面暴露估计，衡量理论上 LLM 是否可能使一项任务的速度至少加快一倍。

Eloundou 等人的指标β以简单量表对任务进行评分：如果一项任务可以由 LLM 单独完成速度加倍，则为 1；如果需要 LLM 之外的额外工具或软件，则为 0.5；否则为 0。

为什么实际使用可能落后于理论能力？一些理论上可能的任务可能由于模型限制而未出现在使用数据中。其他的可能由于法律约束、特定软件要求、人工验证步骤或其他障碍而扩散缓慢。例如，Eloundou 等人将“授权药品补充并向药房提供处方信息”标记为完全暴露（β=1）。我们尚未观察到 Claude 执行此任务，尽管该评估似乎是正确的，因为理论上 LLM 可以加速这项任务。

也就是说，这些理论能力和实际使用的衡量高度相关。如图 1 所示，在前四份经济指数报告中观察到的任务中，97% 属于 Eloundou 等人认为理论上可行的类别（β=0.5 或β=1.0）。

图 1：Claude 使用量按 Eloundou 等人任务暴露评级的分布

该图显示了按理论 AI 暴露分组的 O*NET 任务中 Claude 使用量的分布。β=1（LLM 单独完全）的任务占可行观察到的 Claude 使用量的 68%，而β=0（不可行）的任务仅占 3%。Claude 使用量数据来自前四份经济指数报告。

职业暴露的新衡量方法

我们的新衡量方法“观察到的暴露”旨在量化：在那些 LLM 理论上可以加速的任务中，哪些实际上在专业环境中看到了自动化使用？理论能力涵盖了更广泛的任务范围。通过追踪这一差距如何缩小，观察到的暴露能够及早洞察经济变化。

我们的衡量方法定性地捕捉了我们认为可预测工作影响的 AI 使用的几个方面。工作的暴露程度更高，如果：

我们在附录中给出数学细节。我们将理论上 LLM 能够完成的任务计为已覆盖，前提是这些任务在 Claude 流量中有足够的工作相关使用。然后我们根据任务的执行方式进行调整：完全自动化的实现获得全部权重，而增强性使用获得一半权重。最后，任务层面的覆盖措施按每个任务所花费的时间比例加权平均到职业层面。

图 2 显示了观察到的暴露（红色）与 Eloundou 等人的β（蓝色）的对比，说明了我们平台上理论使用与实际使用之间的差异，按广泛职业类别分组。我们首先按时间 fraction 衡量加权平均到职业层面，然后按总就业加权平均到职业类别。例如，β衡量显示 LLM 在计算机与数学（94%）和办公室与行政（90%）职业的大多数任务中有渗透空间。

图 2：按职业类别的理论能力和观察到的暴露

LLM 理论上可以执行的工作任务份额（蓝色区域）以及我们从使用数据得出的工作覆盖衡量（红色区域）。

红色区域（来自 Anthropic 经济指数的 LLM 使用）显示了人们如何在专业环境中使用 Claude。覆盖显示 AI 远远未达到其理论能力。例如，Claude 目前仅覆盖计算机与数学类别所有任务的 33%。

随着能力进步、采用扩散和部署深化，红色区域将增长覆盖蓝色区域。同样也有大量未覆盖的区域；当然，许多任务仍然超出 AI 的范围——从如修剪树木和操作农业机械的体力农业工作，到如在法庭上代表客户出庭的法律任务。

图 3 显示了在此衡量下暴露程度最高的十个职业。与其他显示 Claude 广泛用于编码的数据一致，计算机程序员位居首位，覆盖率为 75%，其次是客户服务员，我们越来越多地在第一方 API 流量中看到他们的主要任务。最后是数据录入员，他们的主要任务（读取源文档和输入数据）看到了显著的自动化，覆盖率为 67%。

图 3：暴露程度最高的职业

使用我们的任务覆盖措施，暴露程度最高的十个职业。

在另一端，30% 的工人有零覆盖，因为他们的任务在我们的数据中出现频率太低，无法达到最低阈值。这一群体包括厨师、摩托车修理工、救生员、调酒师、洗碗工和试衣间服务员等。

暴露如何追踪预测就业增长和工人特征

美国劳工统计局（BLS）定期发布就业预测，最新一组发布于 2025 年，涵盖 2024 年至 2034 年每个职业的预测就业变化。在图 4 中，我们将工作层面的覆盖措施与其预测进行比较。

按当前就业加权的职业层面回归发现，对于观察暴露更高的职业，增长预测略弱。对于覆盖每增加 10 个百分点，BLS 的增长预测下降 0.6 个百分点。这提供了一些验证，表明我们的衡量与劳动力市场分析师独立得出的估计一致，尽管关系微乎有趣的是，使用 Eloundou 等人的衡量 alone 没有这种相关性。

图 4：2024-2034 年 BLS 预测就业增长与观察到的暴露

带 25 个等大小分箱的散点图。每个实心点显示其中一个分箱的平均观察暴露和预测就业变化。虚线显示简单线性回归拟合，按当前就业水平加权。小菱形标记了用于说明的个体职业示例。

图 5 显示了暴露程度最高的前四分位工人与 ChatGPT 发布前三个月（2022 年 8 月至 10 月）零暴露的 30% 工人的特征，使用当前人口调查数据。差异非常明显。暴露更多的群体女性可能性高 16 个百分点，白人可能性高 11 个百分点，亚裔可能性近两倍。他们平均收入高出 47%，教育水平更高。例如，研究生学历者在未暴露群体中占 4.5%，但在暴露程度最高的群体中占 17.4%，近四倍差异。

图 5：高暴露和低暴露工人的差异，当前人口调查

确定结果优先级

有了这些暴露衡量，问题是应该寻找什么。研究人员采取了不同的方法。例如，Gimbel 等人（2025 年）使用当前人口调查追踪职业构成的变化。他们的论点是，AI 对经济的任何重要重塑都会表现为就业分布的变化。（他们发现，到目前为止，变化并不显著。）Brynjolfsson 等人（2025 年）使用薪资处理公司 ADP 的数据按年龄组查看就业水平，而 Acemoglu 等人（2022 年）和 Hampole 等人（2025 年）分别使用 Burning Glass（现为 Lightcast）和 Revelio 的招聘信息数据。

我们将失业作为优先结果，因为它最直接地捕捉到潜在的经济伤害——失业者想要一份工作但尚未找到。在这种情况下，招聘信息和 employment 不一定表明需要政策回应；高暴露职位的招聘下降可能会被相关职位的增加所抵消。Most harmful 劳动力市场发展 AI 应该包括一段失业增加时期，因为被取代的工人正在寻找替代方案。当前人口调查非常适合追踪这一点，因为失业受访者会报告他们以前的职业和行业。

初步结果

接下来，我们研究失业趋势，将职业层面的衡量与当前人口调查中的受访者匹配。

解释我们的覆盖措施的一个关键问题是，哪些工人应该被视为处理对象？是否应该预期仅 10% 的任务覆盖就会导致就业变化？Gans 和 Goldfarb（2025 年）表明，如果 O 形环模型最能描述工作，就业 effects 可能只有在所有任务都有一定程度的 AI 渗透才会看到。Hampole 等人（2025 年）认为平均暴露会降低劳动力需求，但仅在某些任务中的暴露集中可以抵消这一点。Autor 和 Thompson（2025 年）强调了剩余任务所需的专业水平。

鉴于简洁性，并注意到我们最关心大的影响，我们将分析中心放在影响应该在平均暴露最高的群体中感受最强烈这一想法上。我们将时间加权任务覆盖前四分位的工人与后四分位进行比较。如果 AI 能力快速推进，覆盖可能对较低百分位数的覆盖很高，这可能使绝对阈值更有帮助。但我们做出假设，影响应该首先影响暴露最高的工人，并展示改变我们用来定义处理的分界点的结果。

图 6 的上半部分显示了自 2016 年以来暴露程度最高的前四分位工人和未暴露群体的失业率原始趋势。在 COVID 期间，较少暴露于 AI 的工人——更可能有现场工作——看到了更大的失业增长。自那时以来，两组之间的趋势大体相似。下半部分以双重差分框架衡量最暴露和最不暴露工人之间的差距，镜像原始数据的发现。自 ChatGPT 发布以来，差距的平均变化很小且不显著，表明更多暴露群体的失业率略有上升，但效果与零无法区分。

图 6：观察暴露最高四分位和零 AI 暴露工人的失业率趋势，当前人口调查

上半部分显示了暴露最高四分位工人（红线）和零暴露 30% 工人的失业率。下半部分以双重差分框架衡量这两个序列之间的差距。

这种框架可以识别什么样的情景？基于汇总估计的置信区间，约 1 个百分点的差异化失业增加将是可检测的（这将随着新数据出现而改变，所以只是一个粗略估计）。如果前 10% 内的所有工人被解雇，它将使前四分位群体的失业率从 3% 增加到 43%，并将总体失业率从 4% 增加到 13%。

一个较小但仍令人担忧的影响将是“白领工人衰退”这样的情景。在 2007-2009 年大衰退期间，美国失业率从 5% 翻倍至 10%。前四分位暴露的这种翻倍将使其失业率从 3% 增加到 6%。这在我们的分析中也应该是可见的。请注意，我们的核心估计基于暴露群体与较少暴露群体相比失业率的差异化变化。如果所有工人的失业率并行增加，我们不会将其归因于仍有许多任务不受影响的 AI 进步。

一个特别令人关注的群体是年轻工人。Brynjolfsson 等人报告 22 至 25 岁工人在暴露职业中的就业下降 6-16%。他们将这种下降主要归因于招聘放缓，而非离职增加。

我们发现暴露职业中年轻工人的失业率持平。但招聘放缓不一定表现为失业增加，因为许多年轻工人是劳动力市场新人，在 CPS 数据中没有列出的职业，可能退出劳动力市场而非表现为失业。为了直接解决招聘问题，我们利用 CPS 的面板维度，统计在更暴露与较少暴露职业中开始新工作的年轻工人（22-25 岁）的百分比。图 7 显示了年轻工人按进入高暴露 versus 低暴露职业分类的月度就业找到率（即工人报告他们上个月没有的工作的月份）。

图 7：22-25 岁工人在高观察暴露和零 AI 暴露职业中的新工作开始数，当前人口调查

上半部分显示了年轻工人在高暴露 versus 零暴露职业中开始新工作的百分比。下半部分以双重差分框架衡量这两个序列之间的差距。

除了 2020-2021 年的一些大幅波动外，这些序列在 2024 年明显分化，年轻工人相对不太可能被招聘到暴露职业。较少暴露职业的就业找到率保持在每月 2%，而进入最多暴露职业的招聘下降约半个百分点。ChatGPT 时代后与 2022 年相比，暴露职业的就业找到率平均下降 14%，尽管这在统计上仅略显著。（25 岁以上的工人没有这种下降。）

这可能提供了一些 AI 对就业影响的早期信号，并与 Brynjolfsson 等人的发现相呼应。但也有几种替代解释。未招聘的年轻工人可能留在现有工作、从事不同工作或重返学校。另一个数据相关的警告是，调查中的工作转换可能更容易出现测量误差。

讨论

本报告介绍了一种理解 AI 对劳动力市场影响的新衡量方法，并研究了对失业和招聘的影响。工作的 AI 暴露程度越高，其任务在理论上越能被 LLM 完成，并在我们平台上看到自动化的实际工作相关使用。我们发现计算机程序员、客户服务员和金融分析师是暴露程度最高的。使用美国调查数据，我们发现暴露程度最高职业的工人失业率没有受到影响，尽管有初步证据表明 22-25 岁工人进入这些职业的招聘略有放缓。

我们的工作是记录 AI 对劳动力市场影响的初步尝试。我们希望随着新的就业和 AI 使用数据出现，本报告中特别是关于覆盖和反事实的分析步骤将便于更新。一种既定的方法可能有助于未来的观察者从噪声中分离出信号。

目前的工作有几项改进。我们的使用数据将纳入未来更新，形成经济中任务和职业覆盖的动态图景。Eloundou 等人的衡量也可以更新，只要它与 2023 年初的 LLM 能力相关联。而且，鉴于关于年轻工人和劳动力市场新进入者的 suggestive 结果，关键的下一步可能是查看拥有暴露领域教育证书的应届毕业生如何驾驭劳动力市场。

致谢

由 Maxim Massenkoff 和 Peter McCrory 撰写。

鸣谢：Ruth Appel、Tim Belonax、Keir Bradwell、Andy Braden、Dexter Callender III、Miriam Chaum、Madison Clark、Jake Eaton、Deep Ganguli、Kunal Handa、Ryan Heller、Lara Karadogan、Jennifer Martinez、Jared Mueller、Sarah Pollack、David Saunders、Carl De Torres、Kim Withee 和 Jack Clark.

我们还感谢 Martha Gimbel、Anders Humlum、Evan Rose 和 Nathan Wilmers 对早期版本报告的反馈。

来源：Anthropic 研究 (anthropic.com/research/labor-market-impacts）发布日期：2026 年 3 月 9 日