Claude 0218最新研究报告显示人们越来越信任 AI Agent 了
看了一下 anthropic 的一篇《Measuring AI agent autonomy in practice》报告,发现几个有趣的现象图中显示了2025年9月底到2026年2月中旬,使用 claude code 的单次任务时间从25分钟上升到45分钟,说明 AI 能处理复杂任务的能力也在加强,人们也越来越相信 AI 能把任务处理得更好。越来越多的用户使用自动批准 AI 执行任务了,特别是长期使用 claude code 的人,不过报告也指出 claude 在复杂任务中,也会自行中断向用户询问更具体的任务信息,主要有以下几种越来越多人开始尝试在金融交易(如加密货币自动交易)、医疗信息处理等天然具有风险和代价的领域应用 AI 了, 但目前这类流量在 claude 的统计中占比很小,且估计是人们进行的“评估”或“模拟测试”。说明 AI 具备执行高风险任务的能力了,未来应该会有更多落地场景。从图中可以看出,软件开发领域一枝独秀,看来其他方面,AI 实际落地还有些困难,但是没想到营销和文案创作在 claude code 这里才 4.4%,是不是这个领域的人都不使用 claude ?总的来说,AI 现在还是在普及阶段,除了软件领域外,其他领域结合 AI 的项目应该会有更多的机会。