5月27日 AI科技日报与行业趋势

一、中国AI自己造了一个AI,现在的问题是:下一步?
5月27日,面壁智能联合清华大学团队公布了一项极具冲击力的成果:他们让 AI 自主设计并生成了另一个 AI 模型,官方称这是“全球首例 AI 自主生成 AI”。这一成果由名为「TinyZero」的系统完成,其核心目标并不是辅助人类开发模型,而是直接让 AI 参与模型架构、训练策略与优化流程的生成。
真正让行业震动的,并不是“AI 会写代码”——而是 AI 开始进入过去只有顶级研究员才能参与的核心研发环节。
按照量子位披露的信息,这套系统已经不再是传统 AutoML 那种“自动调参工具”。过去的 AutoML 本质上仍是人类预设搜索空间,机器负责穷举优化;而这次的方向,是 AI 开始主动探索“应该造什么样的 AI”。
过去两年,全球 AI 行业其实一直在朝这个方向试探。
OpenAI 的 Codex、Anthropic 的 Claude Code,能帮助开发者自动写代码;Google DeepMind 的 AlphaProof 能自动完成数学证明;Meta 也在研究让模型自动生成训练策略与数据筛选流程。但这些系统都有一个共同点:它们仍然是“辅助工具”。真正的决策权,依然在人类研究员手里。
而面壁这次最关键的意义在于,它第一次把“模型研发”这件事本身,部分交给了 AI。
更重要的是,这件事发生在中国。
过去很长时间,全球默认“最前沿 AI 范式创新”主要来自 OpenAI、DeepMind、Anthropic 等美国公司。但从今年开始,中国团队正在明显加速:
DeepSeek 用低成本训练冲击全球模型格局 阿里、字节开始推进 AI Agent 与自动化研发 国产 GPU 与自主算力体系开始形成闭环 现在,面壁智能首次把“AI 自主研发 AI”真正推进到落地层面
这意味着,中国 AI 已经不只是“追赶模型能力”,而是在参与下一代 AI 研发范式的定义。当然,目前这项技术距离“完全自主研发超级模型”还很远。公开信息显示,TinyZero 仍然需要人类设定目标与任务边界,它更像一个“AI 研究员雏形”,而不是彻底脱离人的超级系统。
但历史上很多真正改变世界的技术,第一次出现时,看起来都“不够强”。ChatGPT 刚出来时,也只是个会聊天的网页。没人想到三年后,它会开始写代码、做 Agent、生成视频、甚至开始“研究 AI 本身”。
而现在,AI 已经迈出了最关键的一步:
它开始尝试创造自己的下一代。
二、AI 开始影响就业结构,北京研究发现:“高技能陷阱”
5月,最新发表于 arXiv 的一项研究,正在引发 AI 与就业市场领域的广泛讨论。研究基于北京 2018 至 2024 年超过 500 万份招聘数据发现,生成式 AI 已经开始实质性改变高技能岗位的就业结构,并首次提出“High-Skill Trap(高技能陷阱)”这一概念。
研究显示,AI 的影响正在从过去的低技能、重复性劳动,快速扩散到程序开发、数据分析、金融研究、设计、运营等传统高认知职业领域。
过去几十年里,技术升级通常意味着更高技能、更高收入与更强职业壁垒,但 AI 正在改变这一逻辑。研究发现,北京 AI 高暴露区域虽然持续吸引大量高学历人才流入,但工资增长却开始出现明显停滞,高技能岗位正在出现“人才越来越多,但收入增长越来越慢”的现象。
研究团队指出,生成式 AI 带来的核心变化之一,是大量专业工作开始被“去技能化”。
过去需要多年经验才能完成的任务,如代码编写、数据整理、文案生成、视觉设计等,如今正在被 AI 工具快速标准化。
越来越多企业开始采用“少人 + AI”的工作模式,程序员使用 AI Coding 自动生成代码,设计师依赖生成式工具快速出图,运营与分析岗位则开始大量接入 Agent 工作流。
这意味着,企业对传统“执行型高技能劳动”的需求正在下降,而真正稀缺的能力,开始转向系统设计、复杂决策、AI 协同与跨领域整合能力。研究认为,这种变化将导致大量中高端岗位出现“技能缩水”,原本具备较高壁垒的知识型工作,正在逐渐被 AI 拉平。
三、AI 安全问题开始从“模型失控”转向“社会影响”
过去两年,AI 安全领域讨论最多的问题,一直是“模型会不会失控”。
无论是 OpenAI、Anthropic 还是全球各国监管机构,早期关注点几乎都集中在超级智能风险,例如 AI 是否会脱离人类控制、是否可能自主复制、是否会产生危险行为等。
但进入 2026 年后,越来越多研究开始发现,一个更现实、也更迫切的问题正在出现:相比遥远的“超级 AI 威胁”,当前大模型对现实社会结构、舆论环境与人类认知的影响,已经开始真正落地。
AI 安全问题,正在从“模型失控风险”,转向“社会影响风险”。
近期,多篇国际研究与 AI 安全报告开始集中关注这一变化。
其中一项发表于 arXiv 的研究指出,多个主流大模型在涉及战争、民族冲突、国际政治与历史事件等敏感议题时,已经出现明显的“社会认知偏差”。
研究人员发现,一些模型会在暴行、战争责任与种族冲突问题上,表现出“错误平衡(False Balance)”倾向。
也就是说,AI 会试图以“保持中立”的方式处理问题,但这种中立本身可能扭曲事实。例如,在涉及战争罪行、极端主义或历史暴行时,部分模型会使用模糊表达弱化责任归属,甚至在受害者与施害者之间制造一种“双方都有道理”的假象。研究认为,这种问题并非简单的模型错误,而是 AI 已经开始影响公众对现实事件的理解方式。
大模型与前沿技术
DeepMind一口气解完9道埃尔德什问题
Google DeepMind的AlphaProof Nexus又发了一轮战报——这次是9道埃尔德什问题,全部搞定。埃尔德什问题之所以特殊,是因为很多挂着几万美元的赏金等了人类几十年。有了上周的几百美元定价之后,现在每一道题的解题成本大概就是你请团队吃一顿饭的钱。
国产Agent模型闯入全球第一梯队
量子位报道,国产Agent模型刚刚杀入全球第一梯队,限时免费开放。没有铺垫,没有造势,直接上架。搭配第一条新闻看——中国AI既在造AI,又在让Agent进第一梯队,同时在本周初把API价格打到了三十分之一。三个动作叠在一起不是巧合。
开发者与API生态
三星向外部AI模型开门
三星电子宣布从下月起允许员工使用外部AI模型。此前三星的态度非常保守——曾因员工用ChatGPT导致数据泄露而明文禁止。这次转向不只是一家公司改了内部政策,而是全球最大的电子制造商之一承认:堵不如疏。企业AI治理的钟摆正在从"禁用"摆向"管控"。
产品应用与商业化动态
硅谷大厂焦虑的一个切片:一人花掉50万美金Token
36氪从硅谷前线带回了一个数据点:有人在AI API上一个月花掉了50万美元。不是公司,是一个人。这个数字背后是大厂内部AI军备竞赛焦虑的缩影——当所有人都怕"慢一步",Token消费就不再是理性决策而是恐慌性采购。50万美金一个月,一年六百万,这笔钱够养一个中型工程团队,那在AI编程到底有没有节约成本,我们不得而知。
天工SkyClaw Agent模型加入限免混战
SkyClaw Agent模型宣布限时免费。结合DeepSeek本周的永久降价,Agent模型的定价也加入了价格战。用户是最大受益者。
行业洞察与传闻
红杉和华兴投了"AI产品的大众点评"
红杉中国和华兴资本共同投了一家做AI产品评测和推荐的平台-观猹。定位类似于国产版的Hungging Face。当行业里需要第三方来帮用户"选哪个AI产品好用"时,说明AI产品的冗余已经到了需要买手店的阶段。
法律法规
美国联邦法院被AI搞成了文书噩梦
The Decoder报道,美国联邦法院系统为了应对AI生成的法律文书,正在陷入一场行政噩梦。AI让诉讼文件的生成成本趋近于零,法院收到的文书量暴涨,审查人员不堪重负。司法系统的瓶颈不是"法官能不能识别AI生成的假判例",而是"根本来不及看"。
来源链接
参考链接
[1] 量子位 - 国产AI自己造了AI: https://www.qbitai.com/
[2] The Decoder - AI citations in clinical guidelines: https://the-decoder.com/
[3] The Decoder - Paul Graham AI emails: https://the-decoder.com/
[4] The Decoder - US federal courts AI nightmare: https://the-decoder.com/
[5] 36氪 - Silicon Valley token spending: https://36kr.com/
[6] 36氪 - Samsung external AI: https://36kr.com/
[7] 量子位 - 国产Agent模型全球第一梯队: https://www.qbitai.com/
[8] 量子位 - DeepMind Erdős problems: https://www.qbitai.com/


