资讯
黄仁勋暴论核弹:AGI已经实现,Ilya错了,程序员有10亿
摘要:
英伟达CEO黄仁勋发表观点,宣称AGI 已实现,反驳 Ilya 预训练触顶观点,强调推理难度远超预训练,Agent 与合成数据将推动新一轮规模扩张。他提出未来程序员将从 3000 万增至 10 亿,智能会商品化,Token 成为核心商品,OpenClaw 是 Token 时代的 iPhone。
同时谈及英伟达硬件协同设计、数据中心能源方案、管理哲学,并认为智能终将商品化,人性与品格才最珍贵,还回应了 DLSS 5 争议及对生命、未来的思考。
来源:量子位· https://www.qbitai.com/2026/03/391750.html
闲鱼上线闲鱼AI相机
摘要:
闲鱼正式发布新产品——闲鱼AI相机。用户只需简单拍照,即可5秒实现对商品的一键上架,AI将辅助定价促成成交。
来源:36氪· https://36kr.com/newsflashes/3737720671092736
Sora 宣布关停,史上最贵AI 表情包生成器只撑了七个月
摘要:
OpenAI 旗下 AI 视频生成平台 Sora 运营仅七个月便宣布关停,上线 5 天下载量破百万、登苹果 App Store 榜首,但 7 个月后,OpenAI 宣布全面停运其平台、消费端 App、开发者 API 及 ChatGPT 相关功能,官方也在 X 平台发文告别。Sora 的失败标志着 AI 行业从追逐炫技的 “wow moment” 向聚焦可持续商业模式转变。
来源:虎嗅· https://www.huxiu.com/article/4845072.html
Sora终究还是"死"了
摘要:Sora 基于的 Diffusion Transformer(DiT)架构实现技术突破,让视频生成模型首次自发理解物理规律,并非单纯的参数堆砌,具有里程碑意义。但现实印证了 C 端 AI 视频产品 “实用性优先、能活下去才是关键” 的行业现状,核心研究员在 Google DeepMind 将继续深耕物理感知视频生成方向,只是不再以消费品价格证明技术价值。
来源:虎嗅· https://www.huxiu.com/article/4845100.html
"烧Token"成KPI,有程序员一个月花掉15万美元
摘要:
硅谷科技公司将 Token 消耗量纳入员工 KPI,引发工程师 “烧 Token” 竞赛,然而行业缺乏从 Token 消耗到任务完成的有效度量标准,高 Token 消耗未必带来对等价值产出。
来源:虎嗅· https://www.huxiu.com/article/4844729.html
会议/沙龙
龙虾爆火之后,AI初创的全球化机会来了吗?|线下沙龙报名
摘要:
量子位将于2026 年 3 月 26 日周四 14:00举办以 “龙虾爆火之后,AI 初创的全球化机会来了吗?” 为主题的线下沙龙。
来源:量子位· https://www.qbitai.com/2026/03/391760.html
论文
[论文] VTAM: Video-Tactile-Action Models for Complex Physical Interaction Beyond VLAs
[论文] VTAM:超越 VLA 的复杂物理交互的视频触觉动作模型
摘要:
VTAM (Video-Tactile-Action Models)—— 一种融合视觉、触觉感知的多模态世界行动模型,核心解决了传统视觉 - 语言 - 行动(VLA)模型在富接触机器人操作任务中因仅依赖视觉、无法精准感知接触力和接触状态而导致的控制不稳定、任务成功率低的问题,为机器人具身智能的物理交互落地提供了可扩展的解决方案。
来源:arXiv· http://arxiv.org/abs/2603.23481v1
[论文] 3DCity-LLM: Empowering Multi-modality Large Language Models for 3D City-scale Perception and Understanding
[论文] 3DCity-LLM:为 3D 城市规模感知和理解提供多模态大型语言模型
摘要:
提出 3DCity-LLM 统一框架,一种专为 3D 城市尺度视觉 - 语言感知与理解设计,采用粗到精特征编码策略和任务驱动的指令调优范式,可同时支持物体级、关系级、场景级三类任务。可以自然语言交互的形式用于城市规划、智能交通、智慧城市等实际场景。
来源:arXiv· http://arxiv.org/abs/2603.23447v1


