开篇聊几句
刚过去的这周(1月12日到17日),AI圈可真不平静。几件大事接连发生,感觉整个行业的游戏规则都可能要被改写了。从大模型的技术路线,到我们手机上的AI怎么玩,再到全球芯片市场的竞争格局,都有了新的剧情。
技术上,国内的 DeepSeek 实验室发布了一项重要成果,发了篇叫《DeepSeek Engram》的论文,提出一个叫“条件记忆”的新架构。简单说,就是想办法让大模型别那么依赖烧GPU,以后可能在咱们自己的电脑上就能跑万亿参数的模型。这让大家觉得,AI竞赛不只是堆钱堆算力,技术架构创新才是新方向。
商业上,谷歌和苹果这对老对手居然“联姻”了,签了个几十亿美金的大单,以后iPhone里的Siri可能就要用谷歌的Gemini大脑了。这么一来,谷歌在手机AI上基本就坐稳了头把交椅,之前一直很风光的OpenAI处境就变得有些微妙了。同时,两家还在翻译软件领域展开了新的竞争,一个选择开源,一个坚持闭源,策略差异明显。
硬件上,英伟达的H200芯片的供应情况出现了新的变化。美国方面原计划调整出口规则,顺便加点关税赚一笔,但中国市场有了新的准入调整,H200的引进变得不再顺畅。这一下就表明了我们发展自主算力的决心,也让全球芯片供应链也因此受到影响。
资本市场上,投资人的钱也开始流向新的地方。马斯克的xAI又融了200亿美金;国内做机器人的X平方机器人和搞脑机接口的强脑科技也拿了大钱。这说明,资本现在更看好能跟物理世界、跟我们人类自身结合的AI技术。另外,快手的可灵AI赚钱能力爆表,也证明了AIGC是真的能搞钱的。
接下来,咱们就分几个板块,把这周发生的这些有意思的事儿掰开来聊聊。最后也会附上一周的新闻清单,方便你快速回顾。
第一章:聊聊DeepSeek的新玩法,大模型可能不用那么“烧”了

这周AI圈最火的话题,绝对是国内的DeepSeek团队发的一篇叫Engram的论文。现在大家都在焦虑,GPT-5迟迟不出,是不是光靠堆参数的“缩放定律”玩到头了?DeepSeek这时候站出来说,嘿,咱们换个玩法,不光是堆算力,咱们在架构上搞点创新。
1.1 “条件记忆”:给Transformer模型装个“外挂硬盘”
你想想看,现在的Transformer模型是怎么回答问题的?比如你问它“巴黎是哪个国家的首都?”,它得吭哧吭哧地用一堆复杂的数学计算来“推理”出这个答案。DeepSeek的研究员觉得这太浪费电了,明明是个死记硬背的知识,干嘛非得算一遍呢?他们管这叫“把静态记忆藏在动态计算里”。
DeepSeek Engram的核心玩法,就是“解耦”,把记忆和计算分开:
新瓶装旧酒的 N-gram:Engram并不是真退回到几十年前的技术,而是聪明地把古老的N-gram查表方法,塞进了时髦的Transformer里。简单说,就是建一个巨大的“知识库”。
O(1) 复杂度查知识:遇到像“巴黎”、“法国首都”这种固定的知识点,模型不用再启动GPU去算,而是像查字典一样,直接从“知识库”里把答案拿出来。这么一来,大量需要“死记硬背”的东西就从模型里剥离出来,存进了这个外挂的“记忆库”。
Token 压缩:为了让查字典的速度更快,他们还搞了个Token压缩技术,把词汇表压缩了大概23%,效率更高了。
1.2 架构的好处:一个“U型”新定律和省钱的未来
DeepSeek的研究发现了一个有意思的现象,他们叫 “U型缩放定律”(U-shaped Scaling Law)。
| 架构模式 | 纯 MoE 模型 | Engram 主导模型 | 混合架构 (最佳平衡点) |
|---|---|---|---|
| 工作原理 | |||
| 资源消耗 | 算力节省 30% / 性能提升 | ||
| 适用场景 | 通用人工智能 (AGI) |
研究发现,在参数总量不变的情况下,大概分出 20%-25% 的容量给Engram这个“记忆库”,剩下的交给MoE(混合专家)网络去做推理,性能是最好的。
【技术流程长啥样?】
为了更直观地理解这个流程,我们用一组图来拆解:
输入 (Input Tokens)
N-gram 提取与哈希 (Hashing) 外挂大内存 (CPU DRAM/SSD)
查表检索 (Lookup) 获取静态知识向量
上下文门控 (Gating) 决定是否采用检索到的知识(过滤噪声)
混合专家模型 (MoE) 处理剩余的逻辑推理
输出 (Output)
这个设计最让人兴奋的地方在于,未来可能一台有1TB普通内存的电脑,就能跑得动几万亿参数的DeepSeek V4模型,根本用不着搭昂贵的H100服务器集群。对那些缺算力的地方和中小公司来说,这才是真正的“AI民主化”。
1.3 跑分成绩怎么样?
从DeepSeek论文里公布的数据看,在同样的参数和计算量下,用了Engram架构的模型,在好几个关键测试上都比传统模型要强:
MMLU (多任务语言理解):分数高了 +3.4%,说明知识面更广了。
HumanEval (代码生成):分数高了 +3.0%,证明加了“记忆库”没影响写代码的逻辑能力。
长文本检索 (大海捞针测试):准确率从 84.2% 一下子提到 97.0%。原因也简单,因为很多短的、固定的知识被“记忆库”解决了,注意力机制就可以专心去处理更长的、更复杂的内容关系。
第二章:苹果谷歌“世纪大和解”,OpenAI面临新的市场局面

1月15号这天,科技圈发生了件大事。苹果和谷歌官宣合作了,签了个几十亿美金的大单。这可不只是钱的事,感觉就像是给全球手机AI的未来格局定下了基调。
2.1 50亿美金,Siri要“换脑”了
有分析师估算,苹果这次大概要给谷歌 50亿美金(或者每年10亿美金的授权费),就是为了让谷歌的Gemini模型深度整合进iOS系统。这手笔,让人想起了二十年前,谷歌为了成为Safari默认搜索引擎给苹果塞钱的那一幕(那笔生意现在每年价值200亿美金)。
合作的核心是啥?
Siri x Gemini:估计在今年3月份的 iOS 26.4 更新里,Siri就要大变样了。它的大脑,也就是自然语言理解和推理能力,会换成谷歌的Gemini。
私有云计算 (Private Cloud Compute):不过苹果也没傻到把用户数据直接给谷歌。他们搞了个特殊的架构,Gemini模型会跑在苹果自己的私有云,或者谷歌专门为苹果隔离出来的服务器上,隐私标准还是按苹果那套来。
那苹果为啥不继续跟OpenAI玩了呢?
毕竟2024年的时候,苹果还高调宣布要跟OpenAI合作。这才多久,就“分手”了。说白了,有几个原因:
家底不够厚:OpenAI太依赖微软Azure的服务器。而谷歌自己有全球顶尖的TPU服务器网络和海底光缆,能给几十亿iPhone用户提供更稳、更快的服务。
潜在的威胁:OpenAI的老大Sam Altman,跑去跟苹果前设计总监Jony Ive合作搞AI硬件。这让苹果觉得,你这是要来构成潜在的竞争。苹果当然不可能让一个未来的硬件对手,来掌握自己操作系统的核心入口。
能力更强:据说苹果内部测下来,觉得谷歌的Gemini 3模型,在看图听声和处理长文章方面,已经比GPT-4o的升级版更厉害了。
2.2 翻译软件的新竞争:谷歌开源与OpenAI闭源

就在苹果谷歌宣布合作的同一周,谷歌和OpenAI在翻译这个小战场上也展开了竞争。
OpenAI先出招:ChatGPT Translate
1月15号,OpenAI悄悄上线了ChatGPT翻译的网页版。
特点:主打一个“定制语气”。你可以让它把翻译结果变得“商务范”、“小孩也能懂”或者“学术腔”。
缺点:只能在网页上用,没App,还得联网。看得出来,OpenAI还是想做“万能助手”,想从网页上抢走谷歌翻译的用户。
谷歌的反击:TranslateGemma
结果才过了一天,谷歌就放了个大招,直接开源了TranslateGemma系列模型,这可以说是一种高维度的竞争策略。
主打手机端:谷歌一口气发了 40亿、120亿和270亿 三个参数版本的模型。最小的那个4B版本就是专门给手机设计的,坐飞机开飞行模式也能用,而且翻译质量不比联网的差。
开源策略:谷歌把模型代码和权重都公开了,鼓励全世界的开发者把TranslateGemma用到自己的App和硬件里(比如AI眼镜、翻译笔)。
背后的算盘:谷歌很清楚,大家用翻译最多的场景就是出门在外、甚至没网的时候。通过开源,谷歌把AI翻译能力变成了一种像水和电一样的基础服务,直接影响了OpenAI通过网页版拓展市场的空间。
第三章:芯片市场新动向:英伟达H200的供应变局

这周芯片圈的动态,颇具戏剧性。全球AI芯片市场的格局,出现了新的变化。
3.1 政策变化:从限制到有条件许可
年初,美国方面对华芯片政策出现调整。可能是为了解决贸易逆差,美国商务部改了规矩,允许英伟达在特定条件下向中国出口H200芯片了。但条件很苛刻:
加关税:要多交25%的“国家安全关税”。
严审查:每一单生意都要单独审批。
美国政府的小算盘打得很精:既能卖高价芯片赚钱,又能通过审查控制芯片不被用到军事上。
3.2 市场准入调整:国产芯片迎来发展机遇
没想到,1月17号剧情又来了个180度大转弯。根据《金融时报》和路透社的说法,中国市场对英伟达H200芯片的准入政策有所收紧。
内部通知:据说,有消息称相关部门鼓励国内企业优先采用国产芯片。
背后的考量:决策层想得很清楚,如果还让H200占着国内市场,那我们自己的AI芯片(比如华为的昇腾910C)的成长空间就会受到挤压,得不到市场的反馈和迭代机会。所以,通过调整H200的准入,其实是为国产芯片创造一个有利的成长环境。
3.3 全球供应链随之调整
这个政策一出,全球供应链马上就有了反应。
电路板停产:给英伟达H200芯片做专用电路板(PCB)的供应商,在17号那天就紧急停工了。因为这种PCB是高度定制的,卖不掉的H200芯片用不上,这些板子就成了废品,供应商面临损失。
库存卖给谁:英伟达本来给中国市场备了几万块H200的货,现在面临库存压力。估计接下来只能想办法打折卖给中东、东南亚这些市场了。
这事儿说明,现在的全球芯片生意,非商业因素的影响日益显著。做跨国生意的,都得把市场环境风险当成最重要的因素来考虑了。
第四章:资本在投什么?机器人和“人机合一”是新宠

虽然大环境经济不咋地,但AI这块的投资热钱可一点没少。从这周几笔大的融资就能看出来,资本大佬们现在最看好两个方向:一个是让AI有身体的具身智能(Embodied AI),另一个是人脑和电脑连起来的脑机接口(BCI)。
4.1 马斯克的xAI:200亿美金砸向算力
马斯克的AI公司xAI,又融了一笔大钱,200亿美金的E轮融资。
钱花在哪:这笔钱只有一个目的,就是去孟菲斯建一个叫“Colossus”的超级计算机集群。马斯克的目标是搞10万张H100/H200显卡,来训练他的Grok 4模型。
为啥值钱:投资人赌的是,xAI能用好X平台(以前的推特)上的实时数据,在“实时AI”这个方向上干掉OpenAI。
4.2 具身智能:字节也下场了
国内做机器人的独角兽公司 X Square Robot (X平方机器人),拿了 1.4亿美金(差不多10亿人民币) 的A++轮融资。
谁投的:字节跳动和红杉中国。
技术亮点:X平方机器人搞了一个叫 WALL-A 的大模型,想给机器人装上一个通用的“大脑”,让机器人能像人一样理解世界,而不是只会执行写好的程序。
行业风向:字节这种巨头都重金下注了,说明他们觉得,机器人很可能就是手机之后的下一个超级流量入口。
4.3 脑机接口:杭州的BrainCo准备上市了
“杭州六小龙”之一的 BrainCo (强脑科技),融了 20亿人民币,准备去香港上市。
路线不同:马斯克的Neuralink是侵入式的,要把芯片植入大脑。BrainCo玩的是非侵入式,不用开刀。他们的产品已经有了,比如智能假肢,还有帮多动症孩子训练注意力的系统。
资本怎么看:IDG和华登这种大牌投资机构都领投了,说明大家很看好脑机接口在医疗康复领域的应用前景。
4.4 应用层变现:快手的Kling AI证明了自己
快手旗下的视频生成模型 Kling AI (可灵) 宣布,去年12月一个月就赚了超过 2000万美金,换算成年收入就是 2.4亿美金。
- 这说明啥:这是全球范围内,AI做视频最能赚钱的案例之一。它证明了,只要效果好,用户是愿意为AI视频付费的。也说明“短视频平台+AI工具”这个模式走得通。
第五章:AI画画做视频,终于要听话了
这周AI画画和做视频的工具,卷的方向变了。大家不再只追求画面更清楚,而是开始死磕“可控性”。咱们就来看看两个明星产品:专门画二次元的Niji V7和做视频的Runway Gen-4,它们是怎么解决这个问题的。
5.1 Midjourney Niji V7:画二次元更懂人话了
1月9号发布的 Niji V7,这周在二次元绘画圈里简直封神了。为了让你直观感受它在“光影”和“听懂复杂指令”上有多强,下面直接上干货,给你几个网上最火的测试咒语(Prompts),你可以直接复制到Midjourney里试试。
【效果复现1:新年烟花——电影级光影】
Niji V7最大的进步就是对光影氛围的渲染,不再是以前那种平平的感觉,而是有了电影感。
Prompt 指令:
Portrait of a person celebrating New Year 2026, fireworks in background, warm festive lighting, cinematic style, 8K --niji 7
视觉效果描述:
画面里是一个被温暖灯光包围的人,背景是绚烂的烟花。Niji V7能特别准地画出烟花在人物头发和皮肤上的反光,让画面既有二次元的美感,又有真实摄影的光影逻辑。
【效果复现2:复杂人设——测试AI听话程度】
这是Niji V7和V6最大的区别——能听懂一些“不合常理”的复杂要求。
Prompt 指令:
A girl with short green hair in a single bun, blue eyes, visible fangs, with four arms, each holding an ice cream cone --niji 7
视觉效果描述:
要是以前的版本,你让它画“四只手”,它很可能就画崩了,或者把冰淇淋画错位置。但Niji V7生成的图里,角色的四只手臂结构很自然,每只手都好好地拿着冰淇淋,发型、虎牙这些细节也完全符合要求,没有出现那种吓人的“恐怖谷”错误。
5.2 Runway Gen-4 Image:让你的角色“活”在每一帧
Runway发布的 Gen-4 Image 模型,搞了个新功能,叫 多参考图(Multi-Reference)。
【这功能用起来是啥样的?】
你可以想象这么一个界面,左边不光是打字的地方,还多了三个可以上传图片的位置:
位置A (风格参考): 你上传一张“赛博朋克风”的城市图片。
位置B (角色参考): 你上传一张“戴眼镜男士”的证件照。
位置C (构图参考): 你上传一张“人物在奔跑”的火柴人草图。
生成结果:AI会给你一段视频,视频里的男主角(长得跟位置B一模一样)正在一个赛博朋克城市里(风格跟位置A一样)奔跑(动作跟位置C一样)。这个功能,彻底解决了之前画漫画、做游戏时“画不出同一个角色”的痛点,让AI从一个“抽卡”玩具,真正变成了能干活的工具。
第六章:AI规范化发展,技术向善是前提

AI玩的人多了,问题也跟着来了,相关的规范和指引也愈发明确。
6.1 中国“AI魔改”专项治理
广电总局从今年1月1号开始搞的“AI魔改”视频专项治理,这周进入了关键阶段。
明确要求:明确说了,不许用AI技术去恶搞、歪曲四大名著、红色经典、英雄模范这些内容。
执行:抖音、微信、B站这些平台这周都发了公告,处理了一批违规账号。这说明国内对AIGC内容的监管愈发规范,以后拿历史文化搞AI二次创作,需要更加谨慎。
6.2 X 平台的 Deepfake 争议
尽管平台方表示会加强管理,但《卫报》这周爆出来,他家X平台的 Grok 模型(特别是独立App)仍存在一些问题。
问题:用一些特殊的“越狱”咒语,就能诱导Grok生成不当的深度伪造图像。
影响:这事儿被英国和欧盟的监管机构密切关注,X平台可能要面临高额罚款。也给那些主张“无审查”的开源AI社区敲了警钟。
第七章:本周重点新闻回顾 (News Index)
下面是这周(1月12日-1月17日)发生的一些重点新闻,帮你快速回顾一下。
1月17日 (周六)
奇瑞汽车发布全域AI战略,猎鹰智驾2026年全面铺开
奇瑞在AI之夜发布全域AI战略,宣布智能化进入2.0时代。活动现场展示了 AI Agent “小奇”、灵犀智舱 3.0 以及能够多角色切换的 MoJia 机器人。
https://finance.sina.com.cn/roll/2026-01-18/doc-inhhtasv3670892.shtml
2026-01-17
中国市场调整Nvidia H200准入政策,供应链面临新挑战
据《金融时报》披露,受中国市场最新监管政策影响,Nvidia H200芯片的准入受到限制,导致相关PCB供应商被迫暂停生产,全球芯片市场格局进入新阶段。
https://finance.sina.com.cn/headline/2026-01-17/doc-inhhrkir4411603.shtml?froms=pccs
2026-01-17
美联储主席人选扰动市场,AI算力股波动
市场传言Kevin Warsh可能出任美联储主席,其鹰派立场引发美债收益率上升,进而影响包括AI科技股在内的纳斯达克指数波动。
https://finance.sina.com.cn/headline/2026-01-17/doc-inhhrkir4411603.shtml?froms=pccs
2026-01-17
美国方面披露重要人士投资Netflix与华纳兄弟债券,涉足流媒体与AI内容
有文件显示,有重要人士购买了价值100万至200万美元的Netflix和华纳兄弟探索公司债券,引发市场对AI内容监管政策走向的猜测。
https://finance.sina.com.cn/stock/usstock/c/2026-01-17/doc-inhhqhwc4877875.shtml
2026-01-17
1月16日 (周五)
Google发布TranslateGemma开源模型,支持55种语言
Google推出基于Gemma 3的TranslateGemma系列(4B/12B/27B),在端侧翻译质量上取得突破,直接对标OpenAI的翻译产品。
https://blog.google/innovation-and-ai/technology/developers-tools/translategemma/
2026-01-16
Runway Gen-4 Image上线,引入多参考图控制功能
Runway发布Gen-4 Image模型,允许用户上传最多3张参考图以控制生成图像的角色和风格一致性,大幅提升专业设计流程的可用性。
https://wavespeed.ai/blog/posts/introducing-runway-gen4-image-on-wavespeedai/
2026-01-16
新华网发文:给“AI魔改”戴上“紧箍咒”
新华网发表评论文章,支持广电总局对“AI魔改”视频的专项治理,强调技术向善,明确商业传播中的法律红线和创作边界。
https://www.news.cn/tech/20260116/9d007f032aa04408ab763964836af00b/c.html
2026-01-16
X平台Grok AI在内容生成方面的问题引发监管关注
尽管平台方承诺整改,但媒体测试发现Grok的独立应用仍能生成不当的深度伪造图像,暴露了社交平台AI监管的技术漏洞。
https://www.theguardian.com/technology/2026/jan/16/x-still-allowing-sexualised-images-grok-ai-nudification
2026-01-16
1月15日 (周四)
Apple与Google达成50亿美元Gemini合作协议
Apple正式将Google Gemini集成入Siri,交易估值高达50亿美元。此举标志着Apple在AI基础模型上选择结盟Google,而非OpenAI。
https://www.macrumors.com/2026/01/15/apple-google-gemini-deal-5-billion/
2026-01-15
OpenAI 发布了 ChatGPT 翻译网页版
OpenAI 低调上线了 ChatGPT 翻译独立网页,支持 50 多种语言的翻译和语气调整(如商务、儿童模式),但暂无独立 App。
https://www.cnet.com/tech/services-and-software/chatgpt-site-launch-language-translation/
2026-01-15
广电总局“AI魔改”治理第二周:全网清理违规视频数千条
专项治理行动进入第二周,微博、抖音、微信等平台累计处置违规账号数十个,拦截清理涉及四大名著的恶搞视频数千条。
https://finance.sina.com.cn/roll/2026-01-15/doc-inhhmhtf7341559.shtml?froms=ggmp
2026-01-15
Cerebras 与 OpenAI 达成价值 10 亿美元的芯片协议,挑战 Nvidia
人工智能芯片初创公司 Cerebras 宣布与 OpenAI 达成价值 10 亿美元的合作,为该公司提供 Nvidia AI 推理芯片解决方案的替代品。
https://aibusiness.com/generative-ai/runway-releases-gen-4-5-video-model
2026-01-15
1月14日 (周三)
华东师大“云知师AI”入驻国家智慧教育平台
由华东师范大学研发的“云知师AI”工具正式入选国家智慧教育公共服务平台,为全国教师提供智能备课与教学辅助服务。
https://www.ecnu.edu.cn/info/1094/71441.htm
2026-01-14
美国曾调整英伟达H200对华出口规则
美国商务部一度修订规则,允许在特定条件下向中国出口H200芯片,但随即遭遇中国市场的准入调整,市场政策变化频繁。
https://www.stcn.com/article/detail/3590866.html
2026-01-14
1月13日 (周二)
X Square Robot 完成 1.4 亿美元 A++轮融资,由字节跳动领投
中国机器人公司 X Square Robotics 宣布完成巨额融资,字节跳动和红杉中国投资加速通用机器人大模型 WALL-A 的研发与落地。
https://www.finsmes.com/2026/01/x-square-robot-raises-140m-in-series-a-funding.html
2026-01-13
快手Kling AI(可灵)月营收破2000万美元
快手宣布其AI视频生成产品Kling AI在2025年12月实现单月营收超2000万美元,年化收入达2.4亿美元,商业化极其成功。
https://www.prnewswire.com/news-releases/kling-ai-annualized-revenue-run-rate-hits-usd240-million-in-december-2025-302659847.html
2026-01-13
脑机接口公司BrainCo拟赴港IPO,融资20亿元
“杭州六小龙”之一的BrainCo完成20亿元人民币融资,并计划在香港上市,IDG资本与华登国际领投,推动BCI技术商业化。
https://technode.com/2026/01/13/chinese-neuralink-rival-brainco-files-for-hong-kong-ipo-sources-say/
2026-01-13
美国商务部修订对华芯片出口规则
美国联邦公报显示,BIS修订了对中国内地和澳门出口先进计算芯片(如H200)的许可审查规则,试图平衡安全与商业利益。
https://companies.caixin.com/2026-01-16/102404596.html
2026-01-13
1月12日 (周一)
DeepSeek发表Engram论文,提出“条件记忆”新架构
DeepSeek与北大团队联合发表论文,提出Engram架构,通过去GPU化的查表机制解决LLM的记忆瓶颈,并开源相关代码。
https://www.nbd.com.cn/articles/2026-01-13/4218816.html
2026-01-12
xAI完成200亿美元E轮融资,估值再创新高
Elon Musk的AI公司xAI完成高达200亿美元的融资,资金将全部用于扩充算力集群,以在AGI竞赛中对抗OpenAI和Google。
https://news.crunchbase.com/venture/biggest-funding-rounds-xai-parabilis-medicines-soley-therapeutics/
2026-01-12
Anthropic 发布了 Claude for Healthcare 平台
安欣正式进军医疗垂直领域,发布符合 HIPAA 合规要求的 Claude 临床 AI 平台,旨在协助医生处理病历和诊断支持。
https://www.aicerts.ai/news/anthropics-claude-next-gen-clinical-ai-platform-for-healthcare/
2026-01-12
Nvidia 和 Eli Lilly 将建立 10 亿美元的 AI 制药实验室
芯片巨头和制药巨头联手,Nvidia 和 Eli Lilly 宣布投资 10 亿美元建立联合实验室,利用生成式 AI 加速新药发现流程。
https://za.investing.com/news/company-news/nvidia-and-lilly-form-1-billion-ai-partnership-for-drug-discovery-93CH-4058176
2026-01-12
Zeya Health 获得 575,000 美元的 Pre-seed 轮融资
Antler 领投新加坡医疗科技初创公司 Zeya Health 早期融资,利用 AI 自动化解决诊所的行政痛点。
https://asiatechdaily.com/zeya-health-raises-575k-to-tackle-healthcares-admin-crunch-with-ai/
2026-01-12


