? 今日核心观点
2026年5月,AI行业进入"寡头决战"阶段。谷歌Gemini 3.5 Flash以4倍速度优势和半价成本重写竞争规则,国产大模型(Qwen3.7-Max、GLM-5.1)首次实现对美技术追平,华为昇腾910C量产标志着国产算力自主可控能力进入新纪元。全球Q1 AI融资2555亿美元创历史新高,但90%的小模型公司已停止迭代——这不是降温,而是出清。投资者应重点关注:端侧AI芯片、国产算力替代、智能体平台三大赛道,短期内波动加剧但长期趋势明确。
? 产品与技术突破
谷歌I/O 2026:Gemini生态全面出击
5月19日,谷歌在I/O大会发布Gemini 3.5 Flash和Gemini Omni双模型,这是自GPT-4发布以来最具颠覆性的产品更新。Gemini 3.5 Flash在编程、多模态、代理任务三项基准测试中全面超越Gemini 3.1 Pro,输出速度比同级竞品快4倍,成本不到一半。
更关键的是用户规模:Gemini App月活突破9亿,同比翻倍;月处理Tokens达3.2千万亿,同比增长7倍。这意味着谷歌已从"追赶者"转变为"普及者"——当OpenAI还在为GPT-5的发布节奏焦虑时,谷歌已经通过搜索框的25年来最大改版,将AI能力无缝植入20亿日活用户的日常行为中。20+款AI产品集中发布,本质是一场生态卡位战。
国产大模型:从追赶到并跑
阿里Qwen3.7-Max于5月20日发布,Arena总榜位列国产第一、全球第五,在编程智能体和通用智能体维度实现突破。平安证券研报指出,KimiK2.6、DeepSeekV4、GLM-5.1、MiniMaxM2.7等国产模型持续迭代,能力已逼近国际一线水平。
但真正的技术跃迁发生在智谱GLM-5.1高速版——输出速度达400tokens/s,刷新全球大模型API速度上限。长江证券指出,AI开始从"等待式问答"迈向"实时协作"。智谱市值超5700亿,平台注册用户突破400万,这个数据背后是一个判断:速度即体验,体验即护城河。当模型响应接近人类思维速度时,AI才能真正成为"协作伙伴"而非"查询工具"。
端侧AI:从概念到落地
面壁智能与清华联合开源中国首个1.58-bit(三值)大模型BitCPM-CANN,依托华为昇腾平台训练,推理阶段显存占用降低约83%,8B参数模型可在旗舰手机流畅运行。这是端侧AI部署的关键里程碑——当大模型能跑在手机上,隐私、延迟、成本三大痛点迎刃而解。
联想天禧AI 4.0实现了从"+AI"到"AI+"的跃迁,发布AI主机P7(190 TOPS算力,无网50 Token/s本地推理)和Mini(2999元)。荣耀Magic8系列成为首款自进化AI原生手机,智能体YOYO覆盖3000+场景,电池突破7000mAh。这些产品信号的共通点:AI不再是云端服务的"补充",而是设备能力的"核心"。
国产算力:昇腾910C的量产意义
华为昇腾910C实现量产,单卡算力1.5P FLOPS,能效比3.2TFLOPS/W,7nm+工艺,已在百度、腾讯、阿里数据中心部署,年产能预计50万片。这个数据的意义在于:国产算力不再是"可用",而是"可用且可规模部署"。当英伟达A100/H100的替代品能够在互联网大厂的数据中心规模化部署,意味着国产算力产业链已经走完从研发到量产再到商用的完整闭环。
世界模型:从预测Token到预测世界
OpenAI GPT-5 World、智源"悟道·寰宇"、谷歌Gemini 3 Ultra均已具备物理世界时空连续性、因果逻辑理解能力。这标志着大模型从"预测下一个Token"转向"预测世界状态"——本质是从统计学到物理学的范式跃迁。当模型能理解"玻璃杯掉落会碎"而非"杯子掉落"这个Token组合更常见时,具身智能、自动驾驶、科学仿真等场景的AI应用才具备真正的可行性基础。
? 投资建议
短期策略(1-3个月):波动中的结构性机会
核心逻辑:IPO窗口打开引发估值重构,龙头企业上市将带动板块情绪,但估值分歧会加剧波动。
具体标的:
风险等级:中高风险(7/10)
风险提示:IPO估值分歧可能导致板块短期回调15-20%,建议分批建仓、设置止损。
中期策略(3-6个月):端侧AI与智能体双主线
核心逻辑:端侧AI硬件进入量产周期,智能体平台竞争格局明朗化,业绩兑现成为关键验证。
具体标的:
建议配置:主题基金(人工智能ETF 515070)+ 个股精选,占比不超过总仓位30%。
风险等级:中风险(5/10)
长期策略(6个月以上):世界模型与具身智能
核心逻辑:世界模型是AGI的关键前哨,具身智能将打开万亿美元市场,但技术成熟度与商业化周期存在不确定性。
投资方向:
世界模型研发龙头:关注OpenAI、Anthropic IPO后的二级市场机会 具身智能产业链:人形机器人(银河通用)、工业机器人智能化改造 国产算力自主可控:昇腾生态、寒武纪产业链长期配置
风险提示:技术路线存在不确定性,建议定投而非一次性建仓;设置18个月止损周期,跌破30%加仓摊薄成本。
风险等级:高风险(8/10)
? 背后逻辑分析
为何寡头化是必然趋势?
2026年Q1,全球能稳定商用的大模型从200+家缩减至10家以内,90%小模型公司停止迭代或转型。这不是市场萎缩,而是技术门槛和资金门槛的"双高筛选"。
技术门槛:Gemini 3.5 Flash的4倍速度优势、半价成本,源自谷歌在TPU硬件、分布式训练、模型架构三层的技术积累。追赶者可以复制论文,但无法复制工程化能力——这正是谷歌、OpenAI、Anthropic的护城河。
资金门槛:头部三家(OpenAI、Anthropic、xAI)包揽67.3%的融资,剩余33%分散在数十家竞争者中。当训练一个顶级模型的成本从千万美元级跃升至十亿美元级,资金集中是市场效率的体现,而非扭曲。
结论:寡头化不是AI行业的危机,而是成熟。就像汽车行业从数千家缩减至数十家,AI行业正在经历同样的"创造性破坏"。
API降价的逻辑:用量反哺成本
DeepSeek逆市降价,自研稀疏注意力机制与混合专家模型,深度适配国产算力,推理侧极致工程优化,形成"用量反哺成本"的良性循环。API调用成本同比下降35%——这意味着什么?
对开发者:API成本占AI应用成本的30-50%,降价直接提升利润空间或降低用户价格,加速AI应用渗透。
对模型厂商:成本领先者通过降价抢占市场份额,规模效应进一步摊薄边际成本,形成正反馈。落后的厂商要么跟进亏损,要么退出竞争。
行业趋势:API价格战本质是成本战,最后留下的是工程能力最强、资金最雄厚、生态最完善的玩家。
中国AI的差异化路径
中国制造业AI采用率67% vs 美国34%,这个数据背后的逻辑是:中国在应用层有场景优势,美国在基础层有技术优势。
中国优势赛道:电商(推荐算法)、短视频(内容生成)、工业(预测性维护)、本地生活(智能调度)。这些领域的共同点是:数据丰富、场景明确、商业化路径短。
美国优势赛道:基础模型(OpenAI、Anthropic)、芯片(英伟达)、安全(Palantir)、科研(DeepMind)、国防(Anduril)。这些领域的共同点是:研发密集、专利壁垒高、政府采购支撑。
投资启示:中国AI投资应聚焦"应用兑现"而非"技术追赶"。端侧AI、工业智能、智能体平台是中国的比较优势所在。
?️ 行业风向判断
大模型进入"成本竞争"阶段
2026年的AI竞争关键词不是"能力",而是"效率"。当Qwen3.7-Max、GLM-5.1、DeepSeekV4都能完成90%的企业任务时,选择标准从"谁更强"转向"谁更便宜更快"。
证据:企业AI付费渗透率从22%提升至41%,近一半企业开始为AI付费。付费意愿的提升,恰恰说明AI从"尝鲜"进入"刚需"。当AI成为生产力工具,成本敏感度自然上升。
智能体:下一个"平台级机会"
腾讯Marvis、阿里云百炼、百度DuMate、微软365 E7,四大科技巨头都在布局智能体平台。这不是产品创新,而是战略卡位。
判断逻辑:智能体是AI时代的"操作系统"。谁定义了智能体的调用标准,谁就控制了AI应用的分发入口。当任务理解→拆解→调用智能体执行成为标准流程,平台价值将超过任何单一应用。
投资机会:智能体平台的"App Store时刻"即将到来,开发工具、分发渠道、数据服务是上游机会。
AI眼镜:硬件形态的突破点
半年超30款新品,华为AI拍摄眼镜35.5g,行业认为40g是全天候佩戴分水岭。这个数据的意义在于:当眼镜重量接近普通墨镜时,AI硬件才真正进入消费市场。
市场判断:AI眼镜是继手机之后的下一个"个人计算终端"。摄像头+麦克风+骨传导耳机+AI芯片,这个组合足以承载语音交互、视觉识别、实时翻译等核心功能。
风险提示:硬件形态尚未定型,光学显示技术(光波导、Micro OLED)成熟度决定普及节奏。
? 影响分析
对资本市场的影响
一级市场:头部效应加剧,OpenAI估值8520亿美元、Anthropic有望突破9000亿美元,AI企业IPO窗口打开。但长尾项目融资难度上升,"AI+"概念的泡沫正在挤出。
二级市场:算力板块(寒武纪、海光信息)估值中枢上移,AI应用板块业绩验证期来临。英伟达260亿美元押注开源AI,可能改变闭源模型的估值逻辑。
对就业市场的影响
Meta裁员8000人、微软买断8000+人、亚马逊裁员1.6万——AI驱动的裁员已成新常态。但这是结构性调整,而非总量缩减。
新增岗位:AI工程师、提示词工程师、AI训练师、AI伦理研究员。这些岗位的共同点是:需要理解AI能力边界,并将其转化为商业价值。
消失岗位:重复性文书、基础客服、初级分析。这些岗位的共同点是:规则明确、可被模型替代。
社会影响:技能再培训需求激增,终身学习从"建议"变为"生存必需"。
对企业战略的影响
科技公司:AI不再是"增值功能",而是"核心能力"。腾讯、阿里、百度都在将AI能力整合进操作系统和云服务。
传统企业:AI采用率67%(中国制造业),意味着"不AI"等于"被淘汰"。供应链优化、质量控制、预测性维护是率先落地的场景。
创业公司:必须回答"为什么大模型做不了这件事"。垂直场景数据、行业Know-how、定制化服务是差异化方向。
? 展望
1-3个月预测
确定事件:
Grok V9-Medium发布,编程能力将成为AI模型竞争的新焦点 Anthropic、OpenAI IPO进程推进,估值分歧引发板块波动 国内AI企业上市节奏加快,长鑫科技、长江存储进入冲刺阶段
市场预期:
AI板块估值中枢震荡上行,但分化加剧 端侧AI硬件进入密集发布期,消费市场验证成为关键 API价格战延续,小模型公司加速出局
技术趋势
世界模型商业化:GPT-5 World、Gemini 3 Ultra将在游戏、仿真、机器人领域率先落地,物理世界理解能力是下一个技术高地。
端侧AI量产:1.58-bit量化技术成熟,8B参数模型在手机端流畅运行,隐私计算+本地推理成为差异化卖点。
智能体生态成型:Agent to Agent协作标准开始出现,跨平台智能体互操作成为可能。
市场格局
全球格局:寡头化趋势延续,但开源模型(Llama、Mistral)将挤压闭源模型的市场空间,英伟达260亿美元押注开源是关键信号。
中国格局:国产算力替代加速,昇腾生态逐步成熟;应用层竞争激烈,智能体平台成为新战场。
投资窗口:2026年下半年是AI应用业绩兑现的关键验证期,"讲故事"的窗口正在关闭,"看业绩"的时代即将到来。
免责声明:本文仅代表作者观点,不构成投资建议。AI行业技术迭代快、政策变化多,投资者应根据自身风险承受能力独立决策。
数据来源:谷歌I/O 2026官方发布、平安证券研报、长江证券研报、公开市场数据。
报告日期:2026年05月26日


