4月29日,AI圈被一张图刷屏了:DeepSeek标志性的“鲸鱼”摘下了眼罩,配文“Now,we see you”。随着多模态团队研究员陈小康在X平台的官宣,讨论了一整年的DeepSeek视觉能力终于落地。目前,部分“天选之子”已在Web端和App端发现了新增的“识图模式”。
从纯文本对话跨越到图文交互,这只“开眼”的鲸鱼表现如何?在多模态技术全面爆发的2026年,这又将为企业级应用带来怎样的机遇与挑战?先知AI团队第一时间进行了追踪与深度拆解。

实测拆解 |
极速响应的VLM 仍有“刻板印象”的烦恼
根据目前内测用户的反馈,DeepSeek的“识图模式”绝非传统的OCR(光学字符识别)套壳,而是具备了真正的“视觉语言模型(VLM)”能力。
惊艳的一面在于“语义理解”与“极致速度”。
它能精准识别出“明孝端皇后九龙九凤冠”并输出历史背景;能通过建筑风格和路灯字迹推断拍摄地;能看懂表情包里的幽默梗,甚至对商品图的成分给出实用建议。更令人称道的是,在不开启深度思考模式的情况下,其响应速度极快,半秒内即可给出答案,用户体验极其丝滑。

但翻车的一面,则暴露了当前视觉大模型的通病——“视觉幻觉”。
在经典的“数手指”和“视错觉”测试中,DeepSeek依然没能跨过这道坎。当画面出现反事实图像(如画了6根手指)时,DeepSeek的“先验常识(人有5根手指)”与“视觉事实”产生了强烈冲突,最终它选择了向常识妥协,甚至开始“嘴硬”和“摆烂”。


行业透视 |
百亿市场狂飙 多模态从“噱头”走向“刚需”
DeepSeek“睁眼”,看似是产品矩阵的常规补齐,实则是大模型竞争格局演变的必然缩影。结合近期行业数据,我们可以清晰地看到两条趋势线:
趋势一:多模态大模型市场迎来爆发式增长。
据权威机构最新发布的《2026全球多模态大模型应用白皮书》显示,预计今年全球多模态大模型市场规模将突破150亿美元,年复合增长率(CAGR)高达42.5%。在国内,超过65%的头部企业已将“引入多模态能力”列入年度数字化预算。纯文本大模型已彻底商品化,能否处理图像、视频,决定了大模型能否留在主牌桌。DeepSeek入局,意味着企业调用顶尖视觉大模型的成本将进一步探底。

趋势二:“视觉幻觉”成为企业规模化落地的最大拦路虎。
DeepSeek“数不对手指”看似是个段子,但在B端场景中却是致命隐患。行业调研数据显示,在工业质检、医疗影像、金融票据审核等“零容错”场景中,因AI视觉幻觉导致的误报率平均仍在12%-15%之间徘徊。这直接导致了许多企业处于“不敢用、不能用”的观望状态。

先知AI视点 |
多模态是“感官”,工程化工作流才是“大脑”
在先知AI看来,DeepSeek“睁开眼”是一件值得欢呼的事,它为行业提供了更丰富、更廉价的基础设施。但对于企业客户而言,给AI装上眼睛只是第一步,如何跨越“视觉幻觉”陷阱,让这双眼睛创造确定的商业价值,才是真正的核心命题。
这就引出了先知AI一直坚持的产品哲学:大模型的多模态能力是“感官”,智能体的业务工作流才是“大脑”。

1.从“看图说话”到“看图办事”:无论是DeepSeek还是其他视觉大模型,目前解决的还是“理解”问题。而在先知AI的“速+X综合智能体系统1.0”中,我们通过可视化编排,将视觉能力作为“工具节点”嵌入到业务流中。比如,AI不仅要用眼睛“看”出一张发票的金额,还要自动与ERP系统数据交叉核对,最后触发审批流。没有工作流串联的视觉能力,只是个聪明的玩具。
2.用“系统约束”对冲“模型幻觉”:面对视觉大模型不可避免的“刻板印象”,先知AI在平台设计中强调了“人机协同”与“规则兜底”。在关键业务节点,智能体可以通过调用多重校验规则(如格式校验、逻辑校验),在算法给出荒谬结论前进行拦截,用工程的确定性去对冲算法的不确定性。
3.内容营销的降本增效:在先知AI旗下的“漫聚星球”平台,我们正积极拥抱视觉大模型的极速生成能力,将其与AI工作流结合,让图文、视频素材的批量产出速度实现指数级跃升,真正把技术红利转化为营销ROI。

结语
鲸鱼已经睁眼,百亿多模态的浪潮比想象中来得更猛。先知AI将密切关注并积极适配DeepSeek等优秀大模型的前沿视觉能力,持续将其转化为企业运营与内容营销的得力干将。因为我们深知,真正决定企业智能化高度的,从来不是AI能看见多少,而是AI能替企业干成多少。


漫聚星球是先知AI旗下的一站式AI影视创作管理平台,作为母公司MaaS技术沉淀的标杆产品,致力于成为AI影视内容生产领域的"飞书"。平台已迭代2.0BETA版本,核心功能稳定运行,服务数百家企业,培养近4000名AI创作人才。
一站式 AI 影视创作管理平台,从剧本到分镜到视频,全流程 AI 辅助创作降本增效 10 倍,让新手成为老手,让老手成为高手,让团队高效协同管理!
漫聚星球 网页版邀请链接:
https://xzai.chat/app/register?invite=8M27XG
(点击链接,立即注册,能多获得一些积分哦)
漫聚星球AI漫剧5天实战直播课定于5月18日正式开营,通过5天系统化直播教学,结合实战实操与作业点评,帮助学员掌握AI漫剧基础创作方法与漫聚星球平台使用技巧,快来报名啦!

扫描二维码
快速报名啦
15711306194


