展会资讯
用 MiniMax M3 分析财报,效果有点惊艳!
2026-06-12 20:20
用 MiniMax M3 分析财报,效果有点惊艳!

上周,MiniMax 正式发布了新一代旗舰模型 M3,在 AI 圈子里引发不少讨论。

这次 M3 升级亮点,同时支持超长上下文、前沿编码能力和原生多模态。

在过去两年,大家几乎都觉得开源模型想与顶级闭源模型一比,必须同时具备这三项能力。

如今 M3 做到了,也是全球首个将这三大能力合在一块的开源模型。

然后就是,为了适配 M3,MinMax 还发布 MiniMax Code,体验和 CodeX 类似。

今天抽空体验一下,同时实测看看 M3 模型的 多模态、Coding 等能力。

这次实测会把 M3 当成一名金融分析师,帮忙完成看 K 线图、读财报、做可视化图表总结。

前几天,苹果全球开发者大会 WWDC 刚结束,股价出现点波动,正好让 M3 来分析下。

读 K 线图

首先来看下 M3 的多模态能力,准备了一张苹果近半年的日 K 线图。

打开 MiniMax Code,让它仔细观察 K 线图上的所有信息,并说说近期趋势、波动幅度、最高最低价格等。

可以上下滚动的图片 

M3 很快就输出结果,可能是着急了点,输出的 Markdown 内容工具都忘记渲染了。

但 M3 识别到的信息全部准确,最高点 317.4、最低点 242.97、还有各项指标的具体数值。

甚至是真的读懂了 K 线图里柱子的涨跌幅,点出 5 月初一根红色大阳线拔地而起,突破压力线。

同样的 Prompt 和 K 线图,也发给了多模态识别当中标杆 Gemini 3.1 Pro 模型,做了下对比。

说实话,两者的数值识别准确度都丝毫不差,但论看图的细致,M3 略胜半筹。

M3 读出的信息更多、画面感更强,就如一根关键的大阳线都能观察到,这个的确惊艳。

可以上下滚动的图片 

啃财报

准备上难度了,继续测试一下 M3 模型对 长文档检索 和 多步推理能力

丢给它一份苹果最新季度财报的 PDF,有几十页内容,也可以测试 M3 超长上下文表现如何。

要求它要提取核心财务数字并标明出处,计算核心数据、以及拆解各业务线营收占比。

可以上下滚动的图片 

M3 的表现有点出乎意料,提取出来的数字和页数,大部分我都去核对了一下都是正确的。

在计算营收同比时,它给出的是 16.6%,而财报里写的是 17%,表现得挺严谨的。

甚至还自己做一次验证,把各产品线营收加总,去跟总营收对上账,确认没有遗漏。

这种不硬凑、不糊弄、严谨的表现,这时候感觉 M3 确实是一位不错的专业分析师。

同一份财报同样 Prompt,这次选择发给擅长金融分析方面的 DeepSeek V4 Pro 对比看看。

可以上下滚动的图片 

第一眼感受,DeepSeek 输出的内容排版比 M3 要直观简洁的多,而且还有 LaTeX 公式。

内容排版 M3 略输一筹,这也可能是 MiniMax Code 对输出的内容渲染还不是很完善。

另外 DeepSeek 在分析财报提取、计算、同比、占比这些数字也是正确的。

但发现了严重的错误,它把财报里一笔欧盟罚款的币种,从「欧元」认为是「英镑」。

数字金额没错,但对币种符号它搞错了,这在金融场景里属于非常严重的犯错。

这次 M3 与 DeepSeek 的对比,在读文档推算数值这块实力相当,但论严谨和细节 M3 要更好一些。

做可视化分析看板

然后继续,看下 M3 这次的 Coding 能力,据说比上一代模型有了很大的提升。

为了与 DeepSeek 对比,我先让 M3 把前面分析 K 线图和财报得到的信息,做一次整理。

拿到这份总结后,分别在 M3 和 DeepSeek 上新开一个对话,做一个单页 HTML 分析看板。

要求放上关键指标卡片、各业务线营收占比的图表、近期走势,以及风险点等信息。

下面分别是 M3 和 DeepSeek 出来的页面效果图,两者均是一次生成。

M3
DeepSeek

这次对比很明显 M3 做出来页面要比 DeepSeek 好很多,连 K 线图都给画了出来。

而 DeepSeek 页面上的营收占比位置,还出现了文字重叠,页面上的信息点也不够简洁直观。

同样一次直出,两者数据虽没错,但 M3 的代码编写能力,还有 UI 审美更胜一筹。

下判断

最后让 M3 对这次苹果的股票分析做一次系统性的总结,作为这次实测收尾。

可以上下滚动的图片 

从输出的结果来看,它没有直接抛出是涨还是跌,而是把所看到的 K 线图和财报结合一起。

客观地分别列出看多的理由、看空的风险,以及几处还要继续盯的不确定性。

还指出财报里有一项资产数据变动偏大,但原文没解释,也如实标明存疑。

没有强行下定论,不替我们拍板、只把判断依据说清楚,反而让我觉得 M3 更加靠谱。

需要说明下,上面分析得到的结论,仅供参考,不构成任何投资建议,大家可以自我评估。

写在最后

以上就是今天的 M3 体验,顺便与Gemini 3.1 Pro、DeepSeek-V4-Pro 模型实测对比了下。

整体来看,M3 这次升级把强大的编码能力、超长上下文和原生多模态能力整合在一起后,可以用它来完成很多工作场景。

就比如这次的分析场景,直接用 M3 就能完成一整个分析链路,无需切换到不同模型、不同工具来接力完成。

无论是对开发者,还是金融从业者来说,这种「全流程跑通」的能力,都要比单项跑分更有价值。

过去想跑通这样一整条链路,基本只能依赖闭源商用模型,数据也得交出去。

如今有一个能自己掌控、私有部署的开源模型选择,对看重数据隐私的应用场景就有解法了。

今天的分享到此结束,感谢大家抽空阅读,我们下期再见,Respect!

发表评论
0评