推广 热搜: 采购方式  甲带  滤芯  气动隔膜泵  减速机  减速机型号  履带  带式称重给煤机  无级变速机  链式给煤机 

乙方观察:2025年证券行业大模型建设总结与思考

   日期:2026-01-18 18:10:38     来源:网络整理    作者:本站编辑    评论:0    
乙方观察:2025年证券行业大模型建设总结与思考
2023年百度最早发布国内大模型文心一言,彼时我正在百度,给证券客户做的最多的是大模型技术的科普;
2024年我认为是大模型技术正式走入证券业的第一年,虽当时因各级巡视组审计导致大部分券商的项目立项变得慎重,但依然有不少券商在找了预算在一二个点在在做探索,更多证券公司处于犹豫、观望,因此我写了第一篇文章(乙方观察:证券公司大模型建设路径的思考与总结),把2024年我在乙方对证券业的观察做了一个总结,期望给微信朋友圈的朋友们(大多是金融客户、朋友)一些信息差,同步大模型技术在行业在发生的变化,回头看这篇我依然觉得写的不错,也得到很多鼓励。
2025年过去了,我想再写一篇,只是今时不同往日,2024年我有的信息差,在2025年已经被抹平,证券客户对大模型的了解,包括发展趋势、能力边界等,反而很多都是我学习的对象。因此说是总结,我想更多是回顾。
以下,我会从几个方面来陈述2025的变化。

Deepseek对证券业的影响巨大并远超想象。

在Deepseek发布前,国内只有两家能厂商能打,一个是智谱,智谱的打法是用开源模型,吸引大型机构来采购更大参数规模的闭源模型。一个是百度,模型闭源。彼时正在挑选各行业超大型企业开始大模型的合作(交付能力有限);讯飞星火倒是出了,但在金融业声量小。其他大厂和各类风起云涌的大模型创业公司要么并没有能打的或能私有化的模型,要么还在研发当中。
如果按这个势头发展下去,大模型技术在2025年只属于大型金融机构,中小金融机构要么拿着国外的开源模型、要么智谱的GLM,当个玩具玩玩一些小场景。
也许正是如此,Deepseek来了,过着年就把桌子给掀了。因为它追齐了国外顶尖模型,顺便把国内厂商引以为傲的闭源模型压制到了第二梯队,并且还开源(免费),在使用上,部署和推理资源的成本还低。
这带来的第一个影响是,大模型厂商的核心生意----基模的生意几乎就没有了。转变的快的大厂纷纷在此后的模型宣布开源,转变的快的初创公司开始降低基础模型的研发,或转变解决场景问题,如百川开始重点布局医疗、Minimax部署视频和多模领域。可以说,Deepseek的出现,变革了整个中国的大模型的生意,并形成了不可逆的趋势。模型厂商必须走在失血研发的路上。通用基模,变成了大厂,或有国资输血的厂商才能玩的游戏。
但是,这对金融机构来却是极大利好,春节假期刚结束,很多券商研发同学加班加点的开始部署。大模型技术正式成为所有金融机构都能玩的技术。
Deepseek对证券业带来的另一个影响是,春节期间,官媒对Deepseek的宣传极大地提升了金融机构拥抱它的积极性,且最终带来正向的影响,拥抱大模型技术成了行业普遍共识。
Deepseek解决技术可用问题和成本问题之外,还解决了金融机构拥抱的态度问题。
在受益的另一方面,Deepseek的在登顶时一只脚不小心把同行厂商绊倒,却同时双手又拉起来了算力行业。越多企业用Deepseek,就越多企业需要购买算力。对金融行业来说,华为的910B,成了2025年算力的最热关键词。在2025年初那个时刻,只有他们出货量大、适配了Deepseek、性能还不错。到下半年,其他算力厂商出货量才起来了,开始走进金融机构,伴随着的还有其他好用的开源模型如千问2.5/3.0。
Deepseek带来的影响如此巨大,除以上几点行业级别的影响之外也带来不少其他方面影响。比如据我说知,在Deepseek发布之前,“证监会”已经委托“中证技术”带队各个证券公司领导、专家团队调研过证券行业大模型建设的可能性(彼时我接待过调研团队),并委托上交所、深交所、中金所分别负责不同的模块,“证券行业大模型”实际上正在走向落地,但Deepseek模型的出现,好用打赢了垂直。从此证券业少了一个监管牵头的行业大模型。再比如对基础模型厂商的研发来说,以前花了很大精力去优化大模型内容生成的首字母出现时间,Deepseek的推理,让用户等了几分钟仍毫无怨言,直接让大家目瞪口呆,并对技术本身的研发产生了有意思的改变。等等
总之,Deepseek的出现,给证券行业带来了好用的底层私有化模型。证券行业因此得以探索更多场景,在2025年这确实成为了推动了证券业大模型技术应用的发展的重要因素。

从单点尝试,到体系化建设,背后是券商对大模型建设思维的转变。

  • 2024年证券业的共识是“单点尝试”,“体系化建设”是特例。2025年是“体系化建设”是共识,“单点尝试”是特例。这背后是思维的转变。体现的是大模型技术作为一项确定性的技术的观念被普遍认同。因此导致建设规划产生变化。
2024年,我们去券商交流,客户常说的是,“想想找哪个点开始尝试一下”,“试一下”代表建设所需的算力、平台都为这个单点场景,定制,客户只需要这个场景应用的结果,本质是客户体系对这个方向的犹豫,需要一二个场景,在内部论证其场景价值及了解大模型的能力边界;
而体系化建设不同的是,券商现在即使没想好要搭建什么场景,但确定这是方向,先把算力搞好,把平台搞好,场景可以慢慢想,让业务部门去试嘛。
  • 在建设方面的表现:
算力方面能买就买,不能买的就租。2025年租赁模式兴起了。我曾也为此做过调研:金融行业算力市场调研(一文了解一个市场)
平台方面,应用开发平台,除了国泰海通是共研的外(也买了外部厂商),其他券商普遍用开源的DIfy(包括商业版)和采购互联网大厂平台。大厂平台从大几百万级,价格战打到几十万级。
场景方面,2024年谈的场景:内部办公、RAG、代码助手等;随着2025年技术的演进,券商能通过自研搞定了。做个大模型预定会议室,一个开发人员两周;代码助手很多开源部署一下的够用,采购大厂代码助手也白菜价了,客户预算做100-200万,大厂们自己卷起来,砍到脚踝小几十万,还一年包两次模型更新。RAG变成了各类应用开发平台的基础能力了,腾讯的IMA,让个人都能搭个Saas的知识库。
因此,乙方与甲方在场景合作上的沟通,正式开始往业务上靠,并产生了很多有意思的场景出来。而其中最重要的是AI-App、AI投顾。

大模型ToC,成了2025年重要的场景

2025年大模型技术从员工辅助场景,正式走向了C端面客。这里有监管的支持,有技术的发展趋势,有算力、模型等多方面发展或积累的结果。
我为此专门调研市场,请参考
AI-APP,金融机构大模型场景的“新赛场”?
据我所知,我能数出名字的,最少有20家券商有AI-App的建设规划,其中大部分已在建设,或建设完成发布了。这里说的AI-App是一个偏宏观概念,包含了原生,也包含了App改造或嵌套AI能力。

监管态度逐步从“探索包容”到“政策引导”

随着技术的发展、2025年券商的大模型场景整体呈现是百花齐放,监管也由最初的探索包容,到开始政策引导了,比如大模型对公众服务,需要的算法备案大模型登记/备案,监管要求开始要有内容安全围栏。(内容安全审核)。

监管已通过专项治理(如网信办“清朗·整治AI技术滥用”行动)和针对第三方投顾工具的处罚案例(如“随牛AI”因合规问题被责令改正)来逐步规范大模型的场景落地。

场景多起来了,内容安全就开始被关注了。

“宣传”是大模型技术落地建设重要一环

2025年的大模型技术落地,除了落地场景的价值外,宣传也成了重要因素之一。
这背后的原因:
一是大模型技术的落地的成果,承载着金融机构科技品牌形象。
二是在To C领域宣传代表着流量,可以发挥更多的场景价值。
三是组织层面,券商一把手及高层普遍对大模型技术非常看重,会去关注同业的宣传。而这些同业宣传又成为高层督促中层研发进展的工具。和一些券商中层领导沟通,能听出他们的无奈,他们的对上汇报,反而在高层眼里是“失真”的(真正做的好的东西会被误解夸大,或者为了要更多的资源),三方的报道和评价,往往在高层眼里更显得客观、真实。

2026年券商和厂商的合作方向展望

  • 对于大模型厂商来说,2025年很不容易。
一是几乎基模的生意没有了。
二是券商有好用的开源模型,自研能搞定一部分需求,露出的需求在变少。
三是大模型厂商自己在内卷,通用的产品(平台、代码助手)价格被各自打成骨折。
  • 对于2026年金融机构与厂商的合作我是既乐观,又悲观;
乐观是大模型技术方向成了共识,叠加两年股市行业好,券商赚钱了,一定会有更多应用和需求出来,大模型厂商的机会会比2025年更多。但悲观的是厂商的利润并不会高多少,一方面是厂商自己内卷,价格战不会结束。一方面甲方招标合规的内卷,无责采购,低价优先。Double Kill
  • 2026年券商和厂商的合作方向展望,我相对看好以下几个方面
1、数据、语料;2024/2025,算力行业预算和采购最多、其次是应用,大模型方向的数据、语料的采购几乎微乎其微。这并不合理,应用深化必然对高质量数据提出需求。
2、内容安全审核:券商是一个高监管行业,合规一直在红线,大模型场景越多,越需要搭建这些底层的安全能力。目前市场上通用性的大模型内容安全很多,金融垂直方面有机会。
3、工程能力(包含业务knowhow、踩坑经验):工程能力会成为一项比较重要的能力,原因在于,大模型场景很难形成标准化的产品,每家金融机构的情况不一样,总是适配于各自体系的大量定制开发。而厂商的踩坑经验、业务Knowhow是通用的。
我认为这是小厂的机遇,小厂人力成本低,大多是服务垂直行业,有业务理解,也愿意陪客户在真实问题上沉淀下来去解决。
而大厂人力成本高,在真正下场干脏活累活积累上不具备成本优势,大厂也不具备在场景大量定制或需求随时变化的情况下的随叫随到的服务能力和商务上应变能力。大厂更擅长于做通用平台,应用于各行业。
4、专家人力输出:最近有多家银行在走大模型方向的专家人员的采购框架。通过外包人力去解决行里的大模型项目建设问题。我对这件事的看法偏中性,大模型厂商真正好的人不会轻易被外包出去,如果真的被外包,那这家厂商也遇到大问题了,把软件公司做了人力外包确实不是长久之计。(这里强调是个人看法)
工作之余总结,如盲人摸象,写的不够全面,仅供参考。
 
打赏
 
更多>同类资讯
0相关评论

推荐图文
推荐资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  皖ICP备20008326号-18
Powered By DESTOON