"手机里没装5个以上AI App,都不好意思说自己在2026年混科技圈。"
最近整理手机桌面,发现自己不知不觉装了22款国产大模型应用。它们来自不同研发团队,承载着不同使命,覆盖了从专业创作、知识检索到生活服务的全场景。
当AI大模型从实验室走进每个人的手机桌面,我们的工作、学习与生活正被悄然重塑。
慧哥根据自己的使用经验和个人认知,逐一分析这些大模型的核心实力:从背后的研发团队、核心功能,到实际使用的门道、亟待优化的痛点,再到未来的发展方向。(个人观点,仅供参考)

1. 豆包
①研发团队与发布日期:由字节跳动自研,2023年2月首次发布,2025年12月推出豆包5.0旗舰版本,是字节跳动AI生态的核心产品。
②主要功能:支持文本、图像、语音、视频全模态交互,覆盖智能对话、内容创作、代码生成、拍题答疑、AI云盘、实时语音通话等场景,深度适配抖音、剪映等字节生态产品,可实现系统级手机操作,完成订票、下单等复杂任务。
③使用方法:下载豆包APP,注册登录后即可通过文字、语音、图片输入发起对话,支持文档上传提炼、多轮对话、AI生图等功能,企业用户可通过API接口调用私有化部署。
④存在问题:部分专业领域知识深度不足,长文本推理偶有逻辑断层,第三方插件生态不够完善。
⑤未来发展方向:持续强化全模态理解与实时交互能力,拓展AI搜索覆盖范围,优化语音对话拟人化体验,深化企业级服务与多场景智能体落地。
2. 元宝
①研发团队与发布日期:腾讯基于自研混元大模型开发,2024年5月30日正式上线C端APP,2026年完成混元大模型研发体系重构。
②主要功能:核心聚焦AI搜索、文档总结、AI写作,支持PDF/Word/PPT等多格式文档识别与超长上下文处理,提供口语陪练、个人智能体创建、声音克隆等特色功能,深度融合微信生态。
③使用方法:下载元宝APP,微信授权登录后,可直接输入问题发起搜索,上传文档生成摘要,创建专属智能体,适配办公、学习、生活多场景。
④存在问题:代码生成能力较弱,多模态交互体验有待优化,部分垂直领域专业度不足。
⑤未来发展方向:推出融合社交与内容的“元宝派”新玩法,强化AI编程与复杂推理能力,深化ToB行业解决方案,打造全场景智能体生态。
3. 纳米AI
①研发团队与发布日期:360集团倾力打造的AI智能体平台,2025年完成多智能体蜂群技术升级,入选“2025 AGIC最受欢迎智能体”TOP3。
②主要功能:核心为模型聚合与智能调度,支持文字、语音、拍照、视频多模态搜索,可自主调用浏览器执行复杂任务,上线知识广场提供考研真题、合同模板等垂直内容,支持无限上下文与超千步任务执行。
③使用方法:下载纳米AI APP,注册后即可使用AI搜索、智能体任务、知识广场等功能,无需切换多个模型,由平台智能调度最优模型响应需求。
④存在问题:无自研底层大模型,依赖第三方模型调度,部分专业任务响应稳定性不足。
⑤未来发展方向:强化多智能体蜂群协同能力,拓展垂直行业应用场景,完善自研应用生态,提升复杂任务执行效率。
4. 文心(原文心一言)
①研发团队与发布日期:百度自主研发,2023年3月以“文心一言”首次发布,2025年11月统一品牌名为“文心”,2026年1月上线原生全模态大模型文心5.0。
②主要功能:具备文学创作、商业文案、数理推算、中文理解、多模态生成五大核心能力,支持文本、图像、音频、视频全模态交互,API调用成本仅为GPT-4.5的1%,广泛赋能金融、医疗、教育等行业。
③使用方法:下载文心APP或访问官网,注册后即可对话创作、文生图、PPT生成,企业用户可通过文心千帆平台调用API,实现私有化部署。
④存在问题:早期版本存在幻觉问题,复杂代码生成能力有待提升,部分场景响应速度较慢。
⑤未来发展方向:持续强化全模态统一建模能力,优化低幻觉技术,深化行业大模型定制,拓展AI搜索与智能体生态。
5. 千问(通义千问)
①研发团队与发布日期:阿里云自主研发,2023年4月11日正式发布,2025年4月推出Qwen3混合推理模型,是阿里集团AI原生入口。
②主要功能:支持文本、图片、文档多模态交互,具备超强逻辑推理、代码生成、低幻觉输出能力,首创“快思考+慢思考”混合推理架构,适配办公、科研、电商等多场景,开源模型覆盖全参数规模。
③使用方法:下载千问APP或访问通义千问官网,注册后可对话、创作、文档解析,开发者可通过阿里云平台调用开源模型与API。
④存在问题:多模态生成质量有待优化,C端用户体验打磨不足,部分垂直领域知识深度不够。
⑤未来发展方向:强化Agent任务执行能力,深化混合推理技术,拓展开源生态,打造跨业务AI统一入口。
6. 紫东太初
①研发团队与发布日期:中国科学院自动化研究所联合武汉人工智能研究院研发,2021年7月发布1.0版本,2025年9月推出紫东太初4.0,是全球首个深度推理+多模态大模型。
②主要功能:具备“边看、边识、边思”的多模态深度推理能力,支持文本、图像、音频、视频、3D点云全模态理解与生成,在科研、工业、安防等领域实现60%机械性科研任务自动化。
③使用方法:通过官方合作平台或企业定制服务使用,支持多模态数据输入,适配科研分析、工业质检等专业场景。
④存在问题:C端产品化不足,普通用户使用门槛较高,商业化落地场景有限。
⑤未来发展方向:持续优化多模态推理能力,深化国产算力适配,拓展科研、工业等垂直领域应用,推动通用人工智能进化。
7. Kimi
①研发团队与发布日期:北京月之暗面(Moonshot AI)研发,2023年10月开启内测,2026年1月发布开源旗舰模型Kimi K2.5。
②主要功能:以超长上下文处理为核心特色,支持200万汉字长文本输入,具备文件速读、资料整理、代码生成、多模态交互、工具调用能力,被Cursor等编程平台采用。
③使用方法:下载Kimi APP或访问官网,注册后可上传PDF/Word等文档,发起对话、代码编写、资料分析,支持API调用与企业部署。
④存在问题:多步推理易出现超长截断,工具调用错误易引发连锁问题,长流程任务成功率有待提升。
⑤未来发展方向:优化推理效率与工具调用鲁棒性,强化长程规划能力,深化开源社区生态,拓展企业级智能体服务。
8. 秘塔AI搜索/秘塔写作猫
①研发团队与发布日期:秘塔科技自研MetaLLM大模型,2023年通过国家生成式大模型备案,推出秘塔AI搜索、秘塔写作猫两大产品。
②主要功能:AI搜索主打全网信息检索与结构化报告生成,标注权威来源与推理链;写作猫支持智能写作、文本校对、语法修正、多语言翻译,覆盖法律、办公等垂直场景。
③使用方法:访问秘塔AI搜索官网或下载写作猫,注册后可输入需求生成报告、校对文本,支持文档上传与多轮优化。
④存在问题:实时数据更新不足,存在一定幻觉风险,多模态功能拓展有限。
⑤未来发展方向:拓展多模态创作能力,深化垂直行业应用,推出数字分身功能,完善企业级协作服务。
9. 智谱清言
①研发团队与发布日期:北京智谱华章科技有限公司研发,2023年8月31日正式上线,基于ChatGLM系列基座模型,2026年2月发布GLM-5大模型。
②主要功能:支持智能创作、代码开发、知识问答、多模态交互,代码生成能力突出,支持100余种编程语言,开放API接口,适配金融、医疗、教育等20余个行业私有化部署。
③使用方法:下载智谱清言APP或访问官网,注册后可对话、编程、创作,企业用户可通过API实现模型微调与私有化部署。
④存在问题:多模态生成质量有待提升,C端用户体验打磨不足,部分场景响应速度较慢。
⑤未来发展方向:强化国产算力适配,降低推理成本,深化行业大模型定制,拓展智能体生态。
10. 天工
①研发团队与发布日期:昆仑万维与奇点智源联合研发,2024年2月发布天工2.0,2025年5月上线天工超级智能体APP。
②主要功能:采用MoE混合专家架构,支持100K超长上下文,具备AI搜索、内容创作、代码编程、多模态生成(AI绘图、音乐生成)、智能体任务执行能力,适配办公、创作、科研等场景。
③使用方法:下载天工AI APP或访问官网,注册后可对话、创作、生图,支持企业级API调用与私有化部署。
④存在问题:第三方插件市场不完善,开发者社区规模较小,API文档更新不及时。
⑤未来发展方向:强化智能体能力,拓展多模态生成场景,完善开发者生态,深化企业级服务。
11. 讯飞星火
①研发团队与发布日期:科大讯飞自主研发,2023年5月发布V1.0,2024年10月推出星火4.0 Turbo,中文核心能力全面超越GPT-4 Turbo。
②主要功能:具备文本生成、语言理解、知识问答、逻辑推理、数学能力、代码生成、多模态交互七大核心能力,语音交互技术行业领先,深度赋能教育、医疗、办公等领域。
③使用方法:下载讯飞星火APP或访问官网,注册后可对话、语音交互、代码生成,支持企业级私有化部署与行业大模型定制。
④存在问题:多模态生成质量有待优化,英文能力弱于中文,部分复杂任务推理不足。
⑤未来发展方向:强化国产算力适配,深化语音交互与多模态能力,拓展教育、医疗等垂直行业解决方案。
12. 蚂蚁阿福
①研发团队与发布日期:蚂蚁集团研发,2024年9月以支付宝小程序上线,2025年12月15日发布独立APP,是国内首个千万级原生AI健康应用。
②主要功能:聚焦健康管理,支持健康问答、症状分析、疾病科普、体检报告解读、拍药盒识别,可模拟医生问诊流程主动追问,提供就医指引与个性化健康方案,通过医疗健康大模型双领域可信评估。
③使用方法:下载蚂蚁阿福APP,支付宝授权登录后,可文字、语音、拍照提问,同步智能硬件健康数据,生成健康管理计划。
④存在问题:仅聚焦健康领域,通用能力不足,部分罕见病知识覆盖不全,不能替代专业诊疗。
⑤未来发展方向:深化三甲医生AI分身功能,拓展慢病管理、心理健康服务,完善健康数据中台,打造全周期健康管理生态。
13. DeepSeek
①研发团队与发布日期:深度求索(DeepSeek)公司研发,2023年发布首个开源大模型DeepSeek LLM,2025年9月推出V3.1版本,2026年4月将上线V4旗舰模型。
②主要功能:以代码生成、数学推理、超长上下文处理为核心优势,开源模型覆盖全参数规模,支持多模态交互、Agent任务执行,API成本优势显著,被国内多款AI产品集成。
③使用方法:访问DeepSeek官网,注册后可对话、代码生成、文档分析,开发者可调用开源模型与API,企业用户可私有化部署。
④存在问题:C端产品化不足,普通用户使用门槛较高,多模态生成能力有待提升。
⑤未来发展方向:强化V4模型代码与推理能力,拓展多模态与长期记忆功能,深化国产算力适配,完善开源生态。
14. 海螺AI
①研发团队与发布日期:上海稀宇科技(MiniMax)研发,2024年9月上线,基于自研ABAB6.5 MoE大模型,2025年6月发布海螺02版本。
②主要功能:主打多模态视频生成,支持文生视频、图生视频、视频编辑,具备超强语音交互与数字人生成能力,累计生成超3.7亿条视频,适配内容创作、营销等场景。
③使用方法:下载海螺AI APP,注册后输入提示词生成视频,支持视频编辑、风格调整、数字人定制。
④存在问题:视频生成时长有限,角色一致性有待提升,版权风险管控需加强。
⑤未来发展方向:延长视频生成时长,优化角色一致性,拓展多模态创作场景,完善版权合规体系。
15. 问小白
①研发团队与发布日期:元石高新科技研发,2024年正式上线,2025年1月集成DeepSeek-R1满血版模型,8月发布问小白5旗舰模型。
②主要功能:支持多模态交互、深度推理、视频摘要、个性化信息推荐,动态适配任务类型,日常问答秒级响应,专业任务生成结构化报告,适配学习、办公、科研等场景。
③使用方法:下载问小白APP,注册后可对话、文档分析、视频解读,支持多轮深度推理。
④存在问题:品牌知名度较低,生态资源不足,部分专业领域知识深度不够。
⑤未来发展方向:强化自研模型能力,拓展垂直行业应用,完善用户生态,提升产品知名度。
16. 小思AI
①研发团队与发布日期:学而思研发,2024年5月推出2.0版本,2025年11月上线小思3.0,是教育领域垂直大模型。
②主要功能:主打AI学习辅导,支持作业批改、知识点讲解、学情分析、主动引导学习,多模态交互可识别手写步骤,像真人老师一样划线分析、引导思考,适配K12全学段学习场景。
③使用方法:在学而思学习机或小思AI APP中使用,登录后可拍照搜题、作业辅导、定制学习计划。
④存在问题:仅聚焦教育领域,通用能力不足,高等教育知识点覆盖不全。
⑤未来发展方向:深化全学段学科覆盖,强化多模态交互与拟人化辅导,拓展素质教育内容,完善家庭教育服务。
17. 海绵音乐
①研发团队与发布日期:国内AI音乐创业团队研发,是专注于音乐生成的垂直大模型产品。
②主要功能:支持AI音乐生成、编曲、混音、歌词创作,可根据提示词生成不同风格音乐,适配内容创作、短视频配乐等场景。
③使用方法:下载海绵音乐APP,注册后输入需求生成音乐,支持风格调整、编曲编辑。
④存在问题:音乐原创性与版权风险较高,专业编曲质量有待提升,商业化模式不成熟。
⑤未来发展方向:强化音乐生成原创性,完善版权合规体系,拓展专业音乐制作功能,深化行业合作。
18. 即梦AI
①研发团队与发布日期:字节跳动Seed团队研发,2024年5月正式上线,2026年2月发布Seedance 2.0电影级视频生成模型。
②主要功能:一站式AI创意平台,支持文生图、图生图、文生视频、视频编辑,可精准复刻参考素材的构图、动作、风格,适配短视频、广告、影视等创作场景。
③使用方法:下载即梦AI APP,注册后输入提示词生成图片/视频,支持一键做同款、背景替换、风格调整。
④存在问题:版权归属模糊,生成内容一致性有待提升,长视频生成能力不足。
⑤未来发展方向:拓展数字分身、多语言翻译功能,深化影视级视频生成,完善版权审核机制,开放API生态。
19. MiniMax
①研发团队与发布日期:上海稀宇科技(MiniMax)研发,2023年发布自研大模型,是国内领先的通用大模型厂商。
②主要功能:支持100万token超长上下文,具备超强语音交互、多模态生成、Agent能力,累计创建5万+专业智能体,适配开发、运营、内容创作等场景,是海螺AI的技术底座。
③使用方法:通过MiniMax官网或合作产品(如海螺AI)使用,支持API调用与企业部署。
④存在问题:C端产品知名度较低,通用能力有待强化,多模态生成细节不足。
⑤未来发展方向:强化Agent与多模态能力,拓展C端产品矩阵,深化国产算力适配,完善开源生态。
20. 灵光
①研发团队与发布日期:蚂蚁集团研发,2025年11月18日正式发布,定位全模态通用生产力AI助手。
②主要功能:核心三大功能:灵光对话(结构化思维输出,支持3D、地图等全模态内容)、灵光闪应用(30秒自然语言生成可交互小应用)、灵光开眼(实时视频流解析物理世界),是业内首个全代码生成多模态内容的AI助手。
③使用方法:下载灵光APP,注册后可对话、生成应用、实时视觉解析,适配办公、生活、创作多场景。
④存在问题:发布时间较短,功能迭代有待完善,部分应用生成稳定性不足。
⑤未来发展方向:强化应用生成能力,拓展多模态交互场景,深化企业级服务,完善AI生态。
21. 小云雀
①研发团队与发布日期:字节跳动研发,2026年3月上线短剧Agent,基于Seedance 2.0大模型。
②主要功能:主打AI短剧创作,支持10万字剧本一键成片,自动拆解剧情、把控角色一致性,可生成短视频、数字人口播、风格化海报,适配短剧、短视频创作场景。
③使用方法:下载小云雀APP,注册后上传剧本或输入需求,自动生成短剧成片,支持编辑调整。
④存在问题:高精度内容表现不足,特定商品识别依赖素材,版权风险需管控。
⑤未来发展方向:优化角色一致性与画面精度,拓展多模态创作能力,完善版权合规体系,深化短剧工业化生产。
22. 扣子(Coze)
①研发团队与发布日期:字节跳动研发,2026年1月19日发布2.0版本,定位AI Agent开发平台。
②主要功能:支持零代码打造AI智能体,具备AgentOffice(职场复杂问题解决)、AgentCoding(一站式编程)、技能商店等功能,可自然语言生成工作流、跨端应用,适配办公、开发等场景。
③使用方法:访问扣子官网,注册后可创建智能体、生成应用、复用模板,支持企业级部署。
④存在问题:普通用户使用门槛较高,复杂智能体开发稳定性不足。
⑤未来发展方向:强化多智能体协同能力,拓展实体世界交互,完善开发者生态,深化职场场景服务。
这22款大模型覆盖了通用对话、垂直行业、内容创作、智能体等多个赛道。从技术上看,国产大模型已在中文理解、多模态、Agent等领域实现全球领先;从应用上看,正从C端工具向B端行业解决方案深度渗透,成为实体经济数字化转型的核心动力。
国产大模型将朝着全模态统一、低幻觉高可靠、Agent智能化、算力自主化、行业深度定制五大方向演进,持续为数字经济发展注入新动能。



