
大模型从openai 自2022年12月发布,已经过去了整整两年。这过去的两年,大模型每天都在发生快速的变化。到了2025年了,现在转到大模型还来得及吗?一句话,有机会转一定转。没有机会转,那就创造条件转。有如下两个原因。
第一,过去两年投入了大量的资金在大模型方向。
国外有gpt,llama,claude,mistral, gemini, grok等多个有竞争力的模型。国内也有字节豆包大模型,腾讯混元大模型,阿里通义大模型,以及六小龙,还有最近爆火的deepseek。俗话说,资本是最聪明的,资本在哪里,哪里就有机会。选择是大于努力的。
我再过去一年转到大模型方向后,就有多次坐电梯的感觉。比如,我所在场景的效果,除了我们自己的优化,随着基座大模型能力的增加,业务效果也有非常大的提升。
第二,大模型的能力和成本有了非常大的变化。
大模型的能力,在多个评测中已经显著超过了人类,也有了包括图片,语音,视频的多模态大模型。
最关键的是,大模型的训练成本和推理成本,随着deepseek的出圈,有了数量级的下降。这个是非常关键的一点,可能训练不需要这么多卡了,但是应用起来以后,推理卡需要的更多。
第三,有条件要上。
有条件是指你的工作或者项目,天然可以用大模型。比如基于nlp的各种处理,比如搜索中的文本相关性,推荐中的召回,广告中的图片生成,客服中的多轮对话理解。这些任务都可以通过大模型大幅度提升,现在不用起来,那真的要落后了。
第四,没有条件,创造条件也要上。
没有条件是指你的工作可能和上面提到的没有关系。那就自己先在自己的工作中,找一个小部分先把大模型用起来。用起来以后先感受大模型,把相关的技巧掌握好,然后再逐步深入去使用。先把相关的论文和基础知识用起来。
一些基础的知识比如,transformer,gpt1-2-3,cot,rag,prompt,agent等。大模型应用的常见方法,sft,rlhf,评测等。
2025年了,行动起来吧,行动就是生产力。
#大模型 #大模型应用 #rag #你在用大模型了吗[投票]#
第一,过去两年投入了大量的资金在大模型方向。
国外有gpt,llama,claude,mistral, gemini, grok等多个有竞争力的模型。国内也有字节豆包大模型,腾讯混元大模型,阿里通义大模型,以及六小龙,还有最近爆火的deepseek。俗话说,资本是最聪明的,资本在哪里,哪里就有机会。选择是大于努力的。
我再过去一年转到大模型方向后,就有多次坐电梯的感觉。比如,我所在场景的效果,除了我们自己的优化,随着基座大模型能力的增加,业务效果也有非常大的提升。
第二,大模型的能力和成本有了非常大的变化。
大模型的能力,在多个评测中已经显著超过了人类,也有了包括图片,语音,视频的多模态大模型。
最关键的是,大模型的训练成本和推理成本,随着deepseek的出圈,有了数量级的下降。这个是非常关键的一点,可能训练不需要这么多卡了,但是应用起来以后,推理卡需要的更多。
第三,有条件要上。
有条件是指你的工作或者项目,天然可以用大模型。比如基于nlp的各种处理,比如搜索中的文本相关性,推荐中的召回,广告中的图片生成,客服中的多轮对话理解。这些任务都可以通过大模型大幅度提升,现在不用起来,那真的要落后了。
第四,没有条件,创造条件也要上。
没有条件是指你的工作可能和上面提到的没有关系。那就自己先在自己的工作中,找一个小部分先把大模型用起来。用起来以后先感受大模型,把相关的技巧掌握好,然后再逐步深入去使用。先把相关的论文和基础知识用起来。
一些基础的知识比如,transformer,gpt1-2-3,cot,rag,prompt,agent等。大模型应用的常见方法,sft,rlhf,评测等。
2025年了,行动起来吧,行动就是生产力。
#大模型 #大模型应用 #rag #你在用大模型了吗[投票]#


