




1⃣基于RL的推理大模型
对于LLM(大语言模型),2025年基于强化学习(RL)的推理大模型将成为研究的重点。O1突破了传统上大模型只依赖训练时计算资源扩展的局限,现在通过推理时计算的扩展(inference-time compute)来提升模型性能。实际上,2024年已经有部分大模型采用了类似O1的推理优化方法,预计这一趋势在2025年将持续扩展。
2⃣原生多模态大模型
在VLM(视觉语言模型)领域,2025年应该会广泛转向原生多模态大模型的研究,而非目前主流的“伪多模态大模型”,后者仅具备视觉理解能力而缺乏生成能力。2024年,谷歌的Gemini已经展示了原生多模态模型的强大能力,2025年这一领域将成为研究的重点,预计更多的大模型公司和开源社区将加大在这一方向的投入。
3⃣视觉生成模型
在视觉生成方面,2024年的Sora和Flux已经证明了DiT架构在扩散模型中的潜力。预计2025年,DiT架构将继续主导扩散模型领域,且其参数量有可能突破20B(甚至更多)。此外,基于自回归的视觉生成模型也开始展示出一定的能力,结合自回归与扩散模型的研究将成为未来的重要方向,这也是原生多模态大模型所需的关键技术。
?其他深度学习方面的问题厚台滴滴我!
#深度学习 #Python#sci#ccf#论文辅导#算法改进#代码定制#硕士论文辅导#研究生论文辅导#一对一指导
对于LLM(大语言模型),2025年基于强化学习(RL)的推理大模型将成为研究的重点。O1突破了传统上大模型只依赖训练时计算资源扩展的局限,现在通过推理时计算的扩展(inference-time compute)来提升模型性能。实际上,2024年已经有部分大模型采用了类似O1的推理优化方法,预计这一趋势在2025年将持续扩展。
2⃣原生多模态大模型
在VLM(视觉语言模型)领域,2025年应该会广泛转向原生多模态大模型的研究,而非目前主流的“伪多模态大模型”,后者仅具备视觉理解能力而缺乏生成能力。2024年,谷歌的Gemini已经展示了原生多模态模型的强大能力,2025年这一领域将成为研究的重点,预计更多的大模型公司和开源社区将加大在这一方向的投入。
3⃣视觉生成模型
在视觉生成方面,2024年的Sora和Flux已经证明了DiT架构在扩散模型中的潜力。预计2025年,DiT架构将继续主导扩散模型领域,且其参数量有可能突破20B(甚至更多)。此外,基于自回归的视觉生成模型也开始展示出一定的能力,结合自回归与扩散模型的研究将成为未来的重要方向,这也是原生多模态大模型所需的关键技术。
?其他深度学习方面的问题厚台滴滴我!
#深度学习 #Python#sci#ccf#论文辅导#算法改进#代码定制#硕士论文辅导#研究生论文辅导#一对一指导


