




昨日,火山引擎Force大会上发布了最新模型:豆包大模型1.8。
豆包1.8核心亮点还是很清晰的,大幅提升了Agent能力:支持 Agent 完成屏幕操作任务,大幅增强工具调用能力,长文和多轮指令遵循大幅度增强。
看了官方的一个案例,给出10项复杂需求,让豆包1.8全网比价选购耳机,豆包1.8在规划执行步骤后,调用了多个工具,理解屏幕并执行任务,最后筛选了最合适的商品。
大模型落地能力更强了,可以真正帮助我们完成各项繁琐的工作流程,更适合处理复杂、多步、多分支的企业级Agent任务。
这其实也是全球顶级模型现在的进化方向,从聊天、回答简单问题,到真正进入产业,理解意图、规划步骤并执行任务,帮各行各业解决实操问题。
看了权威测评,在Agent能力方面,豆包1.8在复杂指令遵循、智能体编程方面都表现不错,表现最突出的是在模拟人类使用浏览器完成任务的通用智能体测评集BrowserComp,超过了openai、genimi、cloude的多个模型登顶第一,这说明豆包1.8在遵循指令与工具使用方面的技术很成熟。
另外在视觉理解方面,豆包1.8的图片理解Tokens消耗更少,单次视频理解帧数从640帧倍增1280帧,可以低帧率理解超长视频,在线教育、产业质检等等产业场景中都用得上。
多模型能力的行业测评中,豆包1.8的多模型通用视觉问答和长视频理解均排在前列,动作与感知、空间理解均表现第一,整体实力在第一梯队。
其实落地能力一直是火山引擎的强项,在手机、消费、汽车、教育等等行业覆盖的都比较广。听业内人士说,火山引擎也是字节今年增速非常高的业务。
看到官方公布数据,截至2025年12月,豆包大模型日均调用量已超50万亿位居中国第一、全球第三,一年半内实现417倍增长,较去年同期增速超10倍,可见市场对于豆包大模型的认可。
Agent和多模态能力更强的豆包大模型1.8上线后,豆包的整体能力又上了一个新台阶。未来AI大模型肯定要往产业深处扎,真正懂企业需求的大模型才能走得更远。
#火山引擎 #豆包大模型 #AI大模型 #AI
豆包1.8核心亮点还是很清晰的,大幅提升了Agent能力:支持 Agent 完成屏幕操作任务,大幅增强工具调用能力,长文和多轮指令遵循大幅度增强。
看了官方的一个案例,给出10项复杂需求,让豆包1.8全网比价选购耳机,豆包1.8在规划执行步骤后,调用了多个工具,理解屏幕并执行任务,最后筛选了最合适的商品。
大模型落地能力更强了,可以真正帮助我们完成各项繁琐的工作流程,更适合处理复杂、多步、多分支的企业级Agent任务。
这其实也是全球顶级模型现在的进化方向,从聊天、回答简单问题,到真正进入产业,理解意图、规划步骤并执行任务,帮各行各业解决实操问题。
看了权威测评,在Agent能力方面,豆包1.8在复杂指令遵循、智能体编程方面都表现不错,表现最突出的是在模拟人类使用浏览器完成任务的通用智能体测评集BrowserComp,超过了openai、genimi、cloude的多个模型登顶第一,这说明豆包1.8在遵循指令与工具使用方面的技术很成熟。
另外在视觉理解方面,豆包1.8的图片理解Tokens消耗更少,单次视频理解帧数从640帧倍增1280帧,可以低帧率理解超长视频,在线教育、产业质检等等产业场景中都用得上。
多模型能力的行业测评中,豆包1.8的多模型通用视觉问答和长视频理解均排在前列,动作与感知、空间理解均表现第一,整体实力在第一梯队。
其实落地能力一直是火山引擎的强项,在手机、消费、汽车、教育等等行业覆盖的都比较广。听业内人士说,火山引擎也是字节今年增速非常高的业务。
看到官方公布数据,截至2025年12月,豆包大模型日均调用量已超50万亿位居中国第一、全球第三,一年半内实现417倍增长,较去年同期增速超10倍,可见市场对于豆包大模型的认可。
Agent和多模态能力更强的豆包大模型1.8上线后,豆包的整体能力又上了一个新台阶。未来AI大模型肯定要往产业深处扎,真正懂企业需求的大模型才能走得更远。
#火山引擎 #豆包大模型 #AI大模型 #AI