
近期,刚在行业大会上亮相的百度智能云语音模型,把AI玩具的交互体验感拉到了新高度,该产品将首响的延时压减至了1秒,了解的朋友们都知道,这可不是简单的参数升级。
想必之前给孩子买过的AI故事机的家长们都有所了解,延时在3到5秒的等待足可以磨掉孩子的耐心。所以百度这次的产品迭代,采用流式输入和输出的技术,实现了“边听、边想和边说”,连叹气和语调的变化这些小细节都能捕捉到,使玩具终于不再是简单的“答录机”,反而更像个能接话的小伙伴。我见过实丰文化的样品,曾问它“花木兰为什么要从军?”,话音刚落就接话,还能顺着孩子的追问扯出豫剧的元素,这比死记硬背的科普要生动多了。
在我看来这波技术的突破,踩准了市场的痒点。从今年字节的“显眼包”到BubblePal等这些AI玩具的爆火,能将原本的价格经过在二手市场里兜兜转转,就能轻松爆炒到几百到上千元不等,这种现象的本质是大家平日里缺少“有温度的互动”。反观百度聪明的地方,不只做技术,而是拉上乐鑫、杰理这些芯片厂商,搭建出了“云-端-内容”的生态链,就连澄海的玩具厂都能直接用它的模组进行大批量量产。
最有意思的是文化落地的玩法。借助了RAG技术,使厂商能给玩具装专属的知识库,比如灌进非遗的数据,就可以实现文化向导,塞进科幻题材和剧情设定,就能摇身一变,成了宇宙顾问。这思路比单纯拼参数要高级的多,毕竟家长们更愿意为“能教东西”的玩具而买单。
不过热闹的背后得冷静看问题,现在的AI玩具还在拼交互速度,接下来肯定要卷出内容的差异化。我认为明年会出现一批“IP定制款”,比如能讲《三体》细节的玩偶、会说非遗故事的公仔。但需要警惕AI时代下的内容同质化,毕竟再快的响应,也救不了千篇一律的回答。
1秒的突破,本质是让技术退到了幕后。当玩具能自然接话和懂点文化,它才真正从“智能硬件”变成了陪伴成长的伙伴,这或许就是AI落地最实在的样子,这也为AI应用多场景的落地奠定基础。
想必之前给孩子买过的AI故事机的家长们都有所了解,延时在3到5秒的等待足可以磨掉孩子的耐心。所以百度这次的产品迭代,采用流式输入和输出的技术,实现了“边听、边想和边说”,连叹气和语调的变化这些小细节都能捕捉到,使玩具终于不再是简单的“答录机”,反而更像个能接话的小伙伴。我见过实丰文化的样品,曾问它“花木兰为什么要从军?”,话音刚落就接话,还能顺着孩子的追问扯出豫剧的元素,这比死记硬背的科普要生动多了。
在我看来这波技术的突破,踩准了市场的痒点。从今年字节的“显眼包”到BubblePal等这些AI玩具的爆火,能将原本的价格经过在二手市场里兜兜转转,就能轻松爆炒到几百到上千元不等,这种现象的本质是大家平日里缺少“有温度的互动”。反观百度聪明的地方,不只做技术,而是拉上乐鑫、杰理这些芯片厂商,搭建出了“云-端-内容”的生态链,就连澄海的玩具厂都能直接用它的模组进行大批量量产。
最有意思的是文化落地的玩法。借助了RAG技术,使厂商能给玩具装专属的知识库,比如灌进非遗的数据,就可以实现文化向导,塞进科幻题材和剧情设定,就能摇身一变,成了宇宙顾问。这思路比单纯拼参数要高级的多,毕竟家长们更愿意为“能教东西”的玩具而买单。
不过热闹的背后得冷静看问题,现在的AI玩具还在拼交互速度,接下来肯定要卷出内容的差异化。我认为明年会出现一批“IP定制款”,比如能讲《三体》细节的玩偶、会说非遗故事的公仔。但需要警惕AI时代下的内容同质化,毕竟再快的响应,也救不了千篇一律的回答。
1秒的突破,本质是让技术退到了幕后。当玩具能自然接话和懂点文化,它才真正从“智能硬件”变成了陪伴成长的伙伴,这或许就是AI落地最实在的样子,这也为AI应用多场景的落地奠定基础。


