展会资讯
搜索策略产品:搜索系统逻辑
2025-10-21 21:41
搜索策略产品:搜索系统逻辑

搜索策略产品:搜索系统逻辑

搜索策略产品:搜索系统逻辑

搜索策略产品:搜索系统逻辑

搜索策略产品:搜索系统逻辑

搜索策略产品:搜索系统逻辑

搜索场景主要模块
基本上都是由搜索入口、搜索中间页、搜索结果页这三部分组成,如下:
- 搜索入口:搜索框+底纹词(搜索框自带的推荐词)
- 搜索中间页:历史搜索、热门搜索/搜索发现、联想词、主动搜索、中间页搜索榜单(或运营banner)
- 搜索结果页:搜索结果页feed流、排序/筛选功能模块、广告位、运营位/banner
搜索场景核心流程
当你在搜索框中输入一串搜索词后,页面展示出你想要的结果,但其中的逻辑却是很复杂,
整个流程的重点逻辑也包含了召回、排序、重排,但更为重要的是query处理部分,因为上面详细讲了 召回——排序——重排部分,因此这里不过多讲解,只将重点放在query处理上。
query主要由query预处理、意图识别、query分词、query改写4个部分组成,各公司会依照搜索业务的复杂程度进行部分简化;(query:用户搜索词,例如用户在搜索框输入“秋冬连衣裙女”并点击搜索,那么用户query就是“秋冬连衣裙女”)。
1)query预处理
这一步主要是针对用户在搜索框中输入的搜索词,进行数据清洗。
搜索词基本上都会有长度限制,一种是输入框限制搜索词长度,一种是query预处理的时候进行搜索词截断,例如超过20个字长度的搜索词只截取前20个字。
因为用户输入搜索词的不规范,且不同的用户对同一种诉求的表达往往会存在地域、文化程度以及清晰度的差异,因此会对搜索词进行转化:大小写转换,例如“太空狼人杀3d版”转换为“太空狼人杀3D版”;简繁体转换,例如“太空狼人殺”转换为“太空狼人杀”;还有全半角转换,这里就不再展开过多说明。
query预处理这一步都是根据用户主动输入的搜索词,进行高频query查询检索出的常见问题,针对问题进行本质问题本质解。
2)意图识别
意图识别的本质就是分类问题,主要是根据业务需求进行用户意图分类,分为几个大类,收集每种意图类别下的常用词进行模型训练,模型准确率越高,意图识别效果越好。意图识别在搜索系统中是必不可少的,意图识别在很大程度上决定了用户搜索质量的好坏。
意图识别的难点:
1. 输入不规范
2. 数据冷启动
3. 多意图识别
4. 业界没有固定的评价标准
3)query分词
4)query改写
具体看图

#AI产品经理 #建筑转行 #留学生 #校招 #大模型产品经理 #搜索产品经理
发表评论
0评