今天得空带来一篇分享,KDD’21的Applied Data Science Track中,淘宝搜索发表的一篇EBR文章[9]:Embedding-based Product Retrieval in Taobao Search。论文要讨论的几大问题提前预览下:
- 搜索场景中,query如何充分地进行语义表征?电商平台的query通常是短query,如何对有限长度的query进行充分的语义表征?
- 搜索场景中,用户历史行为序列如何建模?如何防止引入和当前query无关的历史行为导致相关性问题?
- 搜索场景中,基于向量的检索系统(EBR)如何保证相关性? EBR是基于向量的检索,不是完全匹配的检索,很容易检索到和当前query不相关的商品,那么该如何保证相关性?