推荐系统技术原理与实践
上QQ阅读APP看书,第一时间看更新

1.4 推荐系统的召回阶段

如果粗略地划分,在线模块可以分为召回和排序两个阶段,召回后面的粗排、精排和重排都统一划分在排序阶段。召回阶段主要根据用户部分特征,从海量的物品库里快速找出一小部分用户潜在感兴趣的物品,然后进入排序阶段;排序阶段可以融入更多的特征,使用更复杂的模型来精准地进行个性化推荐。召回强调快,而排序强调准。

业界普遍采用的方式是多路召回,即从多个维度出发,在海量库里把相关度高的候选结果尽可能快速地检索出来。采用多路召回是出于以下多方面的考虑。

多样性。从不同维度出发找到相关的候选结果。比如有些召回基于全局热度,有些召回则倾向于冷资源。

可解释性与灵活性。每一路召回从单独维度出发可以很好地解释召回的逻辑,如果效果不理想,调整起来复杂度低且更加灵活。

鲁棒性。即使某一路召回出现问题,其他召回也会正常返回数据而不至于影响主流程。

传统的个性化召回主要基于协同过滤和矩阵分解,最近发展起来的模型化召回主要包括图表征召回、浅层模型化召回、深度匹配模型化召回以及语言模型化召回。