推荐系统总结

主要是看《从零开始构建企业级推荐系统》

X
X

  • 粗排用于缩小范围,避免精排阶段耗时过长
  • 精排环节可以很复杂,在能承受的速度极限范围内运用复杂算法模型,比如决策树、深度神经网络等

召回层

召回层特点

  • 处理数据量大
  • 处理速度快
  • 模型不能太复杂
  • 不能使用太多特征

相关性计算路径

  1. 直接计算用户与物品的相关性
  2. 用户与物品的相关性 + 物品与物品的相关性 => 用户与物品的相关性
    这种相关性可以通过基于物品的协同过滤(Item-based CF)算法来计算。
  3. 用户与用户的相关性 + 用户到物品的行为权重 => 用户与物品的相关性
    这种相关性可以通过基于用户的协同过滤(User-based CF)算法来计算。
  4. 用户与标签的相关性 + 标签与物品的相关性 => 用户与物品的相关性

计算用户与物品间相关性的算法

排序层

排序层特点

  • 处理数据量少
  • 模型要够准
  • 可以使用复杂的模型
  • 可以使用较多特征

数据挖掘算法 - Deepwalk

  1. Deepwalk(深度游走)算法简介

参考

  1. 推荐系统技术演进趋势:从召回到排序再到重排