推荐系统总结
主要是看《从零开始构建企业级推荐系统》
- 粗排用于缩小范围,避免精排阶段耗时过长
- 精排环节可以很复杂,在能承受的速度极限范围内运用复杂算法模型,比如决策树、深度神经网络等
召回层
召回层特点
- 处理数据量大
- 处理速度快
- 模型不能太复杂
- 不能使用太多特征
相关性计算路径
- 直接计算用户与物品的相关性
- 用户与物品的相关性 + 物品与物品的相关性 => 用户与物品的相关性
这种相关性可以通过基于物品的协同过滤(Item-based CF)算法来计算。 - 用户与用户的相关性 + 用户到物品的行为权重 => 用户与物品的相关性
这种相关性可以通过基于用户的协同过滤(User-based CF)算法来计算。 - 用户与标签的相关性 + 标签与物品的相关性 => 用户与物品的相关性
计算用户与物品间相关性的算法
排序层
排序层特点
- 处理数据量少
- 模型要够准
- 可以使用复杂的模型
- 可以使用较多特征