4招有效解决推荐系统冷启动难题

突破冷启动困局

什么是智能推荐

智能推荐根据用户每个人的性别、年龄、爱好等维度塑造的静态用户画像,和用户每一次点击、点赞、评论、收藏等行为数据形成的动态用户画像相结合,来结合挖掘用户深层次兴趣需求维度。再借助产品的信息,从大量产品信息中找到用户感兴趣的产品推送出去。简而言之,智能推荐是根据用户的历史行为和兴趣预测用户未来的行为和兴趣。

所以大量的用户行为数据成为推荐系统的重要组成部分和先决条件,如何在没有大量用户数据的情况下设计个性化推荐系统,并且让用户对推荐结果满意从而愿意使用推荐系统,就是冷启动的问题。

什么是冷启动

冷启动问题主要分为3类:
  1. 用户冷启动:主要解决如何给新用户做个性化推荐的问题。当新用户到来时,我们没有他的行为数据,所以也无法根据他的历史行为预测其兴趣,从而无法借此给他做个性化推荐。
  2. 物品冷启动:主要解决如何将新的物品推荐给可能对它感兴趣的用户这一问题。
  3. 系统冷启动:系统冷启动主要解决如何在一个新开发的网站上(还没有用户,也没有用户行为,只有一些物品的信息)设计个性化推荐系统,从而在网站刚发布时就让用户体验到个性化推荐服务这一问题。

知道了什么是冷启动,接下来提供几种解决方案:

门榜单推荐

现有的数据可以根据热度排序形成产品的热门榜单,给刚进来的用户推荐,等到用户行为数据收集到一定程度的时候,再切换个性化推荐。

利用用户注册信息

根据用户注册时候提供的性别、年龄、职业等数据可以做粗粒度的个性化,推荐相关性高的产品。基于注册信息的个性化推荐流程基本如下:

  1. 获取用户的注册信息
  2. 根据用户的注册信息对用户分类
  3. 给用户推荐他所属分类中用户喜欢的物品

例如,刚进入的用户性别是女,年龄25岁,财务人员。查询3张离线计算好的相关表:一张是性别-书籍相关表,从中可以查询女性最喜欢的书籍;一张是年龄-书籍相关表,从中可以查询到25岁用户最喜欢的书籍;一张是职业-书籍相关表,可以查询到财务人员最喜欢的书籍。

最后,我们可以将这3张相关表查询出的书籍列表按照一定权重相加,得到给用户的最终推荐列表:25岁女性白领喜欢的书籍。

用户登录自选标签

要求用户登录时选择一个或者多个标签,然后收集整理用户感兴趣的范围,去推荐相关性高的内容和商品。

这个方法现在很常见,新用户进来之后需要选择自己喜欢的分类或内容,后面再推荐相关的产品信息。

利用物品的内容信息

利用物品的内容信息,将新物品先投放给曾经喜欢过和它内容相似的其他物品的用户,解决了如何将新加入的物品推荐给对它感兴趣的用户的问题。

不过当新物品加入时,内存中的物品相关表中不会存在这个物品,从而无法推荐新的物品。解决这一问题的办法是频繁更新物品相似度表。

0条评论 添加新讨论

登录后参与讨论
Ctrl+Enter 发表