之前的讨论里用数据分析过评论区中的内容,但是我们分析的是:用户在讨论什么?需要什么?而今天我们除了这个结果以外,我们还需要讨论一点:这些用户是谁?提问者?回答者?他是不是已经购买过这个商品了?我们应该更偏向对于提问者推送相关内容,因为他们是更潜在的购买者, 对于专家用户,可能他已经对类似内容失去兴趣了。 5、买过的商品还需要再推送吗? 不能够确定值得买平台有没有用户购买数据(例如海淘网站返利成功数据),如果存在这个数据库的话,这完全能够用户是否购买过这个产品。如果没有的话,只能从用户深层的行为来判断他是不是购买过这个产品了。 三、推荐场景思考 当理解用户行为之后,开始推荐系统第二步:满足用户需求,用算法做推荐。 大部分电商网站现在都采取了较为成熟完善的协同过滤算法,作为推荐系统的主体。同时也采用了多种推荐系统算法加权累加,例如:FFM、SVM、LFM等。我个人建议以CF item based为主,一是因为算法成熟,便于实现,二是user 数目远大于 item 数目,user based 很难以对用户进行归类。 做相似度分析第一步:Item画像设计,其遵循的原则为提炼出那些易于区分不同Item的显著性特征或标签。这一步需要做详尽性分析,不做讨论。 转而思考计算相似度时, 除了在本身item标签内容中计算相似距离,我们还需要考虑什么场景?什么特殊因子? 1、冷启动场景: 通常在新用户进入系统时,没有数据来源导致冷启动问题,大多数网站采取主动选择标签功能,进行标签相关内容推送:
2、推荐不是“推送”,不同用户的首页流推荐 首页的好文推荐是产品引流最重要的窗口,可是过度推送好文会影响部分产品用户的用户体验,从而影响转化率。如果根据不同用户使用场景决定首页流中好文的推送条数,可能效果会好一些。例如用户停留时间和用户日均浏览数来作为不同参数,确定权重W ,计算评分R
根据评分 R 的不同,来确定首页流的推荐数目。 3、多次重复推送同一品类文章:多样性问题 用户在内容平台所希望收获的文章一定是多样的,如果在较长时间跨度里推荐系统只能覆盖单一兴趣点,那这个推荐列表在长期评估时一定是无法让用户满意的。 那也就是说,我们在推荐系数时,必要考虑一个因子来控制多样性问题,如果当系统想推荐文章i时,我们就要对已经在文章列表R(u)内任意文章 j ,计算相似度,引入
如果系统的推荐分布频次,可以和用户点击频次挂钩,那结果就完全符合多样性要求了。 4、热门内容更热,冷门内容依然无人问津:马太效应 马太效应在UGC平台是常见的,通常体现在用户浏览参与集中于的热门文章中,大部分内容的参与度极低,也可以称为覆盖率问题。覆盖率可以描述一个推荐系统对于文章推荐效果长尾能力的发掘,指推荐文章占全部内容的占比,可以用信息熵度量。 作为整个UGC平台的管理方,站方有责任让所有优质的UGC内容受到关注,而并非只有热门内容,只有克服马太效应,这样才能够让发帖用户感受到更多的关注度,鼓励激发更多的优质内容。 加入一个因子惩罚热门权重
5、产品链层次因素 回想在本文开篇处提出的问题:用户在好价内搜索“软毛牙刷”,那好文系统应该推送的是“牙刷测评”还是关联”口腔健康“商品的文章呢? 宏观来看,所有品类的商品都存在产品链上下层的关系。买了iPhone X的人可能对于手机壳感兴趣,想买普通牙刷的人可能就是漱口水、电动牙刷的潜在消费者。没有一项产品是单独存在的,既然我们要做的是提高用户消费观念,那推荐系统是不是该偏向推送更深层次的内容,加大权重。 6、买过的产品还要推送吗? (责任编辑:admin) |