第一站 - 轻松上网从此开始!

上网第一站

当前位置: > SEO >

功能解析:今日头条评论功能调研及思考(2)

时间:2017-11-06 09:30来源:我来投稿获取授权
以下内容来自网络或网友投稿,www.swdyz.com不承担连带责任,如有侵权问题请联系我删除。投稿如果是首发请注明‘第一站首发’。如果你对本站有什么好的要求或建议。那么都非常感谢你能-联系我|版权认领
被回复数,点赞数,评论内容长度,用户活跃度,用户关注、粉丝数、以及评论发布时间都将被作为参考指标。评论排序策略可应用的数据指标更加丰富。

  被回复数,点赞数,评论内容长度,用户活跃度,用户关注、粉丝数、以及评论发布时间都将被作为参考指标。评论排序策略可应用的数据指标更加丰富。

  

功能解析:今日头条评论功能调研及思考

  对189条评论的前20条评论信息各项指标进行分析比对,发现随机性非常强。

  推测此时评论显示排列策略不在考察各项数据指标,可能是利用评论分词处理后,与文章标签做比对哦,或算法筛选出用户更想看到的评论内容,或能够引起用户共鸣的评论前置。

  结合头条的理念就是应该把用户“想看的评论”展示给用户,最好是能做到“你看到的就是你想说的”。头条在对评论进行排序的时候可能考虑了以下几点:

  让评论的排序也“千人千面”,用户最先看到的评论应该是用户最感兴趣的;

  要实现第1点,头条可以根据评论得到的赞的个数和评论者和阅读用户的相似程度,给评论赋予不同的排序权重;

  在这一点上,很多之前的分析文章都会把评论排序盲目的分类,比如按照赞的多少,按照发布时间,顺序倒序等等。但实际上,目前用户量相对比较大的新闻、门户、聚合信息平台,都已经应用了最新的评论排序算法。

  说到这里就不得不提高reddit,这款国外鼎鼎大名的新闻社交产品。他的评论排序策略重新定义了产品的评论区。

  

功能解析:今日头条评论功能调研及思考

  Reddit评论排序分析

  “Best”排序

  有人对评论like,则数据库会进行采集,评论越多,like的越多,则机器越能精确判定该评论的排名。通过对精确程度的量化,从用户的like中尽可能推算出评论真实质量。

  机器从like与dislike数据库中抽样统计,计算出置信区间,我们第一步对这些区间进行排名,这个暂时排名比较的是这些评论最终排名100在一百次统计中95次可能落在的区间。

  对于抽样数据需要在数量上有保证,不然系统仍然会将其排在低位。

  10like+1dislike are better than 50like+25dislike. 前者会排在后者前面,通过概率计算结果来推算。

  但问题是,Reddit的评论排序策略虽然可以有效的筛选出用户喜欢的评论,但对时间参数的过度重视,依然会让其他用户只将关注焦点放在最新的评论上,使得评论的长尾越来越长。

  但回顾评论排序的算法历史,几乎都经历过按照发布时间到按照赞数,再到综合时间与赞数,再到现在综合多个参数进行综合考量。但其实回归本质及需求,都是为了解决下面这些问题:

  赞数多的评论只是迎合了大部分用户的偏好,而没实际意义。

  排名高的评论与文章并不相关,但因为一些手段和马太效应,更好的回答没得到足够的展示机会,于是被埋没。

  有争议的问题,很难明确怎样的排序是公平的。

  其实可以用作权重factor的无非以下几种,被回复数,点赞数,评论内容长度,用户活跃度,用户关注、粉丝数、以及评论发布时间。如何合理分配权重,是每个平台都会面对的问题,各自也有自己的策略。主要分为以下三个维度:

  

功能解析:今日头条评论功能调研及思考

  3.几点思考

  除了今日头条之外的其他平台,可能将权重factor更加侧重于在信息维度,即评论字数,即评论相关度。但通过对头条评论排序靠前的用户的分析,我认为头条将权重factor更加侧重在了用户维度与社交维度。

  首先,在社交维度上,被回复数高的评论拥有更高的排序权重,因为这样的评论能够激发话题,启动用户之间的互动。与此相比,被点赞数成了次级别的权重factor。因为确实存在这样的评论,用户点赞几千条,但是被回复数寥寥无几。

  能够引起用户激烈互动行为的评论一定是好评论,但不是所有的好评论都能激发用户的讨论行为。

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发布者资料
第一站编辑 查看详细资料 发送留言 加为好友 用户等级:注册会员 注册时间:2012-05-22 19:05 最后登录:2014-08-08 03:08
栏目列表
推荐内容
分享按鈕