一,为什么我们需要用户兴趣分析 网站的最核心的目标是为用户某种有价值的服务,并实现自身的价值。显而易见的,用户的需求则是我们关注的核心。 以豆沙网所提供的小说搜索为例,用户的兴趣即是用户感兴趣的书籍的”口味“。 对于不同用户搜索同一个关键词的时候,搜索引擎输出同样的结果难以满足所有人的需求,因为每个人的兴趣不同 。 用户希望搜索得到的结果是满足自己“口味“的,这就要求搜索引擎对搜索结果根据用户的兴趣进行重排。 对于销售网站,良好而用户兴趣分析可以有效的提高用户的购买量。 二. 哪些应用使用了用户兴趣分析技术 (1) Youku等视频网站: 每个视频页面下会给出一个推荐视频列表,在视频播放完毕后也会显示一个推荐视频列表。 (2) 淘宝和亚马逊等购物网站: 当你购买了一件商品后,会提供你一个你还可能购买的商品的列表。 (3) 当当网等书籍购买网站:与(2)类似。当购买了某本书后,推荐你其他的商品。 (4) 家乐福等大型连锁超市,根据用户的购买记录,对货架的位置摆放进行重排。 一个教科书式的例子是: 通过数据分析发现,买啤酒的人也经常会购买止尿裤。 对具体事例进行分析后,发现往往是家庭主妇购买啤酒,她们有很大的可能也会购买止尿裤。 (5) 谷歌的个性化搜索(personalize searching) : 根据过往搜索和点击记录重排查询结果。 (searching result reranking) ,感兴趣的读者可以根据上面提供的关键词搜索学术文献。 三. 用户兴趣分析的主要实现技术 (1)根据用户过往记录与未浏览过的数据的文本匹配方法,将匹配度最高的推荐给用户,如优酷的视频末尾的推荐。 (2)协同过滤技术, 就是利用大众的大量历史记录,分析两个实体的相关性,并与将用户历史记录中实体相关性最高的推荐给用户。 以豆沙小说搜索为例, 系统为每个用户维护一个书架。这个书架中的书籍即是用户一直在关注的(书籍的更新)的列表。 如果有大量用户即收藏了A,又收藏了书籍B,那么我们就可以认为,书籍A和B的风格和内容基本相似, 其针对的细分读者群基本一致,我们就会将B推荐给只搜藏了A的用户,把A推荐给只搜藏了B的用户。。 (3)基于主题模型(Topic Model)的用户兴趣分析。 使用pLSA和LDA等主题模型对该问题进行建模。 计算出所有书籍从属于各个主题的归属度,记为向量X,并计算出用户的归属于所有主题的归属度,记为向量Y。计算A和B的cos相似度。并将与某用户相似度最高的若干书籍推荐给这个用户。 豆沙小说搜索()提供,欢迎转载,但请不要随意修改,以免扭曲了原文的含义。(我的上一篇文章被转载并简单的替换了关键词,导致错误百出) (责任编辑:admin) |