第一站 - 轻松上网从此开始!

上网第一站

当前位置: > SEO >

小说搜索与用户兴趣分析技术

时间:2013-06-01 09:00来源:网络 作者:taiji1985 点击: 我来投稿获取授权
以下内容来自网络或网友投稿,www.swdyz.com不承担连带责任,如有侵权问题请联系我删除。投稿如果是首发请注明‘第一站首发’。如果你对本站有什么好的要求或建议。那么都非常感谢你能-联系我|版权认领
本文阐述了小说搜索中用户兴趣分析的相关技术与应用价值

  一,为什么我们需要用户兴趣分析

  网站的最核心的目标是为用户某种有价值的服务,并实现自身的价值。显而易见的,用户的需求则是我们关注的核心。 以豆沙网所提供的小说搜索为例,用户的兴趣即是用户感兴趣的书籍的”口味“。 对于不同用户搜索同一个关键词的时候,搜索引擎输出同样的结果难以满足所有人的需求,因为每个人的兴趣不同 。 用户希望搜索得到的结果是满足自己“口味“的,这就要求搜索引擎对搜索结果根据用户的兴趣进行重排。

  对于销售网站,良好而用户兴趣分析可以有效的提高用户的购买量。

  二. 哪些应用使用了用户兴趣分析技术

  (1) Youku等视频网站: 每个视频页面下会给出一个推荐视频列表,在视频播放完毕后也会显示一个推荐视频列表。

  (2) 淘宝和亚马逊等购物网站: 当你购买了一件商品后,会提供你一个你还可能购买的商品的列表。

  (3) 当当网等书籍购买网站:与(2)类似。当购买了某本书后,推荐你其他的商品。

  (4) 家乐福等大型连锁超市,根据用户的购买记录,对货架的位置摆放进行重排。 一个教科书式的例子是: 通过数据分析发现,买啤酒的人也经常会购买止尿裤。 对具体事例进行分析后,发现往往是家庭主妇购买啤酒,她们有很大的可能也会购买止尿裤。

  (5) 谷歌的个性化搜索(personalize searching) : 根据过往搜索和点击记录重排查询结果。 (searching result reranking) ,感兴趣的读者可以根据上面提供的关键词搜索学术文献。

  三. 用户兴趣分析的主要实现技术

  (1)根据用户过往记录与未浏览过的数据的文本匹配方法,将匹配度最高的推荐给用户,如优酷的视频末尾的推荐。

  (2)协同过滤技术, 就是利用大众的大量历史记录,分析两个实体的相关性,并与将用户历史记录中实体相关性最高的推荐给用户。 以豆沙小说搜索为例, 系统为每个用户维护一个书架。这个书架中的书籍即是用户一直在关注的(书籍的更新)的列表。 如果有大量用户即收藏了A,又收藏了书籍B,那么我们就可以认为,书籍A和B的风格和内容基本相似, 其针对的细分读者群基本一致,我们就会将B推荐给只搜藏了A的用户,把A推荐给只搜藏了B的用户。。

  (3)基于主题模型(Topic Model)的用户兴趣分析。 使用pLSA和LDA等主题模型对该问题进行建模。 计算出所有书籍从属于各个主题的归属度,记为向量X,并计算出用户的归属于所有主题的归属度,记为向量Y。计算A和B的cos相似度。并将与某用户相似度最高的若干书籍推荐给这个用户。

  豆沙小说搜索()提供,欢迎转载,但请不要随意修改,以免扭曲了原文的含义。(我的上一篇文章被转载并简单的替换了关键词,导致错误百出)

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发布者资料
第一站编辑 查看详细资料 发送留言 加为好友 用户等级:注册会员 注册时间:2012-05-22 19:05 最后登录:2014-08-08 03:08
栏目列表
推荐内容
分享按鈕