淘宝网作为国内最大的综合性电商平台,以其庞大的用户群体赢得了众多淘宝卖家的加入,从而也引发了这些淘宝商家之间的剧烈竞争,这样的局面使得淘宝站内搜索(淘宝SEO)尤为重要,今天张方文给大家分享淘宝站内搜索排名算法的一些知识。(特别提示:本人并不是完全懂得淘宝搜索的算法体系,由于影响淘宝搜索排序结果的因素有很多,而且这些因素很不稳定,所以至今没有一个人完全通晓淘宝搜索算法体系,请大家不要听信网络上一些所谓完全掌握淘宝搜索算法的不靠谱的言论。) 在此我只是通过我多年对淘宝搜索的观察和研究,同时结合淘宝网官方给出的宝贝优化建议和大量淘宝店铺指标数据分析总结,对淘宝站内搜索算法进行一些揣摩和猜测,从而达到搜索结果排名靠前的目的。在此声明:本人不承接任何淘宝搜索排名算法破解和店铺优化托管的业务,请不要加我来询问此类事宜。 淘宝站内搜索的工作原理其实和大部分搜索引擎的原理是大体相同的,下面我给出两张示意图来给大家讲解,方便大家理解,请不要太过纠结以下技术实现原理,我们只要通晓大概实现流程即可。
数据存储分词示意图 淘宝商家首先在后台上传宝贝,然后淘宝的信息(产品)存储服务器对这些宝贝进行存储、预处理、分词,最后建立文档数据库与倒排索引数据库,倒排索引数据库官方解释:?url=EQLQJgUyN_Q2zVz1hBXaUE4y8ZgHy5y_NkWCuvFxqXuQj3_4b4iiy0Gdua4M3ER8XA-bHNkaeiY9SgGUkaD-la,最后将处理结果通知给索引服务器,以等待前台用户搜索时使用。
用户请求数据示意图 等待数据录入分析处理后,前台用户进行搜索请求时,程序会将搜索请求发送给索引服务器,然后索引服务器将相关“关键词”提交到倒排索引数据库进行相关数据查询匹配,然后结合文档服务器,将查询结果提交给算法体系(我们今天研究的淘宝站内搜索算法),进行排序处理,最后用户就看到了相关搜索结果页面。 下面我们正式讲解淘宝站内搜索算法的知识,我将算法体系大致分为三大类: 一:相关性 不管在任何搜索引擎,关键词的相关性都是获取数据库数据的唯一有效途径,但是由于电子商务类型网站的特殊性,不得不引入产品类目概念,淘宝网也不例外。 1.关键词匹配度:这点是比较好理解的,就是客户搜索什么关键词,你的宝贝标题一定要包含该关键词,或者是与关键词为同义词。但是在撰写宝贝标题时,一定要注意关键词的组合和搜索引擎的分词。 2.类目匹配:在淘宝搜索引擎词典数据库内,关键词和类目是一一对应的关系,所以当前台客户搜索某个关键词的时候,程序是优先去找与该关键词所对于的类目去取数据的。 但是由于淘宝搜索引擎加入了程序自学习的功能,在一个相同关键词代表两种不同产品的时候,程序会自动优先展示历史客户最喜爱的类目的产品。 3.产品属性:搜索引擎会根据每个类目的产品属性不相同,然后针对不同类目对商家录入产品的属性进行分析后提取相应的唯一特征;或者是对单一产品属性值进行匹配索引来调整排序(例如:男装下的夹克类目,商家在录入产品后可以选择面料,例如商家选择了聚酯纤维),当前台客户搜索“聚酯纤维 夹克 男”即使你的宝贝标题没有聚酯纤维该关键词,只要你别的指标都达到了排名指标,你的宝贝一样能有比较理想的排名。 二:置信度 由于淘宝网对商家需要进行管控和约束,官方希望所有商家都能在一个诚信的环境下公平竞争交易,所以就推出了置信度的概念。 1.作弊处罚:对于一些作弊行为(包括大家比较关注的X单作弊),淘宝网的稽查系统是会对全网(或者特定类目)进行扫描,然后将可疑的产品进行提取,最后有人工进行筛选确定,从而做出相应的违规处罚。对于一些扣分商家将予以排名靠后处理。对于如何防止逃避淘宝的稽查系统,我会在后续文章中讲解,请大家期待。 2.保障服务:淘宝网为了更好的服务客户,推出了一系列的保障服务,常见的有:消费者保障服务、金牌卖家、7天无理由退货、运费险等等。这些保障服务对搜索排名靠前是有加分的,这些没有任何技巧可循,如果您有能力或者机会的话,建议能开通的全部开通。 三:微调指标 (责任编辑:admin) |