下载安卓APP箭头
箭头给我发消息

客服QQ:3315713922
论坛 >淘宝营销 >不懂淘宝分词原理,将失去很多流量!

不懂淘宝分词原理,将失去很多流量!

一路风景都看透发布于 2015-08-23 20:31查看:826回复:4

我们知道,淘宝的数据库里有很多很多的宝贝,可以说是亿万的,那么在这亿万的宝贝当中,自然就有亿万的宝贝标题。然淘宝不可能人工去审核一个个标题的好坏,相关与不相关,违规与不违规等,那么系统是如何做到的呢?又是如何识别标题关键词的相关性从而去匹配宝贝的呢?那么我们的宝贝又该如何去书写呢?今天我们就一起走进搜索,一起探讨学习这个问题。相信大家对这块的问题肯定很迷惑,也很感兴趣,那么首先我们就讲解下这块的内容的理论,然后结合理论教大家去打造一个完美的标题;希望对大家有点帮助。
一、   淘宝搜索引擎的拆分词原理这块内容比较复杂  希望大家认真去听  会有很多发现 那么这里我们首先需要了解的就是淘宝搜索的目的是什么?我们可以花1分钟时间考虑下淘宝搜索的目的:反映客户的需求相信很多朋友都是有点了解的
所以一切搜索的改变都是根据用户的购物需求在改变而改变的
这个相信大家能够理解的  那么我们举个例子来说明下相信大家最近看过语嫣谈的搜索变革这个视频
课上说到一个数据
不知道大家还记得么
【2013年5月长词(字数比较多的关键字)占所有搜索词引导的PV对比去年同期显著上升9.4%】那么这个数据就是反应了客户的需求  
需求是什么呢他这里反映的用户需求--更精准
那么针对这个淘宝也会去跟着改变了解了淘宝搜索的目的以后我们来讲下淘宝搜索的分词原理。淘宝搜索的分词是从2011年的6月1日开始的,有了分词的技术以后呢,从原来的单词索引到今天的以相关性为前提的索引方式什么是单词索引呢?简单来说就是你搜索“红色”这个词,那么只要包含红色的东西都会被展示,包括“红色衣服”“红色手机”等。显然不能满足客户的需求,给客户体验很差,那么今天淘宝的完善和变革其实正是跟着客户的需求的改变而改变的。淘宝的分词原理大概包括以下五个部分:
我给大家看张图片

blob.png

这张图上大概概括了这五个方面
接下来 我们就一起来认识这五个方面的内容1)最小滑动窗口模型这个比较容易理解
什么是最小滑动窗口模型呢?简单来说就是紧密结合原则。这个大家不会太陌生吧
举个例子来说下吧比如说我们的产品是一款连衣裙,我们以“雪纺连衣裙”这个词来说,淘宝会把这个词进行拆分,变成“雪纺”&“连衣裙”两个词
那么系统又是如何组合的呢 我们知道淘宝有一个庞大的词库
【词库的词的来源简单说下:就是用户搜索的一些短词和类目词等等】好,我们模拟下系统的匹配方式,那么在“雪纺”这个词下对应了一个词库,是包含雪纺的所有的词,我们先把他命名为【雪纺.txt】,.txt是说这个包含这些词的一个文档当然在“连衣裙”这个词底下也是对应一个词库,我们把它命名为【连衣裙.txt】也是包含连衣裙的所有的关键词然后每一个词底下都是对应一个最优类目的【这个是我自己简单理解的】【最优类目的查询方法:相信大家很清楚了  我喜欢用淘宝指数
shu.taobao.com
的细分市场里面可以看到每个词的最优类目的分布情况给大家展示一张图

blob.png

然后在这些词中去找他们的交集,这样一来交集出来的词都是比较相关的了,这就是简单的拆词和匹配但是最小滑动窗口是什么呢?也就是说“雪纺”这个词和“连衣裙”这个词之间的距离,如果标题写成“雪纺连衣裙”比“2013雪纺韩版连衣裙”这个词相关性好,这是系统拆词的一个原则。为了方便大家理解  我做了张图  给大家参考

blob.png

这个图很形象的说明了这个但是那么我们如何去验证这个原则和我所说的正确性呢方法是很简单的  希望大家现场跟我一起操作下
去实战下  这个对写标题很有好处 打开淘宝首页:www.taobao.com我们搜下“雪纺连衣裙”这个词选择按照人气排名,因为人气排名是不考虑下架时间因素的,所以是比较好的一个验证方法,我们去看下排名考前的宝贝越紧密结合的产品多不多?当然这里会有一些其他因素的影响,所以会有些偏差。
希望大家现场去操作下  我再反馈下结果给大家!

blob.png

我们可以看到“雪纺连衣裙”连在一起的占比很大,如果你的产品在使用这个关键词排名的时候没有连在一起被展现的机会会减少,把我们的每个宝贝都选择一个最佳的属性词或者修饰词那它与我们的产品中心词进行紧密结合,这样的一个长尾关键词的相关性就非常好了亲们先花2分钟时间去检测下  
如果这个没问题了  就说第二原则
2)不要有异议什么意思呢?  我们剖析下这个问题是相当严重的,因为在淘宝系统去识别我们的标题的时候,如果识别错误的话,那就不好了,所以我们不能让淘宝系统进行误识别,因为系统是根据算法来的,不可避免的会错一些,但是针对这个问题,我们必须需要谨慎和注意。方便大家理解  我举个简单的例子
“beizi”这类的词,相信大家有所理解吧

blob.png

blob.png

这只是一个简单的例子,在后面我们再举个例子 所以我们要注意这些问题相信大家有了简单的理解吧  这些理论是非常重要的
3)属性进索引我们知道,淘宝的搜索叫做路径搜索和百度不一样,百度是目标搜索。也就是说淘宝会先去匹配用户搜索的关键词的类目分布,然后去匹配我们的标题宝贝。这是我们之前理解的相关性,其实淘宝远远不是这么简单的审核我们的相关性所以我们知道,产品不能放错类目。但是呢?仅仅是这样远远满足不了用户的需求度和客户体验,所以进出来了这个属性进索引。
这个很重要的  待会举个例子说明下什么意思呢?其一:当我们的宝贝的标题如果没有写上属性词的时候,但是我们的属性当中存在这个属性或者勾选了这个属性,那么用户在搜索这个词的时候,淘宝也会展示我们的商品,这是因为属性进了索引。我们操作下
我们搜索的是“标准镜头摄像机”这个词我们先操作  等下公布其二:我们需要去做的是不是说属性词就可以不写在标题当中了呢?显然这样去做会损失很多流量,不是因为淘宝不去展示我们的宝贝,而是因为影响排名因素的权重或者因子,不单单是属性这一项,所以我们的人气分很低的时候而是很难把握的,因为前面说到了紧密组合是吧,所以我们需要的是把一些重要属性或者热搜属性进行书写并紧密结合。所以我们需要填好属性,而且要全面的把属性填的完整。【有一点需要注意的是,属性和标题是不能冲突的,如果属性勾选的是“短袖”但是标题中却出现了“长袖”显然这样是不会展示的,而且还是违规。所以在写标题的时候千万不可以用这样的字眼和犯这样的错误。我举个例子说下

blob.png

收藏(0)0
查看评分情况

全部评分

此主贴暂时没有点赞评分

总计:0

回复分享

共有4条评论

  • 大萌
  • 一个高大上的名字
  • 知兰
  • helloxiao1
  • 起个名字你猜我叫啥
  • Mr ken
  • YUI
  • cappuccino
  • mr jack
  • IT宅男
  • love洒脱留守
  • 人生如梦183
  • 选择版块:

  • 标题:

  • 内容

  • 验证码:

  • 标题:

  • 内容

  • 选择版块:

移动帖子x

移动到: