这几节我们都学了关键词,但是,你知道搜索引擎都是怎么来阅读关键词的吗?它们看关键词的方式是否跟我们一样呢?我们这次讲关键词的分词就带大家一起认识一下搜索引擎是怎么来看词的,我们跟程序的判断方式有什么不同,也可以更好的让大家了解SEO。
首先我们了解一下分词的概念。
中文分词值的是将一个较长的汉语词语切分成一个一个单独的词语,再按照一定方式重新组合成词序的过程,也被叫做中文的切词。
如:深圳网站设计公司
我们正常人会这样来阅读:
深圳网站设计公司,
但是百度就会把这个长词切成如下的几个关键词,而且还可以再随意组合,看看怎么能跟搜索者的需求更匹配:
例子:深圳网站设计公司可分为:深圳、网站、设计、公司。然后可以两两组合为:深圳网站、深圳设计、深圳公司、网站设计、网站公司、设计公司。还可以再叁叁组合,您可以自己试试看看深圳网站优化公司、或者深圳SEO优化公司总共有多少种组合方案。
下面我们来讲百度分词的方式:
一:基于字典匹配的分词方法:切词的过程来源于词典,把词或句与词典中的此条进行匹配处理,扫描之后匹配成句、词、子形式。
1.1 按照扫描方向不同,可分为正向匹配和逆向匹配
如:
我们和服务员工作在一起
正向匹配:我们 和服 务 员工 作 在一起
逆向匹配:我们 和 服务员 工作 在 一起
搜索引擎也是很聪明的,会根据自己不同的阅读方式,判断出哪个才是浏览者真正想要的。比如,这个案例,百度就会按照第二种方案来进行理解,不过,还是有些长句子的判断方式赶不上人工理解。
1.2 按照扫描方向和长度优先混合匹配,可分为正向最大匹配,和逆向最大匹配
如:一寸光阴一寸金
正向最大:一寸光阴一寸金
逆向最大:一寸光阴一寸金
1.3 混合匹配
如:深圳网站设计公司
这里就是被切词了,没有连串显示出来。这就是混合匹配,先拆开,分为深圳、网站、设计
公司四个词,然后再组合。
二:基于统计匹配的分词方法:
基于统计是指分析大量数据样本,扫描计算出字或词或者句出现的统计概率,几个字相邻出现越多,就越能形成一个词,同样的可以形成句。
如:最新苹果价格 SKR
三:基于理解匹配的分词方法
搜索引擎已经逐渐做到去模拟中文语法,去理解句子了。
但是,由于中文的博大精深,目前的搜索引起还是很难做到基于理解的分词技术。所以,SEO还需要您不断的进行摸索,总结出目前最适合推广的方式。
希望这篇文章在您SEO的学习道路上能起到帮助,如需更多网站SEO解决方案请联系风享互联咨询了解。