你必须了解的百度分词算法
做SEO如果你不了解百度的分词算法,那么你的长尾词该如何做呢?做了哪些词,会给另外哪些词带来排名提升了呢?今天我们就来详细分析一下百度的分词算法。
百度基于什么来进行分词呢?
第一、百度是基于用户的输入进行分词,当你输入一个(空格)开始,百度就会进行分词。
第二、基于百度自身的词典(百度词库)。
第三、基于用户的搜索行为(TD大数据)当有很多用户去搜索这个词句,那么百度可能就会把这个当做关键词。比如心花怒放,在大电影还没上映的时候,没什么人去搜索,可能百度就不会认为是一个关键词,当电影上线后,就会被收录,成为百度算法的一个关键词。
那么,百度会把一句话拆分成哪几个词呢?
今天教大家一种测试方法。比如我们搜索:南京网站优化公司,如图:
大家可以看到,百度会把出现这些词的网站按优先顺序排列,也会把这些词语,进行分开,南京/网站/优化公司等,进行不同的分词。
接下来我们看一下百度分词的算法:
百度只有在大于或者等于四个字符在时候,才会产生分词。
百度的匹配方式:
首先我们从SEO角度可以分为:完全匹配和部分匹配。
从技术角度分为:
①正向匹配
②逆向匹配
③最小切分
④双向匹配
南京SEO优化和SEO优化南京就是典型的例子,但是一般时候排名不会有太大变化。
百度优先使用正向最大匹配模式。