当前位置:首页-优化知识
    百度搜索引擎中文分词算法盘点分析
    2015-1-23 13:41:03
    浏览次数:

    做网站优化工作的SEOer都知道,网站的标题,关键词和描述是网站优化的基础。但是如何设置这些东西,从而符合百度的算法和技术习惯并不是一个简单的问题。现在笔者和大家分享一下百度的中文分词技术,让大家对网站优化有个更深入的认识。

    所谓中文分词就是将一些一个短句分为一个个单独的词,或者将一个短词分为一个个汉字,比如网站seo优化,可以是网站seo/优化,也可能是网站/seo优化,还有可能是被分为网站/seo/优化,这就是中文分词,那么对于搜索引擎来说有哪些分词的技术呢?笔者总结下来主要分为五点。

    首先:用户改变关键词习惯搜索得出的不同结果,如果在百度里搜索的关健词的时候有加上空格或标点其搜索的结果是不一样的,比如搜索济南SEO和济南 SEO,其结果是有区别的,这就是因为如果搜索是济南seo,那么百度会根据自己的数据库分析这是一个单独的词,但是如果搜索济南 seo那么反馈的结果百度会认为你是需要搜索两个词。

    第二:搜索引擎的正向最大匹配法,什么是正向最大匹配,就是将词从左到右拆分,比如搜索济南seo工作室,百度将会有以下显示,这个就是从左到右的正向最大匹配法,会将济南seo 工作室按照两个词拆分。

    第三:搜索引擎的反向最大匹配法,通过正向最大匹配,相信大家都了解反向最大匹配了,就是百度会将词从右向左拆分,比如搜索济南优化工作室,百度就会将济南 优化工作室作为两个词,这个拆分是从右向左的。

    第四:双向最大匹配法,对于有些词百度会按照双向最大匹配法来拆分,比如在搜索济南网站优化工作室时我们会发现百度将济南网站优化和网站优化工作室都表明了红色,也就是百度会将这个词按照正反两个方面同时最大匹配了。

    第五:最少切分理论,对于最小切分理论其实是搜索引擎会将词按照最少的切分方式分词,也就是说如果可以分为两个词那么不会分成三段的,比如上海SEO工作室,这个词百度就将其分为两个词,而没有分为济南 SEO 工作室。

    通过以上几点的分析,相信大家对于中文分词都有一个比较详细的了解,笔者建议各位站长尽量通过各个分词技术研究用户一般会搜索的关键词来拟定标题的建设和关键词的布局。

     

    济南网站优化http://www.jngenan.com/

     

  • 客服在线
  • 客服在线