歧义识别指一个字符串有多种分词方法,计算机难以给出到底哪一种分词算法才是正确的分词系列。如”表面的”可以分为”表面/的”或”表/面的”。计算机无法判断哪一种才是准确的分词系列。
基于字符串的分词算法:仅仅是跟一个电子词典进行比较,故不能进行歧义识别;
基于理解的分词算法:指通过理解字符串的含义,故有很强的歧义识别能力;
基于统计的分词算法:根据字符连续出现次数的多少,得到分词系列,故常常能够给出正确的分词系列选择,但是也有可能判断错误的情况。
网站优化中分词技术是必须研究的课题之一,一片好的推广软文会给网站带来可观的流量。尤其是商城网站。这是网站优化最直接也最有效的推广手段。网站推广中关键词的分词切词和页面的分布都是优化的重要细节。