词性标注是自然语言处理的基础研究, 应用的领域十分广泛。基于转换的错误驱动学习词性标注是一种基于规则的算法, 但由于此算法占用大量的计算机资源进行规则的提取, 从而造成算法本身偏慢的问题。文章在原有算法的基础上, 跳过那些对语料库的标注不够明显的规则, 寻找应用最好的转换规则, 使语料库错误标注降到最低, 从而达到标注的目的。