人工方法获取的规则准确率有待验证, 所以从数据挖掘的角度运用Apriori算法对词性标注规则的获取进行研究。用户根据需求自定义支持度与置信度, 在满足规定支持度的前提下, 先从候选集模式中挑选出高于支持度的模式,再挖掘出高于置信度的产生式规则, 获取的规则是隐含在数据中不易被发现的, 其表达上是明确的。实验表明, 自动获取的标注规则具有很好的利用价值, 可以提高词性标注的正确率。