OCR(Optical CharacterRecognition)是通过检测字符每个像素亮度的模式确定其形状, 然后用字符识别方法将形状翻译成计算机文字的过程。文章利用Java语言实现OCR步骤, 包括像素二值化, 图像分割, 训练识别和输出等。测试开发是在web验证码识别场景中进行的, web验证码是将一串随机产生的符号, 生成为图片, 再加上一些干扰线, 使之能有效防止恶意注册和灌水。通过测试表明, 该方法可行、 有效; 拒识率、 误识率低; 识别速度快, 具有一定的实用意义。