清华紫光OCR7.5是一款不错的OCR识别软件,但是识别率还是因文本而异,比如:本来就不清晰的传真件,或者图形打印的失真的文件等。但是我们可以通过对扫描的图像进行预处理,以获得更好的识别效果。
1】扫描,对于不清晰的文件,建议将扫描对比度调整为-30. 因为不清晰的话,很多细节会丢失,降低对比度,可以弥补某些细节的补足;
2】PHOTOSHOP二次补足,打开文件,如果扫描的是彩色,则先转换为黑白,然后调整曲线(ctrl+M),将图像调整到更黑。此外也可结合对比度、亮度调节等。
3】调整阈值将图像二值化,这时候一定要将图像显示比例放到100%,需要查看细节再调整最终的阈值。
4】调整度图像为像素
5】另存为TIF,即可用于清华紫光OCR7.5的识别。
此方法也可用于扫描存放电子文件的变清晰,效果倍儿棒~