汉王PDF OCR是一款功能丰富的文件处理软件,它拥有简洁的界面,却具备强大的功能,无论是日常生活还是办公场景,都能成为我们得力的工具。
汉王PDF OCR官方版是汉王OCR 6.0和尚书七号的升级版,新增了PDF文件处理功能,能够将PDF文件(包括文本型和图片型)转化为可编辑的各类文档,如(PDFTOWORD)或(PDFTOTXT)。目前该官方版已全面升级,并且对个人用户免费开放,无任何功能限制。

文件管理区:可对文件进行管理和整理。
1. 打开文件:通过选择“文件”菜单,指定打开图像文件的路径,图像文件就会显示在管理区。也能用鼠标将图像文件拖拽到管理区,还可以将打开的图像页复制、粘贴到管理区。
2. 删除文件:按下键盘上的“Delete”键即可删除文件。
3. 调整文件:选中单个文件或按住Ctrl键选择多个文件后,将文件拖放到想要调整的位置。
4. 文件格式:本系统支持TIF、BMP、PDF格式,彩色灰度图还支持JPG格式。
5. 文件语言:系统支持中文简体、英文、简繁体混排以及中英文混排方式。
6. 图像文件重命名:选中文件后,点击文件菜单可将其保存成TIF、BMP、JPG文件(注:本系统不支持批量图像文件改名)。
7. 图像文件保存路径:在测试图库中能够设置获取图像文件的路径、名称和格式。若该路径不存在,系统会提示是否创建;若要选择已存在的路径,可点击“扫描到”按钮,弹出选择路径对话框,从中选择需要保存图像的路径。
候选字区:在修改识别结果时,可直接从候选区选择字来修改当前字。
识别结果区:用于显示当前图像文件的识别结果。
原图像区:显示当前正在处理的图像。
搜索区:支持百度、Google搜索。
1. 图像输入、图像前处理、预识别。
2. 图像输入
汉王PDF OCR官方版针对不同的图像格式,采用不同的存储格式和压缩方式,目前借助OpenCV、CxImage等开源项目实现。
3. 预处理
汉王ocr文字识别软件的功能主要涵盖二值化、噪声去除、倾斜校正等。
4. 二值化
对于摄像头拍摄的彩色图片,因其所含信息量巨大,为便于计算机更高效地识别文字,需先对彩色图进行处理,使图片仅保留前景与背景信息,可简单定义前景为黑色,背景为白色,这就是二值化图。
5. 噪声去除
不同文档对噪声的定义不同,依据噪声特征进行去噪处理,即为噪声去除。
6. 倾斜校正
由于用户拍照文档时往往较为随意,拍出的图片难免会有倾斜,这就需要文字识别软件进行校正。
7. 版面分析
汉王ocr文字识别软件将文档图片分段落、分行的过程称为版面分析,鉴于实际文档的多样性和复杂性,目前尚无固定的最优切割模型。
8. 字符切割
受拍照条件限制,字符常出现粘连、断笔情况,这极大地限制了识别系统的性能。
9. 字符识别
该研究开展较早,早期采用模板匹配,后来以特征提取为主,但文字的位移、笔画粗细、断笔、粘连、旋转等因素,极大增加了特征提取的难度。
10. 版面还原
人们期望识别后的文字能像原文档图片一样排列,段落、位置、顺序不变地输出到Word文档、PDF文档等,这一过程即为版面还原。
11. 后处理、校对
汉王PDF OCR会根据特定的语言上下文关系,对识别结果进行校正,这就是后处理。