網友評分: 9.3分
漢王PDF OCR8.1.03中文版是一款非常好用的OCR文字識別軟件,它支持文字型PDF的直接轉換和圖像型PDF的OCR識別,即可以采用PCR的方式將PDF文件轉換為可編輯文檔,也可以采用格式轉換的方式直接轉換文字型PDF文件為文本。
1、識別正確率高,識別速度快、批量處理功能;
2、支持處理灰度、彩色、黑白三種色彩的BMP、TIF、JPG、PDF多種格式的圖像文件;
3、可識別簡體、繁體和英文三種語言;
4、具有簡單易用的表格識別功能;
5、具有TXT、RTF、HTM和XLS多種輸出格式,并有所見即所得的版面還原功能。
1、首先直接打開“HWPDFOCR80.exe”漢王PDF OCR;
2、點擊“文件”-“圖像”(或直接按快捷鍵ctrl+O);
3、在彈出的對話框中選擇PDF文件,此時下方的“pdf轉換為TXT文件”或“pdf轉換為RTF文件”將由灰變黑為可操作。
掃描文件:按下“Ctrl+N”調出掃描程序,掃描圖像文件。
打開文件:按下“Ctrl+O”打開圖像文件,追加圖像文件。
保存圖像:按下“Ctrl+S”鍵保存圖像。
圖像反白:按下“Ctrl+I”將圖像反白。
自動傾斜校正:按下“Ctrl+D”進行自動傾斜校正。
手動傾斜校正:按下“Ctrl+M”進行手動傾斜校正。
版面分析:按下“F5”鍵,對選中的文件進行版面分析。
取消版面分析:按下“Ctrl+Del”鍵,取消當前頁的版面分析。
一、漢王文字識別軟件可以識別英文嗎?
1、可以,識別之前,在菜單或者工具欄里面設置一下是識別中文或英文。
二、為什么用漢王OCR識別的文字都是亂碼?
1、可能是圖片不清晰,掃描的時候調整一下分辨率。高級選項也可以設置一下大小。
三、用漢王PDF OCRV8.0 把pdf文件轉換成TXT不成功?
因你的PDF文件是圖形格式,不能直接轉換(轉換了也是空白的),需要用OCR識別。識別前進行OCR識別設置,語言和灰度設置。
使用方法:
1.打開漢王(設置),打開PDF文件,提示拆分頁,確定,就自動識別頁和拆分頁。
2.再選擇第1頁,按住SHIFT,用鼠標滑動到最后一頁,選擇最后1頁,相當于全部選擇頁;
3.按F8開始自動識別,會識別到 \My Documents\My Hwdoc Files\HWPDFOCR80\IMAGE 目錄下;
4.因是按頁識別的,要合并TXT文件。
在識別的TXT文件目錄(\My Documents\My Hwdoc Files\HWPDFOCR80\IMAGE 目錄下)下,建立一個純文件文件,比如取名為:合并.TXT,改擴展名為BAT:合并.BAT
選擇,鼠標右鍵,選擇編輯,輸入1個語句:
“copy *.txt 合并.txt”或“type *.txt >> 合并.txt”
兩種方法都可以,選擇一種就行,保存退出;雙擊這個批處理程序,就把當前目錄下所有單頁TXT文件,合并成1個TXT文件。記住只點擊一次就行了,點擊多了會重復合并。
識別完圖片文字后導出時選擇“輸出”——“到指定格式文件”——選擇“保存類型為RTF文件”,這樣導出來就可以直接變成可編輯的WORD文件了,版面也一樣。