文字識別軟件能幫助我們很快捷的把一些圖片上面的文字拷貝下來,這里給大家?guī)淼氖乔迦A紫光ocr2000文字識別軟件使用教程,希望對大家有所幫助。
清華紫光OCR2000的作用----文字識別
為達到快速錄入,常將一些報紙書刊等使用掃描儀掃描到電腦中;但掃描后生成的是一個圖像文件,不能進行字處理編緝;所以使用OCR軟件將掃描后的圖像文件識別WORD文件、EXEL文件或記事本文件,可進行字處理編緝。
為達到快速錄入,常將一些報紙書刊等使用掃描儀掃描到電腦中;但掃描后生成的是一個圖像文件,不能進行字處理編緝;所以使用OCR軟件將掃描后的圖像文件識別WORD文件、EXEL文件或記事本文件,可進行字處理編緝。
文字識別的處理流程
1 掃描
2 識別
3 編緝修改
4 輸出
掃 描
安裝好掃描儀及相關驅動
掃描設置
字號在5號字以上,設分辨率300;普通印刷品,亮度為0。
使用“掃描”按鈕掃描
識別
1 版面調整 旋轉、傾斜校正、剪裁、反轉等操作
撤消版面調整操作可使用“恢復圖像”命令
2 版面分析 清華TH-OCR 2000千禧專業(yè)版的版面區(qū)域共有四種類型,即橫排正文 、豎排正文 、表格 和圖形圖像 。在進行識別前必須正確定義圖像中各區(qū)域的區(qū)域類型。
1) 先使用鼠標拖畫出一個方框將所需要的區(qū)域圍住,再定義區(qū)域屬性.
2)對于比較簡單的版面,也可使用“命令”菜單中的“版面分析”命令(F6)
識別
3)圖像內如含表格,應先將表格建為獨立的區(qū)域,然后確定其表格屬性。這時系統(tǒng)即自動進行框線檢測并將檢出的框線(包括內部的表格線)用粉紅色線表示。
當要識別的圖象表格框線不全時,必須進行虛擬框線檢測。(F8)選擇【命令[C]】菜單的【 虛擬框線檢測[I] 】,系統(tǒng)會將框線自動修補好。
虛擬框線檢測必須在框線檢測完成后才能進行
識別
3 識別(F2)和 多頁識別(CTRL+F2)
編緝修改
顯示菜單下---“后編改狀態(tài)”
前向詞匯,以光標所在處前一字為準,進行詞匯聯(lián)想,列出光標處可能的字。
逆向詞匯 以光標所在處后一字為準,進行詞匯聯(lián)想,列出光標處可能的字。
相似字 列出與當前光標處相似的字
常用符號 列出鍵盤不易輸入,但又常用的標點符號。
行逆序專門為港臺的部分報紙和其它印刷品設計的。一般橫排文字的排列是從左到右,而豎排文字則從右到左。在部分繁體材料中有時會出現(xiàn)相反的情況。這時使用行逆序就很方便了。
輸出
使用文件菜單中的“導出”命令
若導出的文件想在WORD中進行編緝,則選擇“RTF”格式;若是表格,想在EXEL中編緝,則選擇“HTML”;也可選擇“TXT”,可在任意字處理軟件中編緝,但不保留識別前文件的排版格式。