Umi-OCR 文字識別工具
免費、開源、可批量的離線 OCR 軟件;適用于 Windows10,11 平臺。
- 免費:本項目所有代碼開源,完全免費。
- 方便:解壓即用,離線運行,無需網絡。
- 批量:可批量導入處理圖片,結果保存到本地 txt / md / jsonl 多種格式文件。也可以即時截屏識別。
- 高效:采用 PaddleOCR-json C++ 識別引擎。只要電腦性能足夠,通常比在線 OCR 服務更快。
- 精準:默認使用 PPOCR-v3 模型庫。除了能準確辨認常規文字,對手寫、方向不正、雜亂背景等情景也有不錯的識別率。可設置忽略區域排除水印、設置文塊后處理合并排版段落,得到規整的文本。
下載
Umi-OCR 軟件本體含?簡體中文 & 英文?通用識別庫。
配套?多國語言識別擴展包?可導入?繁中, 英, 日, 韓, 俄, 德, 法
?識別庫,請按需下載。
Github 下載:
藍奏云下載:
兼容性
- 系統支持 Win10 x64 及以上版本。
- CPU 必須具有 AVX 指令集。常見的家用 CPU 一般都滿足該條件。(出現初始化引擎失敗等問題時請檢查 CPU 是否兼容,見樓下置頂回復)
簡單上手
準備
下載壓縮包并解壓全部文件即可。
截圖識別
點擊截圖按鈕或自定義快捷鍵,喚起截圖識別。
粘貼圖片到軟件
在任何地方(如文件管理器,網頁,微信)復制圖片,軟件上點擊粘貼按鈕,自動識別。
批量識別本地圖片文件
將圖片或文件夾拖進軟件,批量轉換文字。也可以點擊按鈕打開瀏覽窗口導入。
文本塊后處理功能
OCR 識別出的文本是按“塊”劃分的,通常一行文字分為一塊,有時還會將一行誤劃分為多塊,這給閱讀帶來了不便。文本塊后處理就是對文本塊進行再加工的過程,合并同一行或同一段落內的文字,按正確的順序排序。
下圖表示不同排版應該選用何種處理方案:
忽略區域功能
忽略區域是本軟件特色功能,可用于排除圖片中水印的干擾,讓識別結果只留下所需的文本。
通過設置頁的? 忽略區域編輯器
?進入配置。
其他設置項
軟件內有詳盡的提示,鼠標懸停在設置項 UI 上即可顯示提示框。
更多高級功能說明,請見項目 Github 頁面。
更新日志
v1.3.1?2022.11.4
- 修 Bug:快捷鍵模塊重寫,引入 pynput 庫,舍棄 keyboard 庫,解決幾率失效、錄制不正確等 Bug。
- 新功能:添加開機自啟,桌面快捷方式,開始菜單快捷方式。
- 新功能:多開軟件時提示。
- 新功能:截圖時隱藏窗口。
- 調整 UI:使用頻率極低的設置項設為隱藏的高級選項。
- 優化:檢查引擎組件是否存在。
- 優化:
橫排 - 合并多行 - 自然段
?優化邏輯,支持 0~2 全角空格首行縮進。
v1.3.0?2022.9.29
- 框選截屏
- 系統托盤圖標
- 引擎進程常駐
- 文本塊后處理模塊
- 重制 UI
- 自定義主輸出欄字體
- 更新 PaddleOCR-json 模塊至
v1.2.1
,提供剪貼板支持。 - 修正了 Bug:系統語言兼容性問題。
- 修正了 Bug:微信圖片粘貼問題。
v1.2.6?2022.9.1
- 更新 PaddleOCR-json 模塊至
v1.2.0
,提高識別速度、準確度。 - 調整 UI:更方便地用下拉框切換識別語言。
- 調整 UI:可以從主窗口任意位置 / 任意選項卡拖入圖片。
- 修正了 Bug:提高程序健壯性,增加啟動子進程時的更多異常處理情況。
- 修正了 Bug:徹底解決了對邊緣過窄的圖片,識別結果不準確的問題。
- 優化適配 PP-OCRv3 模型,徹底解決了 v3 版模型比 v2 慢、不準的問題。
…………
? 版權聲明
文章版權歸作者所有,未經允許請勿轉載。
THE END