Umi-OCR 離線批量文字識別軟件

Umi-OCR 文字識別工具

免費、開源、可批量的離線 OCR 軟件;適用于 Windows10,11 平臺。

  • 免費:本項目所有代碼開源,完全免費。
  • 方便:解壓即用,離線運行,無需網絡。
  • 批量:可批量導入處理圖片,結果保存到本地 txt / md / jsonl 多種格式文件。也可以即時截屏識別。
  • 高效:采用 PaddleOCR-json C++ 識別引擎。只要電腦性能足夠,通常比在線 OCR 服務更快。
  • 精準:默認使用 PPOCR-v3 模型庫。除了能準確辨認常規文字,對手寫、方向不正、雜亂背景等情景也有不錯的識別率。可設置忽略區域排除水印、設置文塊后處理合并排版段落,得到規整的文本。
    Umi-OCR 離線批量文字識別軟件

Umi-OCR 離線批量文字識別軟件

下載

Umi-OCR 軟件本體含?簡體中文 & 英文?通用識別庫。
配套?多國語言識別擴展包?可導入? 繁中, 英, 日, 韓, 俄, 德, 法 ?識別庫,請按需下載。

Github 下載:

藍奏云下載:

兼容性

  • 系統支持 Win10 x64 及以上版本。
  • CPU 必須具有 AVX 指令集。常見的家用 CPU 一般都滿足該條件。(出現初始化引擎失敗等問題時請檢查 CPU 是否兼容,見樓下置頂回復)

簡單上手

準備

下載壓縮包并解壓全部文件即可。

截圖識別

點擊截圖按鈕或自定義快捷鍵,喚起截圖識別。

Umi-OCR 離線批量文字識別軟件

粘貼圖片到軟件

在任何地方(如文件管理器,網頁,微信)復制圖片,軟件上點擊粘貼按鈕,自動識別。

Umi-OCR 離線批量文字識別軟件

批量識別本地圖片文件

將圖片或文件夾拖進軟件,批量轉換文字。也可以點擊按鈕打開瀏覽窗口導入。

Umi-OCR 離線批量文字識別軟件

文本塊后處理功能

OCR 識別出的文本是按“塊”劃分的,通常一行文字分為一塊,有時還會將一行誤劃分為多塊,這給閱讀帶來了不便。文本塊后處理就是對文本塊進行再加工的過程,合并同一行或同一段落內的文字,按正確的順序排序。

下圖表示不同排版應該選用何種處理方案:

Umi-OCR 離線批量文字識別軟件

忽略區域功能

忽略區域是本軟件特色功能,可用于排除圖片中水印的干擾,讓識別結果只留下所需的文本。

通過設置頁的? 忽略區域編輯器 ?進入配置。

其他設置項

軟件內有詳盡的提示,鼠標懸停在設置項 UI 上即可顯示提示框。

更多高級功能說明,請見項目 Github 頁面。

更新日志

v1.3.1?2022.11.4
  • 修 Bug:快捷鍵模塊重寫,引入 pynput 庫,舍棄 keyboard 庫,解決幾率失效、錄制不正確等 Bug。
  • 新功能:添加開機自啟,桌面快捷方式,開始菜單快捷方式。
  • 新功能:多開軟件時提示。
  • 新功能:截圖時隱藏窗口。
  • 調整 UI:使用頻率極低的設置項設為隱藏的高級選項。
  • 優化:檢查引擎組件是否存在。
  • 優化: 橫排 - 合并多行 - 自然段 ?優化邏輯,支持 0~2 全角空格首行縮進。
v1.3.0?2022.9.29
  • 框選截屏
  • 系統托盤圖標
  • 引擎進程常駐
  • 文本塊后處理模塊
  • 重制 UI
  • 自定義主輸出欄字體
  • 更新 PaddleOCR-json 模塊至 v1.2.1,提供剪貼板支持。
  • 修正了 Bug:系統語言兼容性問題。
  • 修正了 Bug:微信圖片粘貼問題。
v1.2.6?2022.9.1
  • 更新 PaddleOCR-json 模塊至 v1.2.0,提高識別速度、準確度。
  • 調整 UI:更方便地用下拉框切換識別語言。
  • 調整 UI:可以從主窗口任意位置 / 任意選項卡拖入圖片。
  • 修正了 Bug:提高程序健壯性,增加啟動子進程時的更多異常處理情況。
  • 修正了 Bug:徹底解決了對邊緣過窄的圖片,識別結果不準確的問題。
  • 優化適配 PP-OCRv3 模型,徹底解決了 v3 版模型比 v2 慢、不準的問題。

…………

? 版權聲明
THE END
喜歡就支持一下吧
點贊11 分享