UmiOCR 网站介绍
UmiOCR 是一个开源、免费的离线OCR(光学字符识别)工具,专注于提供高效、灵活的文字识别解决方案,支持 Windows 7 x64 及 Linux x64 系统,无需网络即可运行。其核心定位是“轻量、好用、可扩展”,覆盖截图识别、批量处理、文档解析、二维码操作等多种场景,适合个人日常使用或开发者集成调用。
一、核心功能模块
UmiOCR 通过标签页组织功能,用户可按需开启,支持窗口置顶、标签锁定等便捷操作,主要功能如下:
1. 截图OCR
快捷操作:打开标签页后,用快捷键唤起截图,识别图中文字;也支持粘贴或拖入图片识别。
结果处理:左侧预览栏可直接划选复制文字,右侧记录栏可编辑、批量复制识别结果;支持文本后处理(如多栏排版解析、保留缩进等),自动整理识别结果的顺序和格式,适配代码、文档等不同场景。
特殊支持:兼容竖排文字识别,部分OCR引擎支持公式识别。
2. 批量OCR
格式支持:导入本地图片(支持 jpg、png、webp 等常见格式),批量识别后可导出为 txt、jsonl、md、csv(Excel)等格式。
忽略区域:针对带水印、页眉页脚的图片,可绘制矩形框排除干扰区域——仅完全处于框内的文本块会被忽略,避免误删有效内容。
效率优化:无数量上限,支持任务完成后自动关机/待机;可调整“限制图像边长”适配超大长图/大图。
3. 文档识别
格式支持:处理 PDF、XPS、EPUB 等文档,可从扫描件中提取文本,或生成双层可搜索PDF(保留原始排版,文本可选中复制)。
实用功能:支持忽略页眉页脚,适合处理书籍、论文等长文档。
4. 二维码工具
扫码功能:截图、粘贴或拖入图片,识别其中的二维码/条形码(支持 Aztec、Code128、QRCode 等19种协议),支持一图多码。
生成功能:输入文本生成二维码,可调整纠错等级等参数。
5. 全局设置
个性化调整:支持切换界面语言(繁中、英语、日语等)、主题(亮/暗模式)、字体大小;可添加桌面快捷方式或设置开机自启。
性能优化:默认开启显卡加速渲染,若出现界面错位、截屏闪烁,可切换“渲染器”或关闭硬件加速。
插件管理:支持切换OCR插件(如 PaddleOCRjson、RapidOCRjson 等离线引擎),扩展识别能力。
二、技术扩展能力
UmiOCR 提供接口调用方式,方便开发者集成:
命令行调用:通过 CLI 指令实现批量识别、二维码操作等功能(详见项目文档 `docs/README_CLI.md`)。
HTTP接口:支持通过网络请求调用OCR、文档识别、二维码功能(详见 `docs/http/README.md`)。
三、开源与社区支持
开源仓库:主仓库(https://github.com/hiroisora/UmiOCR)包含核心代码,另有插件库(UmiOCR_plugins)、Windows/Linux 运行库等关联仓库。
下载方式:提供多渠道下载,国内推荐蓝奏云(https://hiroisora.lanzoul.com/s/umiocr,免注册无限速),也可从 GitHub Releases、SourceForge 获取。
本地化翻译:通过 Weblate 平台协作,支持繁中、英语、日语、俄语等多语言,欢迎译者参与补充。
四、其他信息
开发维护:由个人开发者 `hiroisora` 用业余时间维护,接受爱发电(https://afdian.com/a/hiroisora)赞助。
更新日志:项目根目录 `CHANGE_LOG.md` 记录版本迭代,最新版本为 v2.1.5(2025年3月发布)。
UmiOCR 以“离线、免费、实用”为核心优势,聚焦用户实际需求,是个人日常处理文字识别、开发者搭建OCR服务的优质选择。
