西西软件园多重安全检测下载网站、值得信赖的软件下载站!
西西首页 常用软件 软件下载 安卓软件 游戏下载 安卓游戏 MAC应用 驱动下载 安卓电视
系统工具网络工具媒体工具图形图像聊天工具应用软件编程开发手机软件安卓应用电脑安全字体素材

Umi-OCR文字识别工具软件

v2.1.1 绿色版
  • Umi-OCR文字识别工具软件v2.1.1 绿色版
  • 软件大小:95.1M
  • 更新时间:2023-11-07 08:54
  • 软件语言:中文
  • 软件厂商:
  • 软件类别:国产软件 / 免费软件 / 图像转换
  • 软件等级:3级
  • 应用平台:WinAll
  • 官方网站:暂无
好评:50%
坏评:50%

软件介绍

Umi-OCR文字识别工具软件是一款免费开源可批量的离线OCR软件,解压即用,离线运行,无需网络。采用 PaddleOCR-json C++ 识别引擎。只要电脑性能足够,通常比在线OCR服务更快。默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。

Umi-OCR文字识别工具软件

软件说明

全新升级:版本重构了绝大部分代码,提供焕然一新的界面和更强大的功能。

免费:本项目所有代码开源,完全免费。

方便:解压即用,离线运行,无需网络。

高效:自带高效率离线OCR引擎。只要电脑性能足够,可以比在线OCR服务更快。

灵活:支持定制界面,支持命令行、HTTP接口等多种调用方式。

软件特色

标签页

由一系列灵活好用的标签页组成。您可按照自己的喜好,打开需要的标签页,并锁定标签栏。

截图OCR

截图OCR:打开这一页后,就可以用快捷键唤起截图,识别图中的文字。

左侧的图片预览栏,可直接用鼠标划选复制。

右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。

也支持在别处复制图片,粘贴到Umi-OCR进行识别。

批量OCR

批量OCR:这一页支持批量导入本地图片并识别。

识别内容可以保存为 txt / jsonl / md / csv(Excel) 等多种格式。

支持文本后处理技术,能识别属于同一自然段的文字,并将其合并。还支持代码段、竖排文本等多种处理方案。

没有数量上限,可一次性导入几百张图片进行任务。

支持任务完成后自动关机/待机。

忽略区域:一种特殊功能,适用于排除图片中的不想要的文字。

在批量识别页的右栏设置中可进入忽略区域编辑器。

如上方样例,图片顶部和右下角存在多个水印 / LOGO。如果批量识别这类图片,水印会对识别结果造成干扰。

按住右键,绘制多个矩形框。这些区域内的文字将在任务中被忽略。

请尽量将矩形框画得大一些,完全包裹住水印所有可能出现的位置。

二维码

二维码:这里可以扫码。

支持多种格式的二维码、条形码。

支持一图多码。

可截图/粘贴/拖入本地图片。

全局设置

全局设置:在这里可以调整软件的全局参数。

支持更改界面语言。(翻译校对工作将在第一个正式版发布后进行)

支持切换界面主题。Umi-OCR拥有多个亮/暗主题。

可以调整界面文字大小、文字字体。

切换OCR插件。

辅助功能说明:

多国语言界面:软件界面支持多国语言。目前预览阶段为AI翻译生成,可能词义和排版不好,或者有错漏的情况。正式发布时会进行人工校对。

渲染器:软件界面默认支持显卡加速渲染。但是如果在你的机器上出现截屏闪烁、UI错位的情况,请调整全局设置→界面和外观→渲染器。

文本块后处理(段落合并)可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案如下:

单行:合并同一行的文字,适合绝大部分情景。

多行-自然段:智能识别、合并属于同一段落的文字,适合绝大部分情景。

多行-代码段:尽可能还原原始排版的缩进与空格。适合识别代码片段,或需要保留空格的场景。

竖排:适合竖排排版。需要与同样支持竖排识别的模型库配合使用。

简单上手

准备

下载压缩包并解压全部文件即可。

截图识别

点击截图按钮或自定义快捷键,唤起截图识别。

粘贴图片到软件

在任何地方(如文件管理器,网页,微信)复制图片,软件上点击粘贴按钮,自动识别。

批量识别本地图片文件

将图片或文件夹拖进软件,批量转换文字。也可以点击按钮打开浏览窗口导入。

识别结果将保存到本地。可选生成纯文本txt文件、带链接Markdown文件、原始信息jsonl文件等不同格式。可配置任务完成后执行关机/待机。

文本块后处理(排版优化)

OCR识别出的文本是按“块”划分的,通常一行文字分为一块,有时还会将一行误划分为多块,这给阅读带来了不便。文本块后处理就是对文本块进行再加工的过程,合并同一行或同一段落内的文字,按正确的顺序排序。

下图表示不同排版应该选用何种处理方案:

所有方案一览:

横排-优化单行

将误划分为多块的同一行文字合并到一行。

横排-合并多行-左对齐

将多个左对齐的行视为同一段落,合并文字。左侧未对齐或行距过大的行视为下一段落。

横排-合并多行-自然段

将多个左对齐的行视为同一段落,且第一行的开头允许多空出两个全角空格的宽度。

横排-合并多行-模糊匹配

只要垂直投影有重叠,行高一致,距离较近的文本块,视为同一段落。

竖排-从左到右-单行 / 竖排-从右至左-单行

优化竖排识别,合并同一行文字,按从左到右或从右到左的顺序输出每一行。 注意,必须搭配支持竖排识别的模型库(识别语言)一起使用。

可视化预览:

可以在忽略区域编辑器内预览文本块后处理的效果。编辑器中以虚线框标出识别到、经过后处理的文字块。

这里仅仅是借用了编辑器来展示后处理的效果,实际运行任务时 忽略区域机制 早于 后处理机制 执行,不受后处理的影响。

忽略区域功能

忽略区域是本软件特色功能,可用于排除图片中水印的干扰,让识别结果只留下所需的文本。

更新日志

新增:记忆窗口位置。 

新增:批量识图页增加图片预览窗口,单击图片条目打开。 

新增:检查软件是否有权限读写配置文件。

新增:报错弹窗提供一键复制及打开issues的功能。

新增:全局设置页添加左侧目录栏。

新增:插件的多国语言UI机制。

优化:截图预览面板中,文本框的位置更准确。

优化:调整部分UI布置。

修复:扫码模块添加导入异常检查。

修复:补充扫码页的拖入图片功能。 

修复:输出到单独文件txt时,文件名去除原后缀。

修复:一些小Bug。

软件截图

Umi-OCR文字识别工具软件 v2.1.1 绿色版

    其他版本下载

    发表评论

    昵称:
    表情: 高兴 可 汗 我不要 害羞 好 下下下 送花 屎 亲亲

    下载帮助下载帮助西西破解版软件均来自互联网, 如有侵犯您的版权, 请与我们联系。

    TOP
    软件下载