精易论坛

标题: 离线万能文字识别+校对和段落分行 [打印本页]

作者: 超人007x    时间: 2023-3-4 19:38
标题: 离线万能文字识别+校对和段落分行
本帖最后由 超人007x 于 2023-3-4 19:43 编辑

在学校的时候经常需要把纸质文档转为电子版,但是很多文字识别不支持段落分行
感谢不知道哪位大大的源码,在此基础上增加了校对和段落分行的功能,校对会把置信度低的文字标红,复制到Word里面直接首行缩进就行了
可以拖进图片框识别,也可以读取剪辑版图片,配合微信截图工具使用就行


因为是离线版的,所以有模型,有点大,上传了123云盘,使用了精易模块
再次感谢开源作者,开源精神万岁
https://www.123pan.com/s/8NF7Vv-RsWHA.html提取码:zkwu

演示2.png (45.13 KB, 下载次数: 19)

复制到Word的效果

复制到Word的效果

作者: POLICE察    时间: 2023-3-4 22:13
真是太牛逼了
作者: 独倚斜阳    时间: 2023-3-4 22:34
不错 至少是免费的  其实省事可以直接百du还是谁的api  临时用或者当生产力那点成本忽略不计
作者: 大师兄是反派    时间: 2023-3-5 06:14
开源精神必须支持~
作者: 熬夜    时间: 2023-3-5 07:32

开源精神必须支持~
作者: 撒加    时间: 2023-3-5 08:28
识别率和速度看看
作者: lijian001    时间: 2023-3-5 08:40
下载试试看
作者: 一指温柔    时间: 2023-3-5 08:50
开源精神必须支持~
作者: lijian001    时间: 2023-3-5 08:50
有背景色字体就识别不准确了。。。。。。。

1677977343533.jpg (93.66 KB, 下载次数: 0)

1677977343533.jpg

作者: 13012145633    时间: 2023-3-5 08:59
开源精神必须支持~
作者: renjianhong48we    时间: 2023-3-5 11:04
感谢分享
作者: wjswzj0    时间: 2023-3-5 11:44
感谢分享
作者: 外星星人    时间: 2023-3-5 12:56
辛苦分享了
作者: lq850815    时间: 2023-3-5 13:35
感谢分享
作者: xtavoxing    时间: 2023-3-5 16:23
感谢分享感谢分享
作者: zjbdsg    时间: 2023-3-5 16:26
66666666666666
作者: xtavoxing    时间: 2023-3-5 16:29
这个可以自己在训练吗?
作者: 最帅    时间: 2023-3-5 20:04
识别不出来会带着程序一起崩溃
作者: 亿万    时间: 2023-3-5 21:00

感谢分享
作者: fengyungzs    时间: 2023-3-5 23:13
确定是离线的吗

作者: 396384183    时间: 2023-3-6 14:03
很厉害 持续更新
作者: 花花湖    时间: 2023-3-6 18:50
感谢分享
作者: oushg79    时间: 2023-3-7 10:56
这个好,,感谢分享
作者: sunsun321    时间: 2023-3-7 11:08
感谢分享感谢分享
作者: fanggeaaa    时间: 2023-3-7 13:16
这个好用速度很快
作者: camingo    时间: 2023-3-7 17:58
现在VX图片自带ocr
作者: keepking    时间: 2023-3-8 14:22
试用了效果不错,程序加载的都是mobile的模型,总共才7m左右,我看2号文件夹里有一些硕大的模型,这个程序里没用,这个有啥用途吗?
作者: keepking    时间: 2023-3-8 14:27
keepking 发表于 2023-3-8 14:22
试用了效果不错,程序加载的都是mobile的模型,总共才7m左右,我看2号文件夹里有一些硕大的模型,这个程序 ...

「PaddleOCR」
模型简介
模型名称
推荐场景
检测模型
方向分类器
识别模型

中英文超轻量OCR模型(9.4M)ch_ppocr_mobile_v2.0_xx移动端&服务器端推理模型/ 预训练模型]推理模型 / 预训练模型推理模型/ 预训练模型
中英文通用OCR模型(143.4M)ch_ppocr_server_v2.0_xx服务器端推理模型/ 预训练模型推理模型/ 预训练模型推理模型 / 预训练模型原来用的是这个,估计我手动改成大模型效果会更好


作者: keepking    时间: 2023-3-8 14:36
https://gitee.com/paddlepaddle/PaddleOCR 这个是ocr模型的地址,应该可以弄的更强大
作者: 素颜也倾城    时间: 2023-3-8 17:34
开源精神万岁
作者: 杨明煜    时间: 2023-3-9 10:11
值得学习,谢谢呀!..........
作者: 碎石    时间: 2023-3-10 09:05
请问支持竖排文字识别吗?很多古文是竖排文字...
作者: lmluo    时间: 2023-3-10 15:48
如果识别很好的话,也很厉害啊
作者: wdjyltzh01    时间: 2023-3-11 14:46

开源精神万岁 支持
作者: 18072699966    时间: 2023-3-12 01:12
        感谢分享,很给力!~
作者: lmluo    时间: 2023-3-14 08:51
牛批,拿去识别游戏内容棒棒的
作者: asd5585    时间: 2023-3-15 17:56
感谢分享
作者: 杨同学    时间: 2023-3-15 18:20

感谢分享
作者: sddzrxh    时间: 2023-3-16 20:14
校队是自动还是手动修改红色文字?
作者: wnt24    时间: 2023-3-18 17:45
顶一个楼主厉害
作者: 杨同学    时间: 2023-3-18 19:28
有的图片识别只能识别一部分,识别不全 需要优化一下~
作者: 天外飞雪    时间: 2023-3-19 10:24
这个好牛逼学习了
作者: 百度搜不到你    时间: 2023-3-30 18:17
学习收藏了
作者: yxl2008    时间: 2023-4-1 06:35
支持开源~!感谢分享!
作者: 烈焰029雨魔    时间: 2023-4-3 12:48

感谢分享,很给力!~
作者: 杨同学    时间: 2023-4-6 16:43

这个好牛逼学习了
作者: hai1128    时间: 2023-4-8 15:38
不错,就是有的生僻字会识别错误
作者: 张张利利    时间: 2023-4-17 09:25
失效了 别下来
作者: cm5i2g    时间: 2023-5-17 15:23
不错。支持开源。谢谢分享
作者: 给自己留一片天空    时间: 2023-5-26 13:14
开源精神必须支持~
作者: jhaa888888    时间: 2023-5-28 15:01
正好需要,学习一下,谢谢楼主
作者: 伯牙    时间: 2023-6-6 01:24
https://wwrj.lanzouh.com/izyjl0sshoha
作者: 郭家三少    时间: 2023-6-7 09:27
支持一下下
作者: hdb1217    时间: 2023-6-10 14:26
#在这里快速回复# 多谢分享
作者: epwne    时间: 2023-7-19 02:07
        支持开源~!感谢分享
作者: zengqingda1    时间: 2023-7-24 19:06

作者: sunsail2018    时间: 2023-7-26 12:32
感谢分享
作者: wanlig34    时间: 2023-8-2 12:45
感谢分享~~~
作者: 小窗润轻风    时间: 2023-8-20 16:07
这不得加上汉语词语库
作者: lzx5460    时间: 2023-8-28 09:23
厉害了我的哥
作者: li110    时间: 2023-9-4 15:01
支持开源~!感谢分享
作者: 阿鹏求学    时间: 2023-9-9 23:27
想问下 gif怎么处理文字
作者: gxfang    时间: 2023-9-26 20:07
非常厉害
作者: 小妹哥    时间: 2023-10-2 00:41
6666666666666666666
作者: 295311002    时间: 2023-10-6 23:51
666666666666666666666666
作者: sunle818    时间: 2023-11-9 14:32
6666666!!!!!!!
作者: shuaier    时间: 2023-12-15 09:28

对比了下,感觉小模型的准确率怎么要高呢?左侧图是小模型的,右侧图是大模型的

作者: czg108    时间: 2023-12-21 00:39
顶顶顶顶顶顶顶顶顶顶
作者: lsdmao    时间: 2024-3-2 19:38
学习一下
作者: 41113701    时间: 2024-3-4 10:59
特意下载了测试,我只想说两个字,真牛
作者: lsdmao    时间: 2024-3-7 23:32
下载了,感谢分享。虽然不知道有什么用




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4