精易论坛

标题: 本地文字识别 PaddleOCR2.9.1 CPU和GPU自适应。 [打印本页]

作者: jhtzz    时间: 2025-1-1 00:09
标题: 本地文字识别 PaddleOCR2.9.1 CPU和GPU自适应。
本帖最后由 jhtzz 于 2025-1-1 02:18 编辑

项目来源:        
    百度飞桨 https://github.com/PaddlePaddle/PaddleOCR  目前最新的是2.9.1   
    集成的HTTP通信库 https://github.com/machinezone/IXWebSocket
    集成opencv https://github.com/opencv/opencv   目前最新的是4.10.0,且支持自适应CPU和GPU模式,用于协助飞桨提速用。

本次编译成品,用的是N卡的CUDA(11.8)库编译而来。所以运行时自动检测电脑是否有N卡1060以上。有就自动启
用GPU没有则用CPU。
因为编译出来的百度飞桨必须是64位程序,所以没有出DLL接口,广大网友都是易语言的。所以出HTTP接口直接调
用来的快一些。

由于编译出来的包有1G左右,没有放精易论坛了,固存于百度网盘。
包里面带了两个国家的例子库如韩语,日语等。如果你要换另外的国家语言。可看inference\readme.txt这个说明文件。

这个IXWebSocket通信库,支持多线程调用,但是,据我测试下来,多线程没有意义,压力全在GPU或CPU上面。如果
你是拿来写群控业务,建议优化好自己的代码,多用opencv或其他插件找图定位,除非是要识别出文字做业务等。有些
时候不是OCR不够好,而是你滥用没有?

本人使用Postman进行测试,支持HTTP的POST模式:
1、二进制模式:http://127.0.0.1:18081/ocr0  POST body就是你的图片二进制内容,建议用次模式,减少编解码。
2、base64模式:http://127.0.0.1:18081/ocr1  POST body就是你的图片二进制内容编码过的内容。
    其中,你编码过的base64,可带头和不带头
返回是JSON格式,且是utf8编码。



------------------------------------------------------------------------


------------------------------------------------------------------------




------------------------------------------------------------------------


------------------------------------------------------------------------



通过网盘分享的文件:paddleOCR_CPU_GPU.rar
链接: https://pan.baidu.com/s/1i-RSLMmwVBgpmXTGtnePyg?pwd=554k 提取码: 554k
全程我都是只管编译,我自己写的代码就几句,集成HTTP服务端而已:






作者: 枫叶成霜    时间: 2025-1-1 10:30
1秒请求10次,cpu会不会暴涨
作者: 小cai鸟学    时间: 2025-1-1 11:19
感觉好厉害的样子虽然看不懂
作者: wh1234567    时间: 2025-1-1 11:25
谢谢分享
作者: jhtzz    时间: 2025-1-1 12:06
看你电脑配置了
作者: 天雨时晴    时间: 2025-1-1 12:50
看一下好不好用
作者: pipicool    时间: 2025-1-1 13:43
学习一下
作者: 何浩文    时间: 2025-1-1 17:14
支持开源~!感谢分享
作者: 卡卡1111    时间: 2025-1-1 17:15
支持开源~!感谢分享
作者: ttggnn    时间: 2025-1-1 20:07
感谢分享
作者: kang10086    时间: 2025-1-1 20:33
感谢开源,感谢分享
作者: jdlz2001    时间: 2025-1-1 20:39
感谢开源,感谢分享
作者: year1970    时间: 2025-1-2 07:58
感谢分享
作者: abpyu    时间: 2025-1-2 08:33
压缩包近1gb
作者: huazhen88    时间: 2025-1-2 11:41
来个E的例子呢
作者: 宁静清澈    时间: 2025-1-2 12:14
感谢开源,感谢分享
作者: please    时间: 2025-1-3 09:38
感谢分享,支持开源!!!
作者: please    时间: 2025-1-4 09:39
感谢分享,支持开源!!!
作者: 1184798949    时间: 2025-1-4 09:57
感谢分享
作者: 1184798949    时间: 2025-1-4 09:59
感谢分享
作者: 灵猫作者    时间: 2025-1-4 22:25
支持开源~!感谢分享
作者: hhh888777    时间: 2025-1-7 22:15

作者: 不飞    时间: 2025-1-11 12:37
有技术的大佬
作者: jhtzz    时间: 2025-1-11 22:17
通过网盘分享的文件:paddleOCR_CPU_GPU.rar
链接: https://pan.baidu.com/s/1zqvKidTvz7VQckM8yUG9Pg?pwd=ymf7 提取码: ymf7

经网友反映,HTTP并发报错,已经修复。



作者: DMS千    时间: 2025-1-13 14:54
66666666666666666666666666
作者: a1837794891    时间: 2025-1-13 16:09

感谢开源,感谢分享
作者: ctytty    时间: 2025-2-3 19:37
本帖最后由 ctytty 于 2025-2-3 19:38 编辑

为什么我的1060显卡不显示1
作者: jhtzz    时间: 2025-2-5 23:06
本帖最后由 jhtzz 于 2025-2-5 23:17 编辑
ctytty 发表于 2025-2-3 19:37
为什么我的1060显卡不显示1

发运行图,发软件启动图。或加QQ:1252790557,我看看就知道了,
作者: ctytty    时间: 2025-2-6 19:37
jhtzz 发表于 2025-2-5 23:06
发运行图,发软件启动图。或加QQ:1252790557,我看看就知道了,

111111111111111111111111111

111.png (36.11 KB, 下载次数: 1)

111.png

作者: jhtzz    时间: 2025-2-8 23:32
ctytty 发表于 2025-2-6 19:37
111111111111111111111111111

OK ,已经清楚了。
我的CUDA是11.8的,你的驱动是11.1的,所以N卡不能运行,最后以CPU运行了。如果你的显卡是1060以上,建议安装最新驱动。
作者: yy10328    时间: 2025-2-19 13:58
谢谢大佬分享
作者: gftluo    时间: 2025-2-23 01:25
牛B大神。这个真的很好用
作者: gftluo    时间: 2025-2-25 00:26
huazhen88 发表于 2025-1-2 11:41
来个E的例子呢

有例子吗?

http://127.0.0.1:18081/ocr1  post 提交会
提交数据 = 到文本 (编码_BASE64编码A (图片数据))

http://127.0.0.1:18081/ocr0  post 提交不会写
提交数据 = 这里不会写了,说明好像是用图片二进制,这里不知道提交二进制文本还是字节集。

网页_访问() 提交的数据都是文本型,好像没有二进制的,这个没有例子参考。
他们建议这地址提交 http://127.0.0.1:18081/ocr0 不会写,请哪个大哥写哥例子


作者: gftluo    时间: 2025-2-25 00:27
有例子吗?



http://127.0.0.1:18081/ocr1  post 提交会

提交数据 = 到文本 (编码_BASE64编码A (图片数据))



http://127.0.0.1:18081/ocr0  post 提交不会写

提交数据 = 这里不会写了,说明好像是用图片二进制,这里不知道提交二进制文本还是字节集。



网页_访问() 提交的数据都是文本型,好像没有二进制的,这个没有例子参考。

他们建议这地址提交 http://127.0.0.1:18081/ocr0 不会写,请哪个大哥写哥例子,非常感谢。
作者: 女装厂家直销    时间: 2025-2-25 10:48
为什么我下载过来977MB  实际里面没有什么东西
作者: huazhen88    时间: 2025-2-26 00:57
gftluo 发表于 2025-2-25 00:26
有例子吗?

http://127.0.0.1:18081/ocr1  post 提交会

网页_访问S (“http://127.0.0.1:18081/ocr0”, 1, , , , , , , , , , , , , , , , , , #图片, )   按这改下图片  结果再解码下就可以了
作者: 剑指々江南    时间: 2025-3-1 16:44
大哥牛逼靠谱
作者: 学习2    时间: 2025-3-6 00:32
牛逼,亲测好用!!
作者: 邻居大表哥    时间: 2025-3-6 14:29
图片差不多是返回第一次识别的结果
作者: jhtzz    时间: 2025-3-6 23:27
邻居大表哥 发表于 2025-3-6 14:29
图片差不多是返回第一次识别的结果

加Q处理,1252790557
作者: exzg    时间: 2025-3-9 00:24
CPU模式没几分钟就闪退,就算不调用 都闪退
作者: jhtzz    时间: 2025-3-9 01:36
exzg 发表于 2025-3-9 00:24
CPU模式没几分钟就闪退,就算不调用 都闪退

加QQ:125279055,我调试看看
作者: 654799976    时间: 2025-3-9 11:39
请问一下,为啥一直都市cpu模式运行的,我测试了一次图片文字内容多的时候cpu在识别那一小会是100%,多测几次百du飞浆就闪退!!!

123.png (60.56 KB, 下载次数: 0)

123.png

作者: 654799976    时间: 2025-3-9 11:52
654799976 发表于 2025-3-9 11:39
请问一下,为啥一直都市cpu模式运行的,我测试了一次图片文字内容多的时候cpu在识别那一小会是100%,多测几 ...

还有这种问题是不是cpu模式下算力不足造成的?

456.png (44.67 KB, 下载次数: 2)

456.png

作者: lxn2wyf    时间: 2025-3-9 13:16
厉害啊,PaddleOCR更新到2.9.1了,还支持CPU和GPU自适应,百du飞桨这波给力啊。有空试试看效果咋样。
作者: jhtzz    时间: 2025-3-9 21:46
654799976 发表于 2025-3-9 11:39
请问一下,为啥一直都市cpu模式运行的,我测试了一次图片文字内容多的时候cpu在识别那一小会是100%,多测几 ...

只支持N卡1060以上,其它显卡不支持。
闪退问题,可以加QQ:125279055,我调试看看,也可以尝试改配置表,use_mkldnn 0试试
作者: 鲨鱼    时间: 2025-3-15 23:09
大佬请问一下,我运行了一次paddleOCR.exe之后,我要如何关掉这个?我把这个任务结束了,它好像还是可以访问?HTTP服务端我要如何关闭?还有请问一下这个端口号可以修改吗?

作者: jhtzz    时间: 2025-3-16 13:06
鲨鱼 发表于 2025-3-15 23:09
大佬请问一下,我运行了一次paddleOCR.exe之后,我要如何关掉这个?我把这个任务结束了,它好像还是可以访 ...

任务管理器,直接K掉这个进程就可以了,目前不支持改端口的。等我有空了搞一个可以改端口的。
你也可以联系我,临时给你改,QQ 1252790557
作者: jhtzz    时间: 2025-3-16 13:14
654799976 发表于 2025-3-9 11:39
请问一下,为啥一直都市cpu模式运行的,我测试了一次图片文字内容多的时候cpu在识别那一小会是100%,多测几 ...

我编译的是支持N卡,其它显卡不支持。所以变为CPU模式了,CPU模式,百du飞桨开启了那个use_mkldnn 1,这个技术CPU很快,但不稳定,所以发现CPU模式挂的问题,可以设置为0,即use_mkldnn 0。
软件当前目录的config.txt
作者: tonc    时间: 2025-3-16 13:40
哇,PaddleOCR更新到2.9.1啦,还支持CPU和GPU自适应,百du飞桨这波给力啊。试试看效果咋样呢。
作者: jhtzz    时间: 2025-3-16 15:42
tonc 发表于 2025-3-16 13:40
哇,PaddleOCR更新到2.9.1啦,还支持CPU和GPU自适应,百du飞桨这波给力啊。试试看效果咋样呢。 ...

好的,有任何问题和需求,及时反馈。
作者: 鲨鱼    时间: 2025-3-16 21:48
jhtzz 发表于 2025-3-16 13:06
任务管理器,直接K掉这个进程就可以了,目前不支持改端口的。等我有空了搞一个可以改端口的。
你也可以联 ...

端口不捉急,安装大佬您的进度来就行,

不过我发现一个问题,
偶尔我提交一个请求的时候,

他实际上应该是已经识别完成了,但是他一直卡住了,

需要我在类似cmd的那个窗口上面敲一个回车键才能继续,

我看到最后的一行显示了——127.0.0.1,OCR done,700,0,msgid,0,ThreadId,15332,time=0.37368,

应该只花费了1S不到,但是易语言那边确实一直卡住了,敲一下就可以了,

这个有点奇怪呀,不知道大佬您有没有遇到过,跟图片没有关系,我测试了多个图片
作者: jhtzz    时间: 2025-3-16 22:24
鲨鱼 发表于 2025-3-16 21:48
端口不捉急,安装大佬您的进度来就行,

不过我发现一个问题,

没有遇到过,你有现场搞我们一起看看,1252790557
作者: 鲨鱼    时间: 2025-3-24 21:54
jhtzz 发表于 2025-3-16 22:24
没有遇到过,你有现场搞我们一起看看,1252790557

大佬,请问一下,我在易语言中如何调用,才能像在文件夹下面运行”批量识别.bat“这个文件的结果,因为运行这个文件之后,在output文件夹下面会有结果图片,结果图片是会把文字都框选出来的,

还有请问一下,如果识别的时候他字不对,我有什么办法修正他嘛?以后他在识别到这样子的就是正确的文字?
作者: yang9644    时间: 2025-3-25 20:26
4-5天这样子就挂了,没数据返回了

作者: jhtzz    时间: 2025-3-26 01:47
yang9644 发表于 2025-3-25 20:26
4-5天这样子就挂了,没数据返回了

运行4,5天就挂?那还好,你刚好可以重启了,不过如果有现场的话呢,也可以加我,我调试一下。1252790557
作者: yang9644    时间: 2025-3-27 09:35
jhtzz 发表于 2025-3-26 01:47
运行4,5天就挂?那还好,你刚好可以重启了,不过如果有现场的话呢,也可以加我,我调试一下。1252790557 ...

加你了,通过一下
作者: y1030155959    时间: 2025-3-27 17:35
感谢开源,感谢分享
作者: ww5681561    时间: 2025-3-27 17:41
1111111111111111111
作者: jhtzz    时间: 2025-3-29 22:52
鲨鱼 发表于 2025-3-24 21:54
大佬,请问一下,我在易语言中如何调用,才能像在文件夹下面运行”批量识别.bat“这个文件的结果,因为运 ...

加QQ群:117653517
作者: jzc123    时间: 2025-3-30 12:16
2222222222222222222222222
作者: jhtzz    时间: 2025-3-30 13:44
由于用户越来越多,为了方便沟通遇到的问题,特建立一个交流群:
1,可以随时拿到最新安装包。
2,沟通及时
3,本人大多数时候都在。
117653517
作者: pianone    时间: 2025-4-9 15:13
谢谢
作者: jhtzz    时间: 2025-4-11 23:11
pianone 发表于 2025-4-9 15:13
谢谢

不客气,不客气,不客气
作者: aosheng    时间: 2025-4-12 20:04
666666666666666666666666666666
作者: sn123456    时间: 2025-4-18 20:30
牛人,真厉害
作者: flct0099    时间: 2025-4-19 02:00
顶一下顶一下顶一下顶一下顶一下顶一下
作者: 今天中午吃什么    时间: 2025-4-28 16:15
感谢分享,很给力!~
作者: 杨明煜    时间: 2025-4-28 18:08
谢谢分享.........
作者: jzc123    时间: 2025-5-2 20:08
6666666666666666666




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4