xdkjcm 发表于 2021-5-21 09:11
可不可以用寻找文本的方式?在下面正确的这段里面寻找上面的每一段,找不到的时候就是存在错别字? ...
53770zhang 发表于 2021-5-21 09:37
关注思路,确实问题比较大,如果只是错字还好,但是有可能2个字错成3个字,理论上就可能100字的原文错成200 ...
dy6255 发表于 2021-5-21 09:41
再着退一步说。你明明都有了正确的文本了.反而去判断错误的文本,而且还要修改他,修改完不就是正确的文本 ...
dy6255 发表于 2021-5-21 09:35
又来了,本身就没有规律的两段文本,你怎么可能判断,即使这次我按照这个的文本情况写出来,下次你识别别的 ...
疯二毛 发表于 2021-5-21 09:56
提两个思路
1 类似WPS那种智能识别,猜测应该是先中文分词,再和错别字库或词典做对比,不过实现起来比较麻 ...
疯二毛 发表于 2021-5-21 10:01
还是要看你应用场景,可能语音识别并不是一个好的解决方案,OCR会精准的多 ...
不要再艾特我了 发表于 2021-5-21 10:03
OCR识别什么东西
疯二毛 发表于 2021-5-21 10:04
语音能识别的东西,OCR自然能识别啊,不然你那段正确的文字从哪里来的,总之就是要看你应用场景 ...
小生小白 发表于 2021-5-21 10:44
用到精易模块 参考一下
不要再艾特我了 发表于 2021-5-21 11:14
大佬 有点流弊啊,好像瞬间就解决了,但是不是易语言解决的········· ...
初夏喔 发表于 2021-5-21 11:15
才30多行代码,去学一下C#就能看懂了。
NPinyin.Pinyin.GetInitials这个是获取文本拼音 ...
41.64 KB, 下载次数: 0
DLL命令名 | 返回值类型 | 公开 | 备 注 | |
Replace | 文本型 | |||
DLL库文件名: | ||||
Test.dll | ||||
在DLL库中对应命令名: | ||||
Replace | ||||
参数名 | 类 型 | 传址 | 数组 | 备 注 |
a | 文本型 | |||
b | 文本型 |
lk1122 发表于 2021-5-21 10:00
上面一段去掉换行,下面一段去掉所有标点符号,这样就形成两段,然后逐字分割对比就行了。 ...
初夏喔 发表于 2021-5-21 12:03
用这个吧。上一个有内存泄漏的风险。
要求至少.net4.0才能使用
初夏喔 发表于 2021-5-21 12:03
用这个吧。上一个有内存泄漏的风险。
要求至少.net4.0才能使用
初夏喔 发表于 2021-5-21 12:03
用这个吧。上一个有内存泄漏的风险。
要求至少.net4.0才能使用
初夏喔 发表于 2021-5-21 12:03
用这个吧。上一个有内存泄漏的风险。
要求至少.net4.0才能使用
相伴 发表于 2021-5-21 13:52
正常来说,语音识别的错别字,他也是分段其实会差不多的,最多就是两段合成了一段,段数一定会少,我目前的 ...
不要再艾特我了 发表于 2021-5-21 14:18
大佬 这个方法只是针对上面的文案可以,但是换一篇文案 又不行了··········有没有什 ...
初夏喔 发表于 2021-5-21 14:22
这又不是AI
初夏喔 发表于 2021-5-21 14:22
这又不是AI
不要再艾特我了 发表于 2021-5-21 15:40
有么有什么好的办法呢???比如某度······ai?
初夏喔 发表于 2021-5-21 16:04
有钱直接在论坛找人定制,没钱又没技术就别想了,问答区是用来解答问题的,而不是用来定制内容的 ...
不要再艾特我了 发表于 2021-5-21 10:15
我是先拿文本转的音频,然后想生成对应的字幕,然后调用语音识别音频 拿到的错别字文本········ ...
疯二毛 发表于 2021-5-21 16:46
想生成对应的字幕,应该是剪映的文本朗读那种,可以同时添加字幕,不清楚剪映的原理,不过一般也就是两种 ...
不要再艾特我了 发表于 2021-5-21 16:55
第二种方法我试过了 ,单句生成音频,最后再合成总的音频,但是合成出来的效果,不是上下句太快,就是太 ...
疯二毛 发表于 2021-5-21 18:44
应该是语音合成模型的问题,有精力可以找找或者自己训练一个合成模型,用现在的方案的话,找个字错率低的 ...
Patek 发表于 2021-5-21 18:43
懒得弄了。交叉对比一下,结果就出来了。有空自己再调优一下。
大致思路是可以的,不过结果只能接近完全 ...
Patek 发表于 2021-5-21 21:17
suc = 正确的, err = 错误的 , 交叉寻找。后面多加些条件判断。
小清晰99 发表于 2021-5-22 12:38
我想知道第一部分和第二部分有什么区别
创世之神 发表于 2021-5-22 18:11
用python做个AI 试试分词吧,把分不出来的词按照拼音对比词库
补充内容 (2021-5-22 18:12):
不要再艾特我了 发表于 2021-5-22 18:19
啊啊啊啊啊,想想办法啊,手动没有灵魂的
创世之神 发表于 2021-5-22 18:26
办法就是手动,不然那帮大厂为啥专注语音识别的精度而不是文本处理的精度 可以去Github看看文本 ...
不要再艾特我了 发表于 2021-5-22 18:54
是啊是啊是啊是啊
不要再艾特我了 发表于 2021-5-22 22:18
想想办法,我就不信,那么多人,想不出来好的办法,而且这个东西,是大家所需要的,又不是为了我一个人, ...
创世之神 发表于 2021-5-22 22:26
吼吼,我觉得直接用某都的接口就挺好的
不要再艾特我了 发表于 2021-5-22 22:38
错别字啊,得想办法改正啊
创世之神 发表于 2021-5-22 22:40
文本纠错,github一堆现成的纠错算法
补充内容 (2021-5-22 22:41):
创世之神 发表于 2021-5-22 22:40
文本纠错,github一堆现成的纠错算法
补充内容 (2021-5-22 22:41):
小清晰99 发表于 2021-5-23 10:23
感觉搞在字幕
宇轩One 发表于 2021-5-23 10:22
语音识别之后
用易语言把文字合成语音
再去识别
rectdbszy 发表于 2021-5-23 11:32
哎呀,你好老火,看不下去了,给你个简单实用的方法,原文本文本_逐字分割到一个数组,错文本也同样文本_逐 ...
不要再艾特我了 发表于 2021-5-23 11:34
段落变了 不行的·······
rectdbszy 发表于 2021-5-23 12:06
变了,哪变了,你原文本,把标点统一了再分割,不逐字分割就以行分割,用每一行为一个数组成员。 ...
我的yyy123 发表于 2021-5-23 16:07
那个不叫错字,叫别字,想自动修改估计得人工智能了。
z899505cqz 发表于 2021-5-23 18:02
要是有钱我给你弄
875.29 KB, 下载次数: 2
源码
小胖专用 发表于 2021-5-24 19:29
直接利用文本对比,然后利用替换错别字来保存正确文本不行么
疯二毛 发表于 2021-5-24 08:43
牛批666,热门了,还没解决,实在不行还是用之前的方案吧,先分段后再合成语音,多搞一下语速调节说不定就 ...
承易 发表于 2021-5-24 21:04
就是这意思吧
承易 发表于 2021-5-24 21:58
那就不知了 那网址专用识别 你去看看
cosset 发表于 2021-5-25 09:57
直接调用纠错接口呢,阿里 百d 都有吧,或者找找别的。搞个免费的api
欢迎光临 精易论坛 (https://125.confly.eu.org/) | Powered by Discuz! X3.4 |