开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 10167|回复: 110
打印 上一主题 下一主题
收起左侧

[已解决] 文本的错别字和正常的字,怎么去找出来???按照一行

 关闭 [复制链接]
结帖率:95% (151/159)
跳转到指定楼层
楼主
发表于 2021-5-21 09:07:29 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式   广东省东莞市
700精币
5月3日
菲律宾外长洛钦在社交平台上用污言秽语发表动态声明
对中国不敬引起轩然大波
在诸多压力下
罗钦再次提起此事时
改变了态度真诚的向我国道歉
菲律宾飞蛾扑火多的时候
世界并不那么太平
俄罗斯和乌克兰甚至处于迫在眉睫的战争状态
这背后的始作俑者和推动者与美国的关系很大
拜登的肮脏计量也暴露在公众面前
这背后发生了什么
国际局势的走向是什么
一场疫情打乱了所有国家的本来状态
美国变了些
随着的下台
拜登走上了国际舞台
一开始拜登说了一些好话
塑造了一个知大体顾全大局的良好形象
赢得了一定的好感
但随着时间的推移
拜登的真面目也暴露了出来
频频对中国搞卑鄙手段
引来欧美诸多主流媒体对中国的诋毁
据报道
美国也推出了一项计划
提出每年花费3亿美元把反华报道带到全世界
只为给我国抹黑
除了打压中国
美国对俄罗斯也是无所不用其极
乌克兰和俄罗斯局势紧张时
美国插手在背后支持乌克兰
不仅驱逐俄罗斯外交官
还对俄罗斯进行舆论围攻


###############################################
以上是存在可能错别字
以下是正常的字
##################################################


5月3日,菲律宾外长罗钦在社交平台上用污言秽语发表动态声明,对中国不敬,引起轩然大波。在诸多压力下,罗钦再次提起此事时改变了态度,真诚地向我国道歉。菲律宾飞蛾扑火多的时候,世界并不那么太平,俄罗斯和乌克兰甚至处于迫在眉睫的战争状态。 这背后的始作俑者和推动者与美国的关系很大,拜登的肮脏伎俩也暴露在公众面前。 这背后发生了什么,国际局势的走向是什么。 一场疫情打乱了所有国家的本来状态,美国变了血。随着特朗普的下台,拜登走上了国际舞台。一开始拜登说了一些好话,塑造了一个知大体、顾全大局的良好形象,赢得了一定的好感。 但随着时间的推移,拜登的真面目也暴露了出来,频频对中国搞卑鄙手段,引来欧美诸多主流媒体对中国的诋毁。 据报道,美国也推出了一项计划,提出每年花费3亿美元把反华报道带到全世界,只为给我国抹黑。 除了打压中国,美国对俄罗斯也是无所不用其极。 乌克兰和俄罗斯局势紧张时,美国插手,在背后支持乌克兰,不仅驱逐俄罗斯外交官,还对俄罗斯进行舆论围攻。


我在想,用正则分割嘛,但是段数又不不太一样,要不然,就可以使用正则搞成单行对比,但是这个又不太一样,所以想问问万能的易友,有没有什么办法,根据上面一段文字,然后来匹配下面的正确的,也就是没有错别字的一段,来改正,求大佬帮我想想办法,纠结很久了



上面的是分段的,有时间戳,每一段,上面的字数又和下面的会 多 会少·······语音识别的,难受了

最佳答案

查看完整内容

https://wucuozi.com/

点评

好像被我用python找到别人的代码,解决了,就差一个怎么去给他易语言调用python   广东省东莞市  发表于 2021-5-24 23:33

评分

参与人数 1精币 +5 收起 理由
小落落 + 5 第一次看到有求助帖上本周热帖的~

查看全部评分


回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳
结帖率:100% (75/75)

签到天数: 10 天

沙发
发表于 2021-5-21 09:07:30 | 只看该作者   吉林省长春市

评分

参与人数 1荣誉 +1 收起 理由
笨潴 + 1 热心帮助他人,荣誉+1,希望继续努力(*^__^*) 嘻嘻!

查看全部评分

回复

使用道具 举报

结帖率:95% (151/159)
板凳
 楼主| 发表于 2021-5-21 09:08:07 | 只看该作者   广东省东莞市
全部的币都在这里了
回复

使用道具 举报

结帖率:83% (5/6)
地板
发表于 2021-5-21 09:11:10 | 只看该作者   四川省绵阳市
可不可以用寻找文本的方式?在下面正确的这段里面寻找上面的每一段,找不到的时候就是存在错别字?
回复

使用道具 举报

地下
发表于 2021-5-21 09:35:11 | 只看该作者   河北省石家庄市
又来了,本身就没有规律的两段文本,你怎么可能判断,即使这次我按照这个的文本情况写出来,下次你识别别的文本又会出现新的不适用这个的情况,完全不可能一概而论。还是按照3楼说法,寻找文本大体判断把。
回复

使用道具 举报

结帖率:98% (135/138)

签到天数: 8 天

6
发表于 2021-5-21 09:37:54 | 只看该作者   重庆市重庆市
关注思路,确实问题比较大,如果只是错字还好,但是有可能2个字错成3个字,理论上就可能100字的原文错成200字,不好判断。
回复

使用道具 举报

结帖率:95% (151/159)
7
 楼主| 发表于 2021-5-21 09:38:18 | 只看该作者   广东省东莞市
xdkjcm 发表于 2021-5-21 09:11
可不可以用寻找文本的方式?在下面正确的这段里面寻找上面的每一段,找不到的时候就是存在错别字? ...

可以的,但是错别字的处理,主要是这个问题
回复

使用道具 举报

8
发表于 2021-5-21 09:41:38 | 只看该作者   河北省石家庄市
再着退一步说。你明明都有了正确的文本了.反而去判断错误的文本,而且还要修改他,修改完不就是正确的文本吗?为什么不直接使用正确的文本.
回复

使用道具 举报

结帖率:95% (151/159)
9
 楼主| 发表于 2021-5-21 09:42:56 | 只看该作者   广东省东莞市
53770zhang 发表于 2021-5-21 09:37
关注思路,确实问题比较大,如果只是错字还好,但是有可能2个字错成3个字,理论上就可能100字的原文错成200 ...

正常来说,语音识别的错别字,他也是分段其实会差不多的,最多就是两段合成了一段,段数一定会少,我目前的思路就是先搞个分段,然后去对比一下,相同的先放一下,找出来不同的分段,然后再去通过单个文本对比,搞出来一个类似于对比度大于多少的,这样的话如果是两段文字合成一个,那也差不多了,主要是这个难实现
回复

使用道具 举报

结帖率:75% (3/4)

签到天数: 1 天

10
发表于 2021-5-21 09:45:27 | 只看该作者   福建省厦门市
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:[email protected]
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表