开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 433|回复: 21
打印 上一主题 下一主题
收起左侧

[易语言] 比对文本后写入

[复制链接]
结帖率:91% (116/128)
跳转到指定楼层
发表于 2025-2-27 11:13:38 | 只看该作者 |只看大图 回帖奖励 |正序浏览 |阅读模式   北京市北京市
15精币
现在txt文本里面才2000条内容  我现在每次需要写入大概200条左右 但是现在这200条写入时间需要耗费1个多小时 逻辑是每次写入的每一条都要和txt文本里的内容比对  内容不一样才写入 内容一样 就不用写入  现在用的是 写出文本 (文件号, 写入信息 + #换行符) 但我猜测应该是 比对 浪费时间   有大佬指导一下嘛

点评

要看是大文本还是小文本 小文本 哈希表应该是最快的   贵州省毕节市  发表于 2025-2-27 15:49

回答提醒:如果本帖被关闭无法回复,您有更好的答案帮助楼主解决,请发表至 源码区 可获得加分喔。
友情提醒:本版被采纳的主题可在 申请荣誉值 页面申请荣誉值,获得 1点 荣誉值,荣誉值可兑换荣誉会员、终身vip用户组。
快捷通道:申请荣誉值无答案申请取消悬赏投诉有答案未采纳为最佳

签到天数: 14 天

15
发表于 2025-2-28 08:34:58 | 只看该作者   山东省东营市
1425113841 发表于 2025-2-27 19:37
写的一般, 遍历太多. 我认为应该哈希去重. 你在我眼里属于妖魔鬼怪

这确实是一般的写法,算是排序算法里的冒泡排序,您这种所说的哈希也顶多是根据散列值分组判断hash表中存不存在,进一步的用空间去换时间,然而不管哪一种方式,都比他读旧数据写进数组里,再把新数据写进数组里,再用数组_去重去保证唯一(而精易模块里的数组_去重写法和我的一样,你哪里来的遍历太多),最后再覆写来的好。但是如果您说的哈希去重是把数据都存到数据表里边去重之后再覆写,那您也是妖魔鬼怪。不管是用空间换时间还是时间换空间都可以,按自己的需求来,但是像这种浪费空间、浪费时间、又浪费硬盘读写的,他不是妖魔鬼怪是什么?纯属基础都没学好就出来误人子弟

点评

讲的很一般   广东省汕头市  发表于 2025-2-28 12:08
回复

使用道具 举报

14
发表于 2025-2-27 20:05:23 | 只看该作者   四川省成都市
?????
回复

使用道具 举报

结帖率:93% (42/45)

签到天数: 12 天

13
发表于 2025-2-27 19:37:41 | 只看该作者   广东省汕头市
禁回忆 发表于 2025-2-27 13:04
原有4975条

一次性对比新增到6612条,算1600条吧

写的一般, 遍历太多. 我认为应该哈希去重. 你在我眼里属于妖魔鬼怪
回复

使用道具 举报

结帖率:100% (106/106)

签到天数: 12 天

12
发表于 2025-2-27 16:44:52 | 只看该作者   浙江省温州市
你每次写都排重 不如直接写入到常量叠加起来先 排重一次或者两次后覆盖进去
回复

使用道具 举报

结帖率:100% (2/2)
11
发表于 2025-2-27 15:44:58 | 只看该作者   辽宁省丹东市
  
窗口程序集名保 留  保 留备 注
文本拒重录入, , 公开   
变量名类 型数组备 注
文件号Z整数型  
哈希表Z哈希表_ASM  
是否拒绝空行Z逻辑型  

子程序名返回值类型公开备 注
_初始化 当基于本类的对象被创建后,此方法会被自动调用

子程序名返回值类型公开备 注
_销毁 当基于本类的对象被销毁前,此方法会被自动调用
哈希表Z.清空 ()
关闭文件 (文件号Z)
子程序名返回值类型公开备 注
销毁 
哈希表Z.清空 ()
关闭文件 (文件号Z)
子程序名返回值类型公开备 注
初始化参数逻辑型 
参数名类 型参考可空数组备 注
文件路径文本型
是否拒绝空行逻辑型默认假 可以写入空行
变量名类 型静态数组备 注
文本文本型 
文本组文本型0
i整数型 
文件号Z = 打开文件 (文件路径, , )
如果真 (文件号Z = 0)
返回 ()
是否拒绝空行Z = 是否拒绝空行
哈希表Z.创建 ( #文本型, #整数型, 16)  ' 容量 2的16次方除以1024  64KB
文本 = 读入文本 (文件号Z, )
文本组 = 分割文本 (文本, #换行符, )
计次循环首 (取数组成员数 (文本组), i)
哈希表Z.添加 (文本组 [i], 0)
计次循环尾 ()
返回 ()
子程序名返回值类型公开备 注
添加数据 
参数名类 型参考可空数组备 注
文本数据文本型
变量名类 型静态数组备 注
i整数型 
文本组文本型0
文本组 = 分割文本 (文本数据, #换行符, )
计次循环首 (取数组成员数 (文本组), i)
如果真 (是否拒绝空行Z = )
如果真 (文本组 [i]“”)
到循环尾 ()


如果真 (哈希表Z.cha询 (文本组 [i]))
哈希表Z.添加 (文本组 [i], i)
写出文本 (文件号Z, #换行符 + 文本组 [i])

计次循环尾 ()



补充内容 (2025-2-27 15:46):
写成了类,用的大佬的哈希表ASM模块 论坛里开源的

补充内容 (2025-2-27 16:01):
把销毁() 的方法名 改成 关闭文件 , 然后下边 只留一个 关闭文件 (文件号Z)  更合理一点

补充内容 (2025-2-27 16:03):
不用改了 还是之前那样就挺好
回复

使用道具 举报

结帖率:100% (2/2)
10
发表于 2025-2-27 14:15:47 | 只看该作者   辽宁省丹东市
还有一个方法,用哈希表给已写入数据做实时的映射,每次来新数据,就跟哈希表对比 看看是否存在,存在就跳过忽略,不存在就把新数据分别添加到文本和哈希表
回复

使用道具 举报

签到天数: 14 天

9
发表于 2025-2-27 13:04:35 | 只看该作者   山东省东营市
原有4975条

一次性对比新增到6612条,算1600条吧

耗时94ms


六楼已经给你发思路了,其他的都是什么妖魔鬼怪,占用了更高的内存,效率更低下,还给足了硬盘压力
1212.e (974.42 KB, 下载次数: 7)

点评

大家都是来回答的,就算回答的不对跟你的想法不一样,也没必要阴阳嘲讽吧?我不认识你更没惹你   江苏省南京市  发表于 2025-2-27 13:57
捧高踩低显得你很优越?你有时间写例子,你直接写就行了。要不然就给出简单的思路,给复杂的思路,你觉得楼主能明白吗?   江苏省南京市  发表于 2025-2-27 13:50
水平不够,才是来这里学习交流的目的,踩别人并不能提高自己,只会让人更看不起你而已,做事先做人。   江苏省无锡市  发表于 2025-2-27 13:33
回复

使用道具 举报

结帖率:100% (2/2)

签到天数: 11 天

8
发表于 2025-2-27 12:37:06 | 只看该作者   四川省成都市
还是建议你把数据放上来。
回复

使用道具 举报

结帖率:93% (88/95)

签到天数: 13 天

7
发表于 2025-2-27 11:55:05 | 只看该作者   浙江省温州市
程咬金 发表于 2025-2-27 11:47
这里面有去掉重复这个命令嘛  有点看不懂
  
文本 = 分割文本 (编辑框1.内容, #换行符, )
计次循环首 (取数组成员数 (文本), n)
如果真 (节点.加入属性 (文本, 0))
文本2 = 文本2 + 文本 + #换行符

计次循环尾 ()
编辑框1.内容 = “”
编辑框1.内容 = 文本2
编辑框加入2200条,去掉重复
编辑框可以用TXT代替


i支持库列表   支持库注释   
EDataStructure数据结构支持库



回复

使用道具 举报

结帖率:91% (116/128)
6
 楼主| 发表于 2025-2-27 11:47:33 | 只看该作者   北京市北京市
samll88 发表于 2025-2-27 11:37
[e=0].版本 2
.支持库 EDataStructure
.支持库 spec

这里面有去掉重复这个命令嘛  有点看不懂
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:[email protected]
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表