开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 2606|回复: 83
打印 上一主题 下一主题
收起左侧

[易语言纯源码] 数组去重复,再比原来快一倍,数组排序用了归并算法

[复制链接]
结帖率:75% (3/4)
跳转到指定楼层
发表于 2025-6-22 22:31:42 | 只看该作者 |只看大图 回帖奖励 |正序浏览 |阅读模式   福建省福州市
分享源码
界面截图:
是否带模块: -
备注说明: -
本帖最后由 APPLEUFO 于 2025-6-23 09:50 编辑

https://125.confly.eu.org/forum.php?mod=viewthread&tid=14712534&extra=  
前面那帖子,排序后去重复

原来是文本的快速排序后,再循环对比

现在弄出文本的归并排序后,再循环对比了

文本的归并排序比 快速排序,快了3-5倍吧,速度也就又提起来了

  
子程序名返回值类型公开备 注
数组模块_去重复7_排序后对比 排序过的   (1122334)(1234),也是非常快的,不输给去重复6。
参数名类 型参考可空数组备 注
参数_文本文本型
参数_重复数组文本型
变量名类 型静态数组备 注
局变_原始文本开始的下标整数型跳转到下回开始对比的下标
n1整数型循环用
m1整数型重复数组的下标
如果真 (取数组成员数 (参数_文本) < 2)    参数_重复数组 = 参数_文本
返回 ()

' 数组模块_快速排序_文本 (参数_文本, )
排序模块_归并排序_迭代版_文本 (参数_文本, )
重定义数组 (参数_重复数组, 假, 取数组成员数 (参数_文本))
局变_原始文本开始的下标 = 1
循环判断首 ()
变量循环首 (局变_原始文本开始的下标, 取数组成员数 (参数_文本) - 1, 1, n1)  ' 假定他现在前面几个都是重复的,开局就用变量循环
如果 (参数_文本 [n1] = 参数_文本 [n1 + 1])
' 调试输出 (参数_文本 [n1], 参数_文本 [n1 + 1], “===”)
' 相等  无动作


' 调试输出 (参数_文本 [n1], 参数_文本 [n1 + 1], “=!==!”)
m1 = m1 + 1
参数_重复数组 [m1] = 参数_文本 [n1]  ' 不相等的上一个加入去重复
局变_原始文本开始的下标 = n1 + 1  ' 不相等的下一个 跳转进去。把变量循环的开始值设置成它
' 调试输出 (m1, 局变_原始文本开始的下标, 参数_文本 [n1], “-------------------”)
跳出循环 ()

变量循环尾 ()
' 调试输出 (n1, “=============================”)
如果真 (n1 = 取数组成员数 (参数_文本))  ' 下标等于最后一个,它没办法和下一个比较了。就添加到去重复数组了
' 调试输出 (n1, 局变_原始文本开始的下标, , , 666)
m1 = m1 + 1
参数_重复数组 [m1] = 参数_文本 [局变_原始文本开始的下标]  ' 局变_原始文本开始的下标  最后两种情况,相邻的两个相等或者不相等
跳出循环 ()

循环判断尾 ()
重定义数组 (参数_重复数组, 真, m1)
' 不明白的是明明比6更紧凑,用的变量也少。还是不能大幅跑赢6///2025.6.19





至于整数型的去重复,直接用桶排序,测试速度比精益现在内置的的更快了


  
子程序名返回值类型公开备 注
数组模块_去重复桶排序_整数型 因为是桶排序,所以极限是1-整数型最大(长整数型也行)
参数名类 型参考可空数组备 注
参数_原始数组整数型
参数_结果数组整数型
变量名类 型静态数组备 注
局变_最大数整数型 
局变_桶子整数型0根据 局变_最大数  定义需要 多少个桶子、、  
n1整数型 
m1整数型 
计次循环首 (取数组成员数 (参数_原始数组), n1)  ' 找数组里面最大的数
如果真 (局变_最大数 < 参数_原始数组 [n1])
局变_最大数 = 参数_原始数组 [n1]

计次循环尾 ()
' 调试输出 (局变_最大数, “局变_最大数”)
重定义数组 (局变_桶子, 假, 局变_最大数)  ' 从 1 --- 最大值
计次循环首 (取数组成员数 (参数_原始数组), n1)
' 局变_临时 = 参数_原始数组 [n1]
局变_桶子 [参数_原始数组 [n1]] = 1
计次循环尾 ()
重定义数组 (参数_结果数组, 假, 取数组成员数 (参数_原始数组))
计次循环首 (取数组成员数 (局变_桶子), n1)
如果 (局变_桶子 [n1] = 0)



m1 = m1 + 1
参数_结果数组 [m1] = n1

计次循环尾 ()
重定义数组 (参数_结果数组, 真, m1)
子程序名返回值类型公开备 注
数组模块_验证是否有重复_整数逻辑型 有返回假 否则真   没有重复返回真
参数名类 型参考可空数组备 注
参数_整数数组整数型
变量名类 型静态数组备 注
n1整数型 
m1整数型 
数组排序 (参数_整数数组, )
计次循环首 (取数组成员数 (参数_整数数组) - 1, n1)
' 调试输出 (参数_整数数组 [n1], 参数_整数数组 [n1 + 1], 666)
如果 (参数_整数数组 [n1] = 参数_整数数组 [n1 + 1])
返回 ()


' 继续无动作

计次循环尾 ()
返回 ()

10.8.e

306.99 KB, 下载次数: 59, 下载积分: 精币 -2 枚

点评

文本型那个去重?排序后去重复更快的。例其中随意一文本,排序后只要和相邻的比较就好了。未排序的话,随意一个文本,你得和所有数组成员比较   福建省福州市  发表于 5 天前
有没有可能,去掉排序后更快。或者说你去重后再排序更快   山东省滨州市  发表于 2025-6-25 07:49

评分

参与人数 25好评 +2 精币 +28 收起 理由
风雨3137 + 1 感谢分享,很给力!~
sundanming + 1 感谢分享,很给力!~
jc520hll + 1 感谢分享,很给力!~
z134 + 1 感谢分享,很给力!~
ma4747 + 1 感谢分享,很给力!~
cbl521ysys + 1 感谢分享,很给力!~
无尘666 + 1 感谢分享,很给力!~
3266167 + 1 感谢分享,很给力!~
huangdi9569 + 1 感谢分享,很给力!~
pj小黑屋 + 1 感谢分享,很给力!~
liy456 + 1 感谢分享,很给力!~
文西哥 + 1 感谢分享,很给力!~
望尘莫及 + 1 感谢分享,很给力!~
暮光之城 + 1 感谢分享,很给力!~
初阳123 + 1 感谢分享,很给力!~
浮梦 + 1 感谢分享,很给力!~
475837991 + 1 感谢分享,很给力!~
Zźh926 + 1 感谢分享,很给力!~
huangdi956 + 1 感谢分享,很给力!~
洛哥 + 1 感谢分享,很给力!~
YunXiGe + 1 感谢分享,很给力!~
cunanhai + 1 + 2 支持开源~!感谢分享
kyo9766 + 1 感谢分享,很给力!~
李泽勇2 + 1 + 3 感谢分享,很给力!~
malin158 + 1 感谢分享,很给力!~

查看全部评分


结帖率:0% (0/4)

签到天数: 2 天

74
发表于 昨天 21:40 | 只看该作者   江苏省无锡市
非常不错!!!
回复 支持 反对

使用道具 举报

签到天数: 1 天

73
发表于 5 天前 | 只看该作者   广东省潮州市
感谢分享,很给力!~
回复 支持 反对

使用道具 举报

结帖率:75% (3/4)

签到天数: 3 天

72
 楼主| 发表于 6 天前 | 只看该作者   福建省福州市
黑咖啡 发表于 2025-6-27 10:48
那个校验类似生成哈希值,但是只会输出0-65535,易语言下标从1开始,所以0替换成65536。
如果校验的值一 ...

哦 原来如此   。我觉得你那个65535的类数组  和校验函数 也可以考虑一下  封装进去重复类里面。更简洁完美一些。在类外面就不用暴露设定太多
回复 支持 反对

使用道具 举报

结帖率:100% (18/18)

签到天数: 3 天

71
发表于 6 天前 | 只看该作者   广东省深圳市
APPLEUFO 发表于 2025-6-27 10:01
.版本 2

' * “7 秒 484 毫秒 ”

那个校验类似生成哈希值,但是只会输出0-65535,易语言下标从1开始,所以0替换成65536。
如果校验的值一样,那他们就在同一个类里进行比较,用的循环比较,当然也可以用其他更快的方法。
你也可以另外研究其他校验换算方法,只要能把文本型尽量的换算成相对均匀的整数分配到桶里也行的。比如除法缩放法,越简洁效率越高。
相当于提前预制足够多的桶,这样就能更少的比较,类似二分法吧,先粗略的分类一次,第二次数据量少了在精准比较。
当然了能根据成员数量,成员长度等,动态分配桶数量那就更高效了,前提是生成的哈希值要足够均匀把桶利用起来,不然大量都分在一个桶里也是慢的。

点评

还可以再封装一个类,包含这个子类算法和预置桶   广东省深圳市  发表于 6 天前
回复 支持 1 反对 0

使用道具 举报

结帖率:100% (3/3)

签到天数: 1 天

70
发表于 6 天前 | 只看该作者   广东省深圳市
学习一下
回复 支持 反对

使用道具 举报

结帖率:75% (3/4)

签到天数: 3 天

69
 楼主| 发表于 6 天前 | 只看该作者   福建省福州市
本帖最后由 APPLEUFO 于 2025-6-27 10:36 编辑

.版本 2

' * “7 秒 484 毫秒 ”
' * “子程序1===============” | 500000
' * “36 秒 234 毫秒 ”
' * “去重复7===============” | 500000





36秒太长,我有点怀疑   两次测试的顺序颠倒一下就这样了
你的测试不标准,数据污染或者数组未清空。导致后面第二组的测试时间很长

第二轮测试还是得拷贝个一模一样的新变量来测试  

拷贝1个BBB的数组就好  ,全新变量,未被排序污染的原始数组数据



你写的算法  速度还是很快的,能比07方法快了一倍!
是啥原理说说看  去重的类  ,  是类似哈希值的算法么


上面测试是数组里大量不重复类型的。
下面图测试的是数组里 大量重复类型的。的确是很快啊。比我那个快了10倍   。服了




  
调试输出 (“======================================================”)
调试模块_创建整数型数组_有重复 (zzz, 100000 × 10, 1, 1000)  ' 1000000
转换模块_整数型数组转文本型数组 (zzz, aaa)
bbb = aaa
' ccc = aaa
调试输出 (“开始 ---------- ”)
计时器启动 ()
数组模块_去重复7_排序后对比 (aaa, aaa_结果)
计时器结束 ()
调试输出 (“===============”, 取数组成员数 (aaa_结果))
计时器启动 ()
子程序1 (bbb, bbb_结果)
计时器结束 ()
调试输出 (“===============”, 取数组成员数 (bbb_结果))
' 调试输出 (数组模块_判断文本数组是否完全相等 (aaa, bbb))
' 调试输出 (数组模块_判断文本数组是否完全相等 (aaa, bbb))
' 调试输出 (数组模块_判断文本数组是否完全相等 (aaa, ccc))
调试输出 (“======================================================”)
鸣叫 ()
鸣叫 ()
结束 ()


i支持库列表   支持库注释   
spec特殊功能支持库


另外的问题就是  为啥是65536?
备注里写 待完善,缺少清空。创建和销毁很慢因为数组65536太大

你是一下创建65536个类,如果要计算的数据太大,甚至65536个数组都不够用,计算出的校验值里出现冲突。  ,那么就会出现重复了吧?

下面这个是 ?
  
子程序名返回值类型公开备 注
CRC16_MODBUS校验整数型 
参数名类 型参考可空数组备 注
输入值文本型
变量名类 型静态数组备 注
局_输入字节集字节集 
CRC寄存器整数型 
m整数型 
局_输入字节集 = 到字节集 (输入值)
CRC寄存器 = 65535
计次循环首 (取字节集长度 (局_输入字节集), m)
CRC寄存器 = 位异或 (CRC寄存器, 局_输入字节集 [m])
计次循环首 (8, )
判断 (位与 (CRC寄存器, 1) = 0)
CRC寄存器 = 右移 (CRC寄存器, 1)
CRC寄存器 = 右移 (CRC寄存器, 1)
CRC寄存器 = 位异或 (CRC寄存器, 十六进制 (“A001”))

计次循环尾 ()
计次循环尾 ()
判断 (0 < CRC寄存器 CRC寄存器 < 65536)
返回 (CRC寄存器)
返回 (65536)



点评

CRC16_MODBUS 校验是一种标准算法。可以百du一下   广东省深圳市  发表于 6 天前
回复 支持 反对

使用道具 举报

签到天数: 3 天

68
发表于 6 天前 | 只看该作者   浙江省宁波市
感谢分享,支持开源!!!
回复 支持 反对

使用道具 举报

结帖率:100% (18/18)

签到天数: 3 天

67
发表于 7 天前 | 只看该作者   广东省深圳市
再给你发个

10.8.e

1.23 MB, 下载次数: 9, 下载积分: 精币 -2 枚

回复 支持 反对

使用道具 举报

结帖率:50% (7/14)

签到天数: 2 天

66
发表于 7 天前 | 只看该作者   安徽省淮北市
感谢分享,很给力!~
回复 支持 反对

使用道具 举报

结帖率:97% (120/124)

签到天数: 3 天

65
发表于 7 天前 | 只看该作者   山东省青岛市
全都是大佬~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报QQ: 793400750,邮箱:[email protected]
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表