|
大文本去重复 | 文本型 | |
|
输入文本 | 文本型 | | | |
分隔符 | 文本型 | | | | 返回去除数量 | 整数型 | | | | 返回剩余数量 | 整数型 | | | | 去除空行 | 逻辑型 | | | |
变量名 | 类 型 | 静态 | 数组 | 备 注 |
局去除数量 | 整数型 | | |
局文本组 | 文本型 | | 0 |
i | 整数型 | | |
局输入 | 快速文本对象 | | |
局输出 | 快速文本对象 | | |
局剩余数量 | 整数型 | | |
局哈希 | 哈希表_ASM | | |
如果真 (输入文本 =
“”)
返回 (“”)
如果真 (分隔符 =
“”)
分隔符 =
#换行符 局哈希.创建 ( #文本型, #整数型, 20)
局输入.
置文本 (输入文本
)局文本组 = 局输入.
分割文本 (分隔符,
)
计次循环首 (取数组成员数 (局文本组
), i
)
如果真 (去除空行 =
真)

如果真 (局文本组
[i
] =
“”)


局去除数量 = 局去除数量 + 1


到循环尾 ()





如果 (局哈希.
cha询 (局文本组
[i
]))


局去除数量 = 局去除数量 + 1


局哈希.
添加 (局文本组
[i
], 0
)

局输出.
添加 (局文本组
[i
], 分隔符
)

局剩余数量 = 局剩余数量 + 1


计次循环尾 ()局哈希.
清空 ()返回去除数量 = 局去除数量
返回剩余数量 = 局剩余数量
返回 (局输出.
取文本 (,
))
你也可以直接操作文本文件去重复,反回来的数组放编辑框里
|
大文本文件去重复 | | |
|
原文本路径 | 文本型 | | | |
返回结果组 | 文本型 | | | |
变量名 | 类 型 | 静态 | 数组 | 备 注 |
哈希表 | 哈希表_ASM | | |
w | 整数型 | | |
i | 整数型 | | |
text | 文本型 | | |
t | 整数型 | | |
哈希表.
创建 ( #文本型, #整数型, , , , ,
真)w =
打开文件 (原文本路径, ,
)
计次循环首 (10000000, i
)
text =
读入一行 (w
)
哈希表.
添加 (text, 0,
)
处理事件 ()
计次循环尾 ()哈希表.
取所有键 (返回结果组
)关闭文件 (w
)