精易论坛

标题: 还是表达式的问题 [打印本页]

作者: skychenxian    时间: 2011-9-15 00:23
标题: 还是表达式的问题

.版本 2
返回文本 = 到文本 (网页_访问 (“http://www.jy285.com/jingyou/index.htm”))
表达式文本 = “http://s.click.taobao.com/(.*?)” + #引号
正则.创建 (表达式文本, 假)
结果 = 正则.搜索全部 (返回文本)
.计次循环首 (取数组成员数 (结果), A)
    调试输出 (“http://s.click.taobao.com/” + 结果 [A].取子匹配文本 (返回文本, 1, A))
.计次循环尾 ()


这是源码  把里面的淘客链接给提出来了

现在的问题是 在这个HTM下还有很多注释的文本 也就是说很多非掉的链接

表达式文本 = “<!--(.*?)-->”
正则.创建 (表达式文本, )
结果 = 正则.搜索全部 (返回文本)
.计次循环首 (取数组成员数 (结果), A)
    调试输出 (结果 [A].取子匹配文本 (返回文本, 1, A))
.计次循环尾 ()

用这个是可以扫描出注册的文本 但是应该用什么删除呢。。。 搞了半天。。

作者: skychenxian    时间: 2011-9-15 13:01
自己顶!!!
作者: exit11    时间: 2011-9-15 13:06
看看





作者: skychenxian    时间: 2011-9-15 13:09
exit11 发表于 2011-9-15 13:06
看看

多谢!!!!
作者: skychenxian    时间: 2011-9-15 13:49
没人回答啊!!!
作者: skychenxian    时间: 2011-9-15 15:41
在不回复就就沉下去了!!
作者: qq793359277    时间: 2011-9-15 16:31
你是想删除指定的文本?
作者: exit11    时间: 2011-9-15 16:33
看了半天 还是迷糊的
根本看不明白到底要取什么
也不明白 非掉的连接 注册的文本删除{:3_229:}到底是什么意思
作者: skychenxian    时间: 2011-9-15 16:42
exit11 发表于 2011-9-15 16:33
看了半天 还是迷糊的
根本看不明白到底要取什么
也不明白 非掉的连接 注册的文本删除到底是什么 ...

我刚刚看了问题 是我写错了!是 注释的文本

在打开的HTM里面 有很多被注释掉的文本 !  而上面不是有一个扫描淘客链接的吗。连注释的文本一起给扫出来了。现在就是注释的文本压根就不让他是扫了。!
作者: skychenxian    时间: 2011-9-15 16:49
qq793359277 发表于 2011-9-15 16:31
你是想删除指定的文本?

对!就是这个意思!!
作者: qq793359277    时间: 2011-9-15 16:56
skychenxian 发表于 2011-9-15 16:49
对!就是这个意思!!

子文本替换(要准备进行操作的文本,“要删除的文本”,”")  返回替换后的文本
作者: skychenxian    时间: 2011-9-15 19:28
qq793359277 发表于 2011-9-15 16:56
子文本替换(要准备进行操作的文本,“要删除的文本”,”")  返回替换后的文本

这段话确实是我想要的!但是写完后问题多多现在!!!
作者: skychenxian    时间: 2011-9-15 19:29
.版本 2
.支持库 RegEx
.支持库 spec

.程序集 窗口程序集1
.程序集变量 返回文本, 文本型

.子程序 _按钮1_被单击
.局部变量 表达式文本, 文本型
.局部变量 正则, 正则表达式
.局部变量 结果, 搜索结果, , "0"
.局部变量 A, 整数型

返回文本 = 到文本 (网页_访问 (“http://www.jy285.com/jingyou/index.htm”))

表达式文本 = “<!--(.*?)-->”
正则.创建 (表达式文本, )
结果 = 正则.搜索全部 (返回文本)

.计次循环首 (取数组成员数 (结果), A)
    调试输出 (结果 [A].取子匹配文本 (返回文本, 1, ))
    返回文本 = 子文本替换 (返回文本, 结果 [A].取子匹配文本 (返回文本, 1, ), “”, , , 真)
.计次循环尾 ()

调试输出 (返回文本)


.子程序 _按钮扫描淘客_被单击
.局部变量 表达式文本, 文本型
.局部变量 正则, 正则表达式
.局部变量 结果, 搜索结果, , "0"
.局部变量 A, 整数型


表达式文本 = “http://s.click.taobao.com/(.*?)” + #引号
正则.创建 (表达式文本, 假)
结果 = 正则.搜索全部 (返回文本)
.计次循环首 (取数组成员数 (结果), A)
    调试输出 (“http://s.click.taobao.com/” + 结果 [A].取子匹配文本 (返回文本, 1, A))
.计次循环尾 ()
调试输出 (取数组成员数 (结果))

作者: qq793359277    时间: 2011-9-15 20:52
skychenxian 发表于 2011-9-15 19:28
这段话确实是我想要的!但是写完后问题多多现在!!!

什么问题!!
作者: 雨林木风    时间: 2011-9-15 23:47
标题: ,
本帖最后由 雨林木风 于 2011-9-15 23:50 编辑

注释文本,估计你的正则表达,有问题,你把返回的文本发我,告诉我要提取的部份,我帮你写正则文本

作者: skychenxian    时间: 2011-9-18 03:16
雨林木风 发表于 2011-9-15 23:47
注释文本,估计你的正则表达,有问题,你把返回的文本发我,告诉我要提取的部份,我帮你写正则文本

谢谢!文本文件其实就是访问!www.jy285.com/jingyou/index.htm 所返回的文本

我的要求是提取里面的所有淘客链接。但是返回的文本 有很多注释的代码。注释的代码里的淘客链接就不要取了。

说白了 就是取页面上显示的淘客链接。。




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4