精易论坛

标题: 邮箱采集问题 [打印本页]

作者: dreakin    时间: 2014-6-10 10:32
标题: 邮箱采集问题
易语言采集目标网页邮箱,但是该目标网页的翻页URL都是一样的,翻页有很多页,URL都是一个样子的,一个翻页只有几个邮箱,请问怎么采集所有翻页的邮箱呢。例子:http://star.tga.plu.cn/520/v/43704?from=lolclient


作者: 半夏时光    时间: 2014-6-10 10:32
  
子程序名返回值类型公开备 注
_按钮1_被单击  
变量名类 型静态数组备 注
url文本型 
str文本型 
page文本型 
page = “0”  ' 0为第一页
url = “http://comment.plu.cn/comment/list?app=star.tga&pageIndex=” + page + “&pageSize=10&sort=new&topicId=43704&callback=_c_1cqnfh8”
str = 编码_Utf8到Ansi (网页_访问 (url, , , , , “Referer: http://star.tga.plu.cn/520/v/43704?from=lolclient”))
调试输出 (str)


i支持库列表   支持库注释   
spec特殊功能支持库

作者: 老酋长    时间: 2014-6-10 10:40
http://comment.plu.cn/comment/list?app=star.tga&pageIndex=(页码-1)&pageSize=10&sort=new&topicId=43704&callback=_c_1cqnfh8   
作者: 半夏时光    时间: 2014-6-10 10:43
  
子程序名返回值类型公开备 注
_按钮1_被单击  
变量名类 型静态数组备 注
url文本型 
str文本型 
page文本型 
page = “0”  ' 0为第一页
url = “http://comment.plu.cn/comment/list?app=star.tga&pageIndex=” + page + “&pageSize=10&sort=new&topicId=43704”
str = 编码_Utf8到Ansi (网页_访问 (url, , , , , “Referer: http://star.tga.plu.cn/520/v/43704?from=lolclient”))
调试输出 (str)


i支持库列表   支持库注释   
spec特殊功能支持库

作者: dreakin    时间: 2014-6-11 11:34
半夏时光 发表于 2014-6-10 10:39
[e=4].版本 2
.支持库 spec

HI,又是您为我解答啊,呵呵,谢谢啊。
  1. url = “http://comment.plu.cn/comment/list?app=star.tga&pageIndex=” + page + “&pageSize=10&sort=new&topicId=43704&callback=_c_1cqnfh8”
复制代码
我想请问下这个怎么解释呢,中间这个URL是如何来的。
作者: 落叶§无痕    时间: 2014-6-11 11:46
dreakin 发表于 2014-6-11 11:34
HI,又是您为我解答啊,呵呵,谢谢啊。我想请问下这个怎么解释呢,中间这个URL是如何来的。

就是抓包抓到的,论坛有POST的教程,看看就知道怎么回事了
作者: 落枫_rain    时间: 2014-6-11 12:34
dreakin 发表于 2014-6-11 11:34
HI,又是您为我解答啊,呵呵,谢谢啊。我想请问下这个怎么解释呢,中间这个URL是如何来的。

使用HTTPWATCH抓包得到的,多翻页几次,然后对比分析就可以得到这个了




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4