精易论坛

标题: 请问大神:这种翻页方式怎么弄? [打印本页]

作者: 四月南风    时间: 2017-2-28 14:21
标题: 请问大神:这种翻页方式怎么弄?
http://wgwsxx.cn/web/CommonA/UpgradeError.ashx?T=GUEI&ID=T00060368


T00000001---------T00060368是翻页

00000.rar (145.22 KB, 下载次数: 9)


补充内容 (2017-2-28 14:33):
我需要从T00000001采集到T00070000共7万条页面

补充内容 (2017-2-28 15:06):
我现在的问题是怎么从00001变化到70000或99999,
我也用循环+1,可如果编辑框是5位数的话,只能循环9次就不行了!如果编辑框里是4位的话,循环前9次就采集不到了,只能从10~99,如果编辑框是3位的话,前99又不行了~只能从100到999能采集到

补充内容 (2017-2-28 15:13):
刚才说错了
应该是如果编辑框2是4位数的话,只能循环9次就不行了!如果编辑框里是3位的话,循环前9次就采集不到了,只能从10~99,如果编辑框是2位的话,前99又不行了~只能从100到999能采集到
作者: ztalyx    时间: 2017-2-28 14:21
再试试    @四月南风

00000.rar

144.96 KB, 下载次数: 20


作者: 晚风归    时间: 2017-2-28 14:37
采集这么多你电脑够么
作者: NOCOL    时间: 2017-2-28 14:40
可以用判断循环,设置一个数,每循环一次加1,判断到最终数的时候停止,这个没红包不想写源码
作者: 晚风归    时间: 2017-2-28 14:41
刚才打开网址试了下 你可以直接读取网页源码 因为他是用后面的那几个数字来获取题目的
这里你可以用计次循环之类的来进行获取题目 如果想下一题就把后面的数字加一即可
作者: yaoming110    时间: 2017-2-28 14:41
去掉  +编辑框2.内容
作者: 四月南风    时间: 2017-2-28 14:42
魔蝎座的莫 发表于 2017-2-28 14:37
采集这么多你电脑够么

我其实已经采集完了~不过我用的是笨办法!我一直没弄明白,如果直接循环7万次怎么弄?
作者: ztalyx    时间: 2017-2-28 14:42
可以试试  这个 @四月南风

00000.rar

147.25 KB, 下载次数: 9


作者: 晚风归    时间: 2017-2-28 14:48
一个个人小建议  你可以用线程采集  然后用正则匹配
匹配完成后 把它记录到数据库  这样以后调用也方便
至于线程 你可以 让第一个线程采集第1-----10000的
第二个线程采集第10001-20000这样来采集 速度应该会快很多
然后写入数据库的话  以后调用也方便
作者: 四月南风    时间: 2017-2-28 14:50
zt471402521 发表于 2017-2-28 14:42
可以试试  这个 @四月南风

采集不了,其实我要的就是编辑框里从00001变化到70000
作者: 四月南风    时间: 2017-2-28 14:53
NOCOL 发表于 2017-2-28 14:40
可以用判断循环,设置一个数,每循环一次加1,判断到最终数的时候停止,这个没红包不想写源码

我也用循环+1,可如果编辑框是5位数的话,只能循环9次就不行了!如果编辑框里是4位的话,循环前9次就采集不到了,只能从10~99,如果编辑框是3位的话,前99又不行了~只能从100到999能采集到
作者: 四月南风    时间: 2017-2-28 14:55
魔蝎座的莫 发表于 2017-2-28 14:41
刚才打开网址试了下 你可以直接读取网页源码 因为他是用后面的那几个数字来获取题目的
这里你可以用计次循 ...

我也用循环+1,可如果编辑框是5位数的话,只能循环9次就不行了!如果编辑框里是4位的话,循环前9次就采集不到了,只能从10~99,如果编辑框是3位的话,前99又不行了~只能从100到999能采集到
作者: 四月南风    时间: 2017-2-28 14:56
魔蝎座的莫 发表于 2017-2-28 14:48
一个个人小建议  你可以用线程采集  然后用正则匹配
匹配完成后 把它记录到数据库  这样以后调用也方便
...

我现在的问题是怎么从00001变化到70000或99999,
我也用循环+1,可如果编辑框是5位数的话,只能循环9次就不行了!如果编辑框里是4位的话,循环前9次就采集不到了,只能从10~99,如果编辑框是3位的话,前99又不行了~只能从100到999能采集到
作者: blllyc    时间: 2017-2-28 15:05
计次循环 多好用 为什么要用判断循环?
作者: 四月南风    时间: 2017-2-28 15:34
zt471402521 发表于 2017-2-28 15:22
再试试    @四月南风

还是不对!




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4