精易论坛

标题: 网页抓取问题 [打印本页]

作者: 225298658    时间: 2013-8-10 12:04
标题: 网页抓取问题
先抓取http://www.youdaili.cn页面中
像http://www.youdaili.cn/Daili/http/709.html这种IP页面
这个页面是很多个的
类似下面这种
http://www.youdaili.cn/Daili/http/709.html
http://www.youdaili.cn/Daili/http/708.html
http://www.youdaili.cn/Daili/http/707.html

然后再得到【每个】这种IP页面的分页

类似下面这种
http://www.youdaili.cn/Daili/http/709_2.html
http://www.youdaili.cn/Daili/http/709_3.html
http://www.youdaili.cn/Daili/http/709_4.html
http://www.youdaili.cn/Daili/http/709_5.html

http://www.youdaili.cn/Daili/http/708_2.html
http://www.youdaili.cn/Daili/http/708_3.html
http://www.youdaili.cn/Daili/http/708_4.html
http://www.youdaili.cn/Daili/http/708_5.html

http://www.youdaili.cn/Daili/http/707_2.html
http://www.youdaili.cn/Daili/http/707_3.html
http://www.youdaili.cn/Daili/http/707_4.html
http://www.youdaili.cn/Daili/http/707_5.html

然后再抓取每个分页的IP






欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4