精易论坛
标题:
网页抓取问题
[打印本页]
作者:
225298658
时间:
2013-8-10 12:04
标题:
网页抓取问题
先抓取http://www.youdaili.cn页面中
像http://www.youdaili.cn/Daili/http/709.html这种IP页面
这个页面是很多个的
类似下面这种
http://www.youdaili.cn/Daili/http/709.html
http://www.youdaili.cn/Daili/http/708.html
http://www.youdaili.cn/Daili/http/707.html
然后再得到【每个】这种IP页面的分页
类似下面这种
http://www.youdaili.cn/Daili/http/709_2.html
http://www.youdaili.cn/Daili/http/709_3.html
http://www.youdaili.cn/Daili/http/709_4.html
http://www.youdaili.cn/Daili/http/709_5.html
http://www.youdaili.cn/Daili/http/708_2.html
http://www.youdaili.cn/Daili/http/708_3.html
http://www.youdaili.cn/Daili/http/708_4.html
http://www.youdaili.cn/Daili/http/708_5.html
http://www.youdaili.cn/Daili/http/707_2.html
http://www.youdaili.cn/Daili/http/707_3.html
http://www.youdaili.cn/Daili/http/707_4.html
http://www.youdaili.cn/Daili/http/707_5.html
然后再抓取每个分页的IP
欢迎光临 精易论坛 (https://125.confly.eu.org/)
Powered by Discuz! X3.4