精易论坛

标题: [我的爬虫日记02]爬虫下载笔趣阁小说 [打印本页]

作者: 易飞鸟    时间: 2024-10-30 12:58
标题: [我的爬虫日记02]爬虫下载笔趣阁小说
  
窗口程序集名保 留  保 留备 注
程序集1   
变量名类 型数组备 注
集_域名文本型  

子程序名返回值类型公开备 注
_启动子程序整数型 本子程序在程序启动后最先执行
变量名类 型静态数组备 注
html文本型 
小说名字文本型 
创建文件逻辑型 
url_arr文本型0
i整数型 
章节页链接文本型 
章节内容文本型0
文件号整数型 
' 获取小说章节链接列表 (“https://www.bqgda.cc/books/9680/”)
' 获取小说章节内容 (“https://www.bqgda.cc/books/9680/1.html”)
' 写入章节 (, )
集_域名 = “https://www.bqgda.cc”
html = 获取小说页html (“https://www.bqgda.cc/books/9680/”)
.if (html = “”)
fputs (, “网络请求异常!”#换行符 )
return (0)

小说名字 = 获取小说名字 (html)
fputs (, “名字为:” + 小说名字 + #换行符 )
创建文件 = WriteFile (GetRunPath ()“\downlod\” + 小说名字 + “.txt”, {  })
.if (创建文件)
文件号 = open (GetRunPath ()“\downlod\” + 小说名字 + “.txt”, , )
获取小说章节链接列表 (html, url_arr)
.for (1, GetAryElementCount (url_arr), 1, i)
章节页链接 = 集_域名 + url_arr [i]
fputs (, “章节页链接:” + 章节页链接 + #换行符 )
获取小说章节内容 (章节页链接, 章节内容)
写入章节 (文件号, 章节内容)
延迟 (2000)
.if (i > 100)
break ()

.next ()
fputs (, “下载完成”)
close (文件号)

fgets ()
return (0)  ' 可以根据您的需要返回任意数值
子程序名返回值类型公开备 注
获取小说页html文本型 
参数名类 型参考可空数组备 注
url文本型
变量名类 型静态数组备 注
html文本型 
fputs (, “获取小说页html...”#换行符 )
html = str (HttpRequestRetBin (url, 0, , , , , , , , , ))
html = Utf8ToGb2312 (html)
return (html)
子程序名返回值类型公开备 注
获取小说名字文本型 
参数名类 型参考可空数组备 注
html文本型
变量名类 型静态数组备 注
小说名字文本型 
小说名字 = GetMidText (html, #left_小说名字, #right_小说名字, , )
return (小说名字)
子程序名返回值类型公开备 注
获取小说章节链接列表整数型 
参数名类 型参考可空数组备 注
html文本型
url_arr文本型
变量名类 型静态数组备 注
listmain_str文本型 
i整数型 
fputs (, “开始获取小说章节链接列表...”#换行符 )
' 获取章节列表
listmain_str = GetMidText (html, #left_章节列表, #right_章节列表, , )
GetMidText_批量 (listmain_str, #left_a, #right_a, url_arr, , , , , , , )
return (0)
子程序名返回值类型公开备 注
获取小说章节内容整数型 
参数名类 型参考可空数组备 注
url文本型
章节内容_反文本型
变量名类 型静态数组备 注
html文本型 
章节名文本型 
正文文本型 
章节内容文本型2
fputs (, “开始获取小说章节内容...”#换行符 )
html = str (HttpRequestRetBin (url, 0, , , , , , , , , ))
html = Utf8ToGb2312 (html)
章节名 = GetMidText (html, #left_名字, #right_名字, , )
正文 = GetMidText (html, #left_正文, #right_正文, , )
正文 = RpSubText (正文,
, #换行符, , , 真)
章节内容 [1] = 章节名
章节内容 [2] = 正文
章节内容_反 = 章节内容
return (0)
子程序名返回值类型公开备 注
写入章节整数型 
参数名类 型参考可空数组备 注
文件号整数型
章节内容文本型
变量名类 型静态数组备 注
章节名文本型 
正文文本型 
fputs (, “写入章节...”#换行符 )
章节名 = 章节内容 [1]
正文 = 章节内容 [2]
fputs (, 章节名 + #换行符 )
WriteLine (文件号, 章节名)
WriteLine (文件号, 正文)
return (0)


i支持库列表   支持库注释   
spec特殊功能支持库



小说下载.rar (307.51 KB, 下载次数: 33)

作者: kyo9766    时间: 2024-10-30 14:32
学习一下 获取小说,感谢分享
作者: 杨明煜    时间: 2024-10-30 18:38
真值得学习,感谢!......
作者: 亿万    时间: 2024-10-30 21:00
感谢分享,很给力!~
作者: KEY心碎    时间: 2024-10-30 21:40
支持开源!感谢分享,论坛有你更精彩~
作者: 查过    时间: 2024-10-31 06:08
已经顶贴,感谢您对论坛的支持!
作者: 豆豆灰常开心    时间: 2024-10-31 06:12
下个学习一下
作者: 百熙    时间: 2024-10-31 07:54
开源大佬,谢谢分享
作者: year1970    时间: 2024-10-31 08:09
感谢分享
作者: 396384183    时间: 2024-10-31 08:33
感谢分享,很给力!~
作者: please    时间: 2024-10-31 09:36
感谢分享,支持开源!!!
作者: jzc123    时间: 2024-11-1 01:25
666666666666666666
作者: 查过    时间: 2024-11-1 06:18
感谢您对论坛的支持!
作者: 豆豆灰常开心    时间: 2024-11-1 06:22
已经顶贴,感谢您对论坛的支持!
作者: qwe111qwe    时间: 2024-11-1 08:18
感谢分享!!!!
作者: 夜曦丫    时间: 2024-11-1 21:18
6666666666 感谢分享
作者: lzht88    时间: 2024-11-3 22:09
这代码,看的我也一头蒙蔽,你说用易吧,你要写成英文的,你说你会英文的吧,你却用着易编译器。
作者: cdzch    时间: 2024-11-5 09:08
感谢分享,支持开源!!!
作者: 光影魔术    时间: 2024-11-6 19:06
感谢分享源码
作者: wdh1991    时间: 2024-11-14 10:06
感谢分享,支持开源!!!
作者: 熊不熊    时间: 2024-12-4 05:52
感谢分享,很给力!~




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4