开启辅助访问 切换到宽版

精易论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

用微信号发送消息登录论坛

新人指南 邀请好友注册 - 我关注人的新帖 教你赚取精币 - 每日签到


求职/招聘- 论坛接单- 开发者大厅

论坛版规 总版规 - 建议/投诉 - 应聘版主 - 精华帖总集 积分说明 - 禁言标准 - 有奖举报

查看: 8306|回复: 37
打印 上一主题 下一主题
收起左侧

[2020开源大赛(第五届)] 图片爬虫 爬取一些小姐姐图片 有些许不完善 请大佬指正

[复制链接]
跳转到指定楼层
楼主
发表于 2020-11-26 22:27:15 | 只看该作者 |只看大图 回帖奖励 |正序浏览 |阅读模式   山东省烟台市
使用演示:视频演示   地址:https://vkceyugu.cdn.bspapp.com/VKCEYUGU-imgbed/f5458df0-dfcc-4966-ad11-dae45c74f67f.mp4
小姐姐图片采集器成品以及源码.rar (1.25 MB, 下载次数: 175)
效果演示:可观看上述视频

源码展示,常量以及变量以及全部源码以及模块成品 都在附件内  还请大佬批评指正!



  
窗口程序集名保 留  保 留备 注
窗口程序集_启动窗口   
变量名类 型数组备 注
正则正则表达式类  

子程序名返回值类型公开备 注
__启动窗口_创建完毕  
信息框 (“本软件仅用于学习和交流使用,请您在24h内删除!”, 0, , )
首次采集 = “https://bcy.net/tag/492?_source_page=detail”
采集类型 = “https://bcy.net/apiv3/common/circleFeed?circle_id=492&since=”时间_取现行时间戳 ()“.000000&sort_type=2&grid_type=10&_signature=UCWcwAAgEByiCq6HuAav5VAlnNAAA-T”
子程序名返回值类型公开备 注
_按钮1_被单击  
标签4.标题 = “作者链接采集中”
计次循环首 (到数值 (编辑框2.内容), )
动态号 = 网页_访问S (采集类型, 0, , , , , )
正则.创建 ( #表达式1, 动态号, , 真, )
计次循环首 (正则.取匹配数量 (), 计次)
编辑框1.内容 = 编辑框1.内容 + “https://bcy.net/item/detail/” + 正则.取子匹配文本 (计次, 1, )“%20?_source_page=hashtag”#换行符
如果真 (标签4.标题 = “作者链接采集中······”)
标签4.标题 = “作者链接采集中”

计次循环尾 ()
标签4.标题 = 标签4.标题 + “·”
计次循环尾 ()
动态号 = 网页_访问S (首次采集, 0, , , , , )
正则.创建 ( #表达式2, 动态号, , 真, )
计次循环首 (正则.取匹配数量 (), 计次)
编辑框1.内容 = 编辑框1.内容 + “https://bcy.net/item/detail/” + 正则.取子匹配文本 (计次, 1, )“%20?_source_page=hashtag”#换行符
延时 (到数值 (编辑框3.内容))
计次循环尾 ()
标签4.标题 = “作者信息链接”
信息框 (“采集” + 编辑框2.内容 + “条作者页面完成,接下来若您使用生成的图片如果进行一切活动请通过访问生成的作者链接获得作者许可”, 0, “使用须知,请悉知!”, )
信息框 (“您已同意信息许可,请遵守使用须知”, 0, , )
按钮2.禁止 = 假
子程序名返回值类型公开备 注
_编辑框2_鼠标左键被按下逻辑型 
参数名类 型参考可空数组备 注
横向位置整数型
纵向位置整数型
功能键状态整数型
编辑框2.内容 = “”
子程序名返回值类型公开备 注
_按钮2_被单击  
按钮3.禁止 = 假
时间文本 = 时间_取现行时间戳 ()
写到文件 (取特定目录 (3) + 时间文本 + “.txt”, 到字节集 (编辑框1.内容))
' 运行 (“NOTEPAD ” + 取特定目录 (3) + 时间文本 + “.txt”, 假, )
信息框 (“采集完成”, 0, , )
子程序名返回值类型公开备 注
提取图片链接  
变量名类 型静态数组备 注
文件号整数型 
文件号 = 打开文件 (取特定目录 ( #系统桌面 ) + 时间文本 + “.txt”, , )
移到文件首 (文件号)
结束 = 假
图片数量 = 0
判断循环首 (是否在文件尾 (文件号, ) = 结束)
正则.创建 ( #表达式, 网页_访问S (读入一行 (文件号), 0, ), , , , )
计次2 = 0
计次循环首 (正则.取匹配数量 (), 计次2)
编辑框1.内容 = 编辑框1.内容 + #常量2编码_usc2到ansi (正则.取子匹配文本 (计次2, 1)) + #常量1#换行符
标签4.标题 = “正在抓取第”到文本 (图片数量)“张图片”
图片数量 = 图片数量 + 1
计次循环尾 ()
判断循环尾 ()
信息框 (“图片抓取完成”, 0, , )
标签4.标题 = “图片抓取完成”
子程序名返回值类型公开备 注
_按钮3_被单击  
编辑框1.内容 = “”
标签4.标题 = “正在抓取”
提取图片链接 ()
按钮4.禁止 = 假
子程序名返回值类型公开备 注
_按钮4_被单击  
时间文本2 = 时间_取现行时间戳 ()
写到文件 (取特定目录 (3)“图片” + 时间文本2 + “.html”, 到字节集 (编辑框1.内容))
执行 (4, 取特定目录 (3)“图片” + 时间文本2 + “.html”, , , 4)
编辑框1.内容 = “”
子程序名返回值类型公开备 注
_按钮5_被单击  
结束 = 真
按钮4.禁止 = 假
子程序名返回值类型公开备 注
_标签2_鼠标左键被按下逻辑型 
参数名类 型参考可空数组备 注
横向位置整数型
纵向位置整数型
功能键状态整数型
信息框 (“按顺序点击这几个按钮即可”, 0, , )
信息框 (“给每个使用这个软件的小朋友一个福利 免费的域名www.3L32.com支持一下”, 0, , )
延时 (100)
打开指定网址 (“https://www.3l32.com/”)
子程序名返回值类型公开备 注
_单选框3_被单击  
采集类型 = “https://bcy.net/apiv3/common/circleFeed?circle_id=1128&since=rec:4&sort_type=1&grid_type=10&_signature=pcqvlgAgEBxX5Z3RVhqfO6XKr4AAPqB”
首次采集 = “https://bcy.net/tag/3302?_source_page=detail”
子程序名返回值类型公开备 注
_单选框4_被单击  
采集类型 = “https://bcy.net/apiv3/common/circleFeed?circle_id=416&since=rec:2&sort_type=1&grid_type=10&_signature=qCWCiAAgEBxaCrDPqTam4qglgpAAPes”
首次采集 = “https://bcy.net/tag/416?_source_page=detail”
子程序名返回值类型公开备 注
_单选框2_被单击  
采集类型 = “https://bcy.net/apiv3/common/circleFeed?circle_id=94&since=rec:2&sort_type=1&grid_type=10&_signature=Lvxd5AAgEBzc02-j21awsi78XfAAHFM”
首次采集 = “https://bcy.net/tag/94?_source_page=detail”
子程序名返回值类型公开备 注
_单选框1_被单击  
采集类型 = “https://bcy.net/apiv3/common/circleFeed?circle_id=492&since=”时间_取现行时间戳 ()“.000000&sort_type=2&grid_type=10&_signature=UCWcwAAgEByiCq6HuAav5VAlnNAAA-T”
首次采集 = “https://bcy.net/tag/492?_source_page=detail”
子程序名返回值类型公开备 注
_标签8_鼠标左键被按下逻辑型 
参数名类 型参考可空数组备 注
横向位置整数型
纵向位置整数型
功能键状态整数型
打开指定网址 (“bcy.net”)
子程序名返回值类型公开备 注
_标签8_鼠标左键被放开逻辑型 
参数名类 型参考可空数组备 注
横向位置整数型
纵向位置整数型
功能键状态整数型
打开指定网址 (“bcy.net”)
子程序名返回值类型公开备 注
_按钮按钮_被单击  
编辑框1.内容 = “”
生成文章 ()
子程序名返回值类型公开备 注
生成文章  
变量名类 型静态数组备 注
文件号整数型 
计次3整数型 
结束逻辑型 
标题文本文本型 
temp文本型 
数组文本型0
n整数型 
网页文本文本型 
temp = 到文本 (读入文件 (取特定目录 ( #系统桌面 )“\” + 时间文本 + “.txt”))
数组 = 分割文本 (temp, #换行符, )
计次循环首 (取数组成员数 (数组), n)
网页文本 = 网页_访问S (数组 [n], 0, )
正则.创建 ( #常1, 网页文本, , , , )
计次3 = 0
标题文本 = 文本_取出文本中汉字 (文本_取出中间文本 (网页文本, #文本1, #文本2 ))
编辑框1.加入文本 (编码_usc2到ansi (标题文本)#换行符 )
计次循环首 (正则.取匹配数量 (), 计次3)
编辑框1.内容 = 编辑框1.内容 + #前缀编码_usc2到ansi (正则.取子匹配文本 (计次3, 1)) + “image”#后缀#换行符
计次循环尾 ()
编辑框1.内容 = 编辑框1.内容 + #换行符#常量3#换行符“================================================================================================”#换行符
计次循环尾 ()


i支持库列表   支持库注释   
shell操作系统界面功能支持库
eAPI应用接口支持库

QQ截图20201126220622.jpg (39.13 KB, 下载次数: 0)

QQ截图20201126220622.jpg

评分

参与人数 4好评 +3 精币 +7 收起 理由
峰芒 + 1 支持开源~!感谢分享
UUU优一酱 + 1 + 2 图片好评、
zxc35987 + 1 + 1 支持开源~!感谢分享
niulin1 + 1 + 3 此处应该有鼓励~

查看全部评分

本帖被以下淘专辑推荐:

38
发表于 2024-2-6 14:58:42 | 只看该作者   云南省昆明市
谢谢分享
回复 支持 反对

使用道具 举报

结帖率:85% (11/13)

签到天数: 10 天

37
发表于 2023-7-21 11:15:47 | 只看该作者   天津市天津市



支持开源 感谢分享
回复 支持 反对

使用道具 举报

36
发表于 2023-5-12 17:27:40 | 只看该作者   河南省驻马店市
可以用的
回复 支持 反对

使用道具 举报

35
发表于 2022-12-27 18:02:45 | 只看该作者   陕西省西安市
感谢分享
回复 支持 反对

使用道具 举报

签到天数: 1 天

34
发表于 2022-12-10 20:37:19 | 只看该作者   河南省漯河市
支持开源 感谢分享
回复 支持 反对

使用道具 举报

签到天数: 1 天

33
发表于 2022-8-6 09:07:26 | 只看该作者   山东省菏泽市

下载下来学习学习
回复 支持 反对

使用道具 举报

签到天数: 1 天

32
发表于 2022-8-6 09:07:10 | 只看该作者   山东省菏泽市
厉害厉害
回复 支持 反对

使用道具 举报

31
发表于 2021-4-17 06:09:37 | 只看该作者   浙江省金华市
韩国法国和
回复 支持 反对

使用道具 举报

结帖率:100% (2/2)
30
发表于 2021-3-1 21:07:34 | 只看该作者   安徽省亳州市
这个可以改成其他网址吗
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则 致发广告者

发布主题 收藏帖子 返回列表

sitemap| 易语言源码| 易语言教程| 易语言论坛| 易语言模块| 手机版| 广告投放| 精易论坛
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
论坛帖子内容仅用于技术交流学习和研究的目的,严禁用于非法目的,否则造成一切后果自负!如帖子内容侵害到你的权益,请联系我们!
防范网络诈骗,远离网络犯罪 违法和不良信息举报电话0663-3422125,QQ: 793400750,邮箱:[email protected]
网站简介:精易论坛成立于2009年,是一个程序设计学习交流技术论坛,隶属于揭阳市揭东区精易科技有限公司所有。
Powered by Discuz! X3.4 揭阳市揭东区精易科技有限公司 ( 粤ICP备12094385号-1) 粤公网安备 44522102000125 增值电信业务经营许可证 粤B2-20192173

快速回复 返回顶部 返回列表