精易论坛
标题:
【原创】小说站点html解析模块
[打印本页]
作者:
zl2017
时间:
2018-11-2 12:13
标题:
【原创】小说站点html解析模块
1.模块说明
本小说解析模块,调用海绵宝宝elss6.01引擎(论坛搜elss即可)进行html解析(采用xpath表达式)
封装了一些处理小说站点html网页信息的子程序,
可以利用本模块来轻松制作一个可换源的阅读软件。
2.png
(100.16 KB, 下载次数: 0)
下载附件
2018-11-2 12:12 上传
2.模块子程序自定义类型数据介绍以及制作阅读软件简单设计思路
这里将处理小说站点html信息的
采集规则
叫
书源
书源的成员大致可分为以下几大类(具体成员名参见附件里面的【说明文件.txt】)
书源名称、书源网址、搜索网址、搜索页处理规则,书籍介绍页处理规则,目录页处理规则,章节内容页处理规则
目前采用
json
格式文本保存书源。(参见附件里面的【书源default.txt】)
首先在解析html前需要导入书源
也就是调用
书源初始化()
通过组合框根据站点名
切换书源
然后在软件搜索框输入关键字
程序根据当前书源的搜索网址,通过
搜索页处理()
得到搜索页信息(具体成员名参见附件里面的【说明文件.txt】)
然后双击选择某本书籍通过
书籍页处理()
得到书籍页,同时通过
目录页处理()
得到目录页信息(也就是章节名称和章节链接)
最后根据章节链接进行
内容页处理()
可以变成纯净的在线阅读或者根据章节链接直接下载(比如鱼刺多线程下载)
dll文件habo检测链接:
https://habo.qq.com/file/showdetail?pk=ADQGb11tB2QIOVs8U2Y%3D
注意:为了方便测试模块和demo合二为一了
可以将原文件复制一份,删掉程序集_功能以及后面的程序集和类,删掉窗口和临时子程序这样就是纯模块了
今天刚好注册满一周年,
所以特意开源此模块,无需精币,附件
回复可见。
[hide=d90]
elss解析小说网站.rar
(248.98 KB, 下载次数: 268)
2018-11-2 12:12 上传
点击文件名下载附件
下载积分: 精币 -2 枚
[/hide]
作者:
风里刀
时间:
2018-11-2 14:05
领取LZ的1JB
作者:
易小学生
时间:
2018-11-2 14:15
领取LZ的1JB
作者:
longsui48
时间:
2018-11-2 14:21
666 领币咯
作者:
星空Allstar
时间:
2018-11-2 14:39
领取LZ的1JB
作者:
178826559
时间:
2018-11-2 15:07
谢谢分享!
作者:
178826559
时间:
2018-11-2 15:08
每个人能回复几贴呀?
作者:
sanfeng
时间:
2018-11-2 15:08
提示:
作者被禁止或删除 内容自动屏蔽
作者:
玩导弹的驴
时间:
2018-11-2 15:23
小手一抖 精B到手
作者:
下一页·
时间:
2018-11-2 15:45
支持一下 支持开源
作者:
kagari
时间:
2018-11-2 16:02
支持开源
作者:
珍藏版
时间:
2018-11-2 16:03
谢谢分享
作者:
幻源
时间:
2018-11-2 16:05
感谢分享!!
作者:
hgy19880905
时间:
2018-11-2 17:36
特意开源此模块,无需精币,
作者:
naiwenmoer1
时间:
2018-11-2 18:05
感谢分享!!
作者:
吾乐乐
时间:
2018-11-2 18:31
本帖最后由 吾乐乐 于 2018-11-2 18:34 编辑
解析方面可参考带有识别规则的阅读器如:小强 书荒
作者:
玩撸啊撸的男神
时间:
2018-11-2 18:36
特意开源此模块,无需精币,
作者:
cqs321
时间:
2018-11-2 18:42
感谢分享!!
作者:
f100long
时间:
2018-11-2 19:49
努力学习天天向上
作者:
yibey
时间:
2018-11-2 19:57
不错好东西
作者:
yxl2008
时间:
2018-11-2 20:11
6666,感谢分享学习!
作者:
18846816194
时间:
2018-11-2 20:14
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!
作者:
天机玄狐
时间:
2018-11-2 20:25
好东西,先谢了!!!!!!!!!!!!!!!!
作者:
帝皇
时间:
2018-11-2 20:29
支持原创开源!
作者:
HEZ小白
时间:
2018-11-2 21:49
不错,可以参考参考
作者:
平凡的厌世者
时间:
2018-11-2 22:25
2333333333
作者:
汉族
时间:
2018-11-2 22:43
看着不错 主要是 小说站 支持了
作者:
su911
时间:
2018-11-2 23:24
集_功能以及后面的程序集和类,删掉窗
口
作者:
南风窗
时间:
2018-11-3 00:15
为了+1进来的。
作者:
友情20086
时间:
2018-11-3 00:55
6666666666666666666666666
作者:
vrrhrb
时间:
2018-11-3 00:56
学习学习学习学习
作者:
4slajfpahf
时间:
2018-11-3 03:40
看看好不好用
作者:
xshn
时间:
2018-11-3 07:27
感谢分享,起点的行吗?
作者:
wanzhenghe999
时间:
2018-11-3 09:35
感谢分享,值得敬重~
作者:
网络注册会员
时间:
2018-11-3 09:43
学习了支持一下
作者:
hellohexiang
时间:
2018-11-3 10:01
感谢分享
作者:
3174219976
时间:
2018-11-3 10:07
121245484511456
作者:
麦咖啡
时间:
2018-11-3 10:23
完全的优秀
作者:
mykoo
时间:
2018-11-3 10:32
论坛里个个都是人才,说话又好听,太喜欢了
作者:
cnxmal
时间:
2018-11-3 12:31
说话又好听,太喜欢
作者:
久伴我驻我心
时间:
2018-11-3 15:56
学习学习
作者:
谢谢,你是个好
时间:
2018-11-3 16:33
感谢大佬分享!!
作者:
星创keke
时间:
2018-11-4 02:45
111111111111111111111
作者:
没有细胞的人
时间:
2018-11-4 08:48
66666666666666666
作者:
xo37
时间:
2018-11-4 10:07
适合追书的自己用,哈哈……
作者:
草草软件
时间:
2018-11-4 14:33
提示:
作者被禁止或删除 内容自动屏蔽
作者:
qq2010108288
时间:
2018-11-4 21:41
看起来还不错,支持一下
作者:
1929791319
时间:
2018-11-4 21:50
谢谢分享学习
作者:
E族X
时间:
2018-11-5 02:15
路过拿币
作者:
钟情
时间:
2018-11-5 09:14
看看,谢谢分享
作者:
孤戾
时间:
2018-11-5 09:51
看看,谢谢分享
作者:
韦贝贝
时间:
2018-11-5 12:07
感谢你的分享
作者:
酷易自绘
时间:
2018-11-5 12:45
感谢你的分享
作者:
努努
时间:
2018-11-5 13:05
感谢分享~~!
作者:
易易语
时间:
2018-11-5 14:08
用不到,先记住了。。。感谢分享。。。
作者:
gudandexuan
时间:
2018-11-5 15:13
感谢你的分享
作者:
kk9801
时间:
2018-11-5 16:58
感谢楼主分享
作者:
王则
时间:
2018-11-5 18:08
拿走学习学习~~~~~~~
作者:
xslwajd
时间:
2018-11-6 00:01
易语言连接MYSQL数据库实现完美登录zc
作者:
mzhsohu
时间:
2018-11-6 00:29
感谢分享~!
作者:
hatsunemiku
时间:
2018-11-6 09:25
创】小说站点html解析模块
作者:
deepblue
时间:
2018-11-6 09:42
支持一下支持一下
作者:
精易神
时间:
2018-11-6 11:48
势必qwq我是来HJJB的
作者:
江南风飞扬
时间:
2018-11-6 13:03
#在这里快速回复#支持开源,谢谢分享
作者:
xiaxiye
时间:
2018-11-6 13:39
谢谢分享 感谢分享1
作者:
yinghao2005
时间:
2018-11-6 15:35
感谢分享不错哦
作者:
lzhaitao
时间:
2018-11-6 16:35
来看看怎样
作者:
陈宁
时间:
2018-11-6 20:00
感谢开源!
作者:
caoljie
时间:
2018-11-6 21:31
有具体例子没。看看
作者:
唯美主义
时间:
2018-11-6 21:52
支持开源!!!
作者:
sampo
时间:
2018-11-6 21:55
感谢楼主分享
作者:
薄荷牛奶
时间:
2018-11-6 22:29
#在这里快速回复#支持开源,谢谢分享
作者:
hangyubin
时间:
2018-11-7 11:28
谢谢楼主开源分享!
作者:
1147828541
时间:
2018-11-7 12:00
说站点html解析模
作者:
sunj781
时间:
2018-11-7 21:25
谢谢分享。
作者:
huat
时间:
2018-11-8 09:55
666666666666666666
作者:
三三三
时间:
2018-11-8 10:17
谢谢分享。
作者:
hanson1025
时间:
2018-11-8 11:37
好东西啊。!!!!!!!!!!!!!!!
作者:
52jzy
时间:
2018-11-8 12:54
顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶
作者:
liuguiquan2008
时间:
2018-11-8 21:06
小说站点html解析模块
作者:
Ψ恋上金牛座
时间:
2018-11-8 23:49
好东西啊。感谢~~~
作者:
luoran
时间:
2018-11-9 12:58
【原创】小说站点html解析模块
作者:
小小W
时间:
2018-11-10 15:15
这个看小说方便。
作者:
by:凌枫
时间:
2018-11-10 16:40
这个看小说方便。
作者:
Zhuizhuguoer
时间:
2018-11-11 09:03
感谢分享6666666666666
作者:
下下魔鬼
时间:
2018-11-11 13:07
提示:
作者被禁止或删除 内容自动屏蔽
作者:
4slajfpahf
时间:
2018-11-12 04:44
感谢分享6666666666666
作者:
yunying
时间:
2018-11-15 14:49
提示:
作者被禁止或删除 内容自动屏蔽
作者:
85888144
时间:
2018-11-20 12:30
这个必须支持一下
作者:
初学者印
时间:
2018-11-22 02:17
刚好需要下载看看
作者:
xz1993
时间:
2018-12-1 20:22
先在解析html前需要导入书源 也就是调用书源初始化() 通过组合框根据站点名切换书源 然后在软件搜索框输入关键字 程序根据当前书源的搜索网址,通过搜索页处理()得到搜索页信息(具体成员名参见附件里面的【说明文件.txt】) 然后双击选择某本书籍通过书籍页处理()得到书籍页,同时通过目录页处理()得到目录页信息(也就是章节名称和章节链接) 最后根据章节链接进行内容页处理()可以变成纯净的在线阅读或者根据章节链接直接下载(比如鱼刺多线程下载)
作者:
南风窗
时间:
2019-1-3 09:17
这个不错,可以参考。
作者:
xy1002
时间:
2019-7-20 22:28
666666666666666666666666666666
作者:
阳明先生
时间:
2021-11-3 23:46
作者:
大白图
时间:
2021-11-3 23:46
作者:
海豚是个萨比
时间:
2022-6-14 20:43
做的很好,支持一下66666666666
作者:
这名字好棒
时间:
2022-8-12 17:06
感谢大佬分享
作者:
ys2yy
时间:
2024-11-5 00:46
支持开源~!感谢分享
作者:
fb2002
时间:
2025-1-2 11:07
小说音乐类我都喜欢
作者:
step
时间:
2025-1-16 09:43
支持开源~!感谢分享
欢迎光临 精易论坛 (https://125.confly.eu.org/)
Powered by Discuz! X3.4