精易论坛

标题: 【原创】小说站点html解析模块 [打印本页]

作者: zl2017    时间: 2018-11-2 12:13
标题: 【原创】小说站点html解析模块
1.模块说明
本小说解析模块,调用海绵宝宝elss6.01引擎(论坛搜elss即可)进行html解析(采用xpath表达式)
封装了一些处理小说站点html网页信息的子程序,
可以利用本模块来轻松制作一个可换源的阅读软件。



2.模块子程序自定义类型数据介绍以及制作阅读软件简单设计思路
这里将处理小说站点html信息的采集规则书源
书源的成员大致可分为以下几大类(具体成员名参见附件里面的【说明文件.txt】)
书源名称、书源网址、搜索网址、搜索页处理规则,书籍介绍页处理规则,目录页处理规则,章节内容页处理规则

目前采用json格式文本保存书源。(参见附件里面的【书源default.txt】)


首先在解析html前需要导入书源
也就是调用书源初始化()
通过组合框根据站点名切换书源
然后在软件搜索框输入关键字
程序根据当前书源的搜索网址,通过搜索页处理()得到搜索页信息(具体成员名参见附件里面的【说明文件.txt】)
然后双击选择某本书籍通过书籍页处理()得到书籍页,同时通过目录页处理()得到目录页信息(也就是章节名称和章节链接)
最后根据章节链接进行内容页处理()可以变成纯净的在线阅读或者根据章节链接直接下载(比如鱼刺多线程下载)


dll文件habo检测链接:
https://habo.qq.com/file/showdetail?pk=ADQGb11tB2QIOVs8U2Y%3D


注意:为了方便测试模块和demo合二为一了
可以将原文件复制一份,删掉程序集_功能以及后面的程序集和类,删掉窗口和临时子程序这样就是纯模块了

今天刚好注册满一周年,
所以特意开源此模块,无需精币,附件回复可见。
[hide=d90] elss解析小说网站.rar (248.98 KB, 下载次数: 268) [/hide]










作者: 风里刀    时间: 2018-11-2 14:05
领取LZ的1JB
作者: 易小学生    时间: 2018-11-2 14:15
领取LZ的1JB
作者: longsui48    时间: 2018-11-2 14:21
666  领币咯
作者: 星空Allstar    时间: 2018-11-2 14:39
领取LZ的1JB
作者: 178826559    时间: 2018-11-2 15:07
谢谢分享!
作者: 178826559    时间: 2018-11-2 15:08
每个人能回复几贴呀?
作者: sanfeng    时间: 2018-11-2 15:08
提示: 作者被禁止或删除 内容自动屏蔽
作者: 玩导弹的驴    时间: 2018-11-2 15:23
小手一抖 精B到手
作者: 下一页·    时间: 2018-11-2 15:45
支持一下 支持开源
作者: kagari    时间: 2018-11-2 16:02
支持开源                  
作者: 珍藏版    时间: 2018-11-2 16:03
谢谢分享
作者: 幻源    时间: 2018-11-2 16:05
感谢分享!!
作者: hgy19880905    时间: 2018-11-2 17:36
特意开源此模块,无需精币,
作者: naiwenmoer1    时间: 2018-11-2 18:05
感谢分享!!
作者: 吾乐乐    时间: 2018-11-2 18:31
本帖最后由 吾乐乐 于 2018-11-2 18:34 编辑

解析方面可参考带有识别规则的阅读器如:小强 书荒
作者: 玩撸啊撸的男神    时间: 2018-11-2 18:36
特意开源此模块,无需精币,
作者: cqs321    时间: 2018-11-2 18:42
感谢分享!!
作者: f100long    时间: 2018-11-2 19:49
努力学习天天向上

作者: yibey    时间: 2018-11-2 19:57
不错好东西

作者: yxl2008    时间: 2018-11-2 20:11
6666,感谢分享学习!
作者: 18846816194    时间: 2018-11-2 20:14
拒绝任何人以任何形式在本论坛发表与中华人民共和国法律相抵触的言论,本站内容均为会员发表,并不代表精易立场!

作者: 天机玄狐    时间: 2018-11-2 20:25
好东西,先谢了!!!!!!!!!!!!!!!!

作者: 帝皇    时间: 2018-11-2 20:29
支持原创开源!
作者: HEZ小白    时间: 2018-11-2 21:49
不错,可以参考参考
作者: 平凡的厌世者    时间: 2018-11-2 22:25
2333333333

作者: 汉族    时间: 2018-11-2 22:43
看着不错 主要是 小说站  支持了
作者: su911    时间: 2018-11-2 23:24
集_功能以及后面的程序集和类,删掉窗

作者: 南风窗    时间: 2018-11-3 00:15
为了+1进来的。
作者: 友情20086    时间: 2018-11-3 00:55
6666666666666666666666666

作者: vrrhrb    时间: 2018-11-3 00:56
学习学习学习学习

作者: 4slajfpahf    时间: 2018-11-3 03:40
看看好不好用
作者: xshn    时间: 2018-11-3 07:27
感谢分享,起点的行吗?
作者: wanzhenghe999    时间: 2018-11-3 09:35
感谢分享,值得敬重~
作者: 网络注册会员    时间: 2018-11-3 09:43
学习了支持一下
作者: hellohexiang    时间: 2018-11-3 10:01
感谢分享
作者: 3174219976    时间: 2018-11-3 10:07
121245484511456

作者: 麦咖啡    时间: 2018-11-3 10:23
完全的优秀
作者: mykoo    时间: 2018-11-3 10:32
论坛里个个都是人才,说话又好听,太喜欢了

作者: cnxmal    时间: 2018-11-3 12:31
说话又好听,太喜欢
作者: 久伴我驻我心    时间: 2018-11-3 15:56
学习学习

作者: 谢谢,你是个好    时间: 2018-11-3 16:33
感谢大佬分享!!

作者: 星创keke    时间: 2018-11-4 02:45
111111111111111111111
作者: 没有细胞的人    时间: 2018-11-4 08:48
66666666666666666
作者: xo37    时间: 2018-11-4 10:07
适合追书的自己用,哈哈……
作者: 草草软件    时间: 2018-11-4 14:33
提示: 作者被禁止或删除 内容自动屏蔽
作者: qq2010108288    时间: 2018-11-4 21:41
看起来还不错,支持一下
作者: 1929791319    时间: 2018-11-4 21:50
谢谢分享学习


作者: E族X    时间: 2018-11-5 02:15
路过拿币
作者: 钟情    时间: 2018-11-5 09:14
看看,谢谢分享
作者: 孤戾    时间: 2018-11-5 09:51
看看,谢谢分享


作者: 韦贝贝    时间: 2018-11-5 12:07
感谢你的分享
作者: 酷易自绘    时间: 2018-11-5 12:45
感谢你的分享

作者: 努努    时间: 2018-11-5 13:05
感谢分享~~!
作者: 易易语    时间: 2018-11-5 14:08
用不到,先记住了。。。感谢分享。。。
作者: gudandexuan    时间: 2018-11-5 15:13

感谢你的分享
作者: kk9801    时间: 2018-11-5 16:58
感谢楼主分享   

作者: 王则    时间: 2018-11-5 18:08
拿走学习学习~~~~~~~

作者: xslwajd    时间: 2018-11-6 00:01
易语言连接MYSQL数据库实现完美登录zc
作者: mzhsohu    时间: 2018-11-6 00:29
感谢分享~!
作者: hatsunemiku    时间: 2018-11-6 09:25
创】小说站点html解析模块

作者: deepblue    时间: 2018-11-6 09:42
支持一下支持一下

作者: 精易神    时间: 2018-11-6 11:48
势必qwq我是来HJJB的
作者: 江南风飞扬    时间: 2018-11-6 13:03
#在这里快速回复#支持开源,谢谢分享
作者: xiaxiye    时间: 2018-11-6 13:39
谢谢分享 感谢分享1

作者: yinghao2005    时间: 2018-11-6 15:35
感谢分享不错哦

作者: lzhaitao    时间: 2018-11-6 16:35
来看看怎样
作者: 陈宁    时间: 2018-11-6 20:00
感谢开源!

作者: caoljie    时间: 2018-11-6 21:31
有具体例子没。看看

作者: 唯美主义    时间: 2018-11-6 21:52
支持开源!!!
作者: sampo    时间: 2018-11-6 21:55
感谢楼主分享
作者: 薄荷牛奶    时间: 2018-11-6 22:29

#在这里快速回复#支持开源,谢谢分享
作者: hangyubin    时间: 2018-11-7 11:28
谢谢楼主开源分享!


作者: 1147828541    时间: 2018-11-7 12:00
说站点html解析模
作者: sunj781    时间: 2018-11-7 21:25
谢谢分享。
作者: huat    时间: 2018-11-8 09:55
666666666666666666
作者: 三三三    时间: 2018-11-8 10:17
谢谢分享。
作者: hanson1025    时间: 2018-11-8 11:37
好东西啊。!!!!!!!!!!!!!!!
作者: 52jzy    时间: 2018-11-8 12:54
顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶顶

作者: liuguiquan2008    时间: 2018-11-8 21:06
小说站点html解析模块

作者: Ψ恋上金牛座    时间: 2018-11-8 23:49
好东西啊。感谢~~~
作者: luoran    时间: 2018-11-9 12:58
【原创】小说站点html解析模块
作者: 小小W    时间: 2018-11-10 15:15
这个看小说方便。
作者: by:凌枫    时间: 2018-11-10 16:40
这个看小说方便。
作者: Zhuizhuguoer    时间: 2018-11-11 09:03
感谢分享6666666666666
作者: 下下魔鬼    时间: 2018-11-11 13:07
提示: 作者被禁止或删除 内容自动屏蔽
作者: 4slajfpahf    时间: 2018-11-12 04:44
感谢分享6666666666666
作者: yunying    时间: 2018-11-15 14:49
提示: 作者被禁止或删除 内容自动屏蔽
作者: 85888144    时间: 2018-11-20 12:30
这个必须支持一下
作者: 初学者印    时间: 2018-11-22 02:17
刚好需要下载看看
作者: xz1993    时间: 2018-12-1 20:22
先在解析html前需要导入书源 也就是调用书源初始化() 通过组合框根据站点名切换书源 然后在软件搜索框输入关键字 程序根据当前书源的搜索网址,通过搜索页处理()得到搜索页信息(具体成员名参见附件里面的【说明文件.txt】) 然后双击选择某本书籍通过书籍页处理()得到书籍页,同时通过目录页处理()得到目录页信息(也就是章节名称和章节链接) 最后根据章节链接进行内容页处理()可以变成纯净的在线阅读或者根据章节链接直接下载(比如鱼刺多线程下载)
作者: 南风窗    时间: 2019-1-3 09:17
这个不错,可以参考。
作者: xy1002    时间: 2019-7-20 22:28
666666666666666666666666666666
作者: 阳明先生    时间: 2021-11-3 23:46

作者: 大白图    时间: 2021-11-3 23:46

作者: 海豚是个萨比    时间: 2022-6-14 20:43
做的很好,支持一下66666666666
作者: 这名字好棒    时间: 2022-8-12 17:06
感谢大佬分享
作者: ys2yy    时间: 2024-11-5 00:46
支持开源~!感谢分享
作者: fb2002    时间: 2025-1-2 11:07
小说音乐类我都喜欢
作者: step    时间: 2025-1-16 09:43
支持开源~!感谢分享




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4