精易论坛

标题: FictionDown 小说下载器 支持校对和广告过滤 [打印本页]

作者: 9a6c5609806a    时间: 2020-2-19 15:34
标题: FictionDown 小说下载器 支持校对和广告过滤
本帖最后由 9a6c5609806a 于 2020-2-19 16:25 编辑

使用Golang编写,为命令行界面(CLI)程序,无GUIGithub地址: https://github.com/ma6254/FictionDown/

FictionDown


用于批量下载盗版网络小说,该软件仅用于数据分析的样本采集,请勿用于其他用途


该软件所产生的文档请勿传播,请勿用于数据评估外的其他用途


License

release_version

last-commit

Download Count


godoc

QQ 群


Go

travis-ci

Go Report Card


特性



站点支持
















































































站点名称 网址 是否正版 是否分卷 支持站内搜索 代码文件
起点中文网 www.qidian.com site\qidian.go
笔趣阁 www.biquge5200.cc site\biquge.go
笔趣阁 5200 www.bqg5200.com site\biquge2.go
笔趣阁 www.biqiuge.com ⚠️ site\biquge3.go
顶点小说 www.booktxt.net site\dingdian1.go
新八一中文网 www.81new.com site\81new.go
书迷楼 www.shumil.co site\shumil_co.go
完本神站 www.wanbentxt.com site\wanbentxt_com.go

使用注意



工作流程



  1. 输入起点链接

  2. 获取到书本信息,开始爬取每章内容,遇到 vip 章节放入Example中作为校对样本

  3. 手动设置笔趣阁等盗版小说的对应链接,tamp字段

  4. 再次启动,开始爬取,只爬取 VIP 部分,并跟Example进行校对

  5. 手动编辑对应的缓存文件,手动删除广告和某些随机字符(有部分是关键字,可能会导致 pandoc 内存溢出或者样式错误)

  6. conv -f md生成 markwown

  7. 用 pandoc 转换成 epub,pandoc -o xxxx.epub xxxx.md


Example


> ./FictionDown --url https://book.qidian.com/info/3249362 d # 获取正版信息

# 有时会发生`not match volumes`的错误,请启用Chromedp或者PhantomJS
# Use Chromedp
> ./FictionDown --url https://book.qidian.com/info/3249362 -d chromedp d
# Use PhantomJS
> ./FictionDown --url https://book.qidian.com/info/3249362 -d phantomjs d

> vim 一世之尊.FictionDown # 加入盗版小说链接
> ./FictionDown -i 一世之尊.FictionDown d # 获取盗版内容
# 爬取完毕就可以输出可阅读的文档了
> ./FictionDown -i 一世之尊.FictionDown conv -f txt
# 转换成epub有两种方式
# 1.输出markdown,再用pandoc转换成epub
> ./FictionDown -i 一世之尊.FictionDown conv -f md
> pandoc -o 一世之尊.epub 一世之尊.md
# 某些阅读器需要对章节进行定位,需要加上--epub-chapter-level=2
> pandoc -o 一世之尊.epub --epub-chapter-level=2 一世之尊.md
# 2.直接输出epub(调用Pandoc)
> ./FictionDown -i 一世之尊.FictionDown conv -f epub

现在支持小说站内搜索,可以不用手动填入了


> ./FictionDown --url https://book.qidian.com/info/3249362 d # 获取正版信息

# 有时会发生`not match volumes`的错误,请启用Chromedp或者PhantomJS
# Use Chromedp
> ./FictionDown --url https://book.qidian.com/info/3249362 --driver chromedp d
# Use PhantomJS
> ./FictionDown --url https://book.qidian.com/info/3249362 --driver phantomjs d

> ./FictionDown -i 一世之尊.FictionDown s -k 一世之尊 -p # 搜索然后放入
> ./FictionDown -i 一世之尊.FictionDown d # 获取盗版内容
# 爬取完毕就可以输出可阅读的文档了
> ./FictionDown -i 一世之尊.FictionDown conv -f txt
# 转换成epub有两种方式
# 1.输出markdown,再用pandoc转换成epub
> ./FictionDown -i 一世之尊.FictionDown conv -f md
> pandoc -o 一世之尊.epub 一世之尊.md
# 2.直接输出epub(某些阅读器会报错)
> ./FictionDown -i 一世之尊.FictionDown conv -f epub

未实现



Usage


NAME:
   FictionDown - https://github.com/ma6254/FictionDown

USAGE:
    [global options] command [command options] [arguments...]

AUTHOR:
   ma6254 <[email protected]>

COMMANDS:
     download, d, down  下载缓存文件
     check, c, chk      检查缓存文件
     edit, e            对缓存文件进行手动修改
     convert, conv      转换格式输出
     pirate, p          检索盗版站点
     search, s          检索盗版站点
     help, h            Shows a list of commands or help for one command

GLOBAL OPTIONS:
   -u value, --url value     图书链接
   --tu value, --turl value  资源网站链接
   -i value, --input value   输入缓存文件
   --log value               log file path
   --driver value, -d value  请求方式,support: none,phantomjs,chromedp
   --help, -h                show help
   --version, -v             print the version

安装和编译


程序为单执行文件,命令行 CLI 界面


包管理为 gomod


go get github.com/ma6254/FictionDown

交叉编译这几个平台的可执行文件:linux/arm linux/amd64 darwin/amd64 windows/amd64


make multiple_build










补充内容 (2020-2-20 14:06):
补充下已编译好的可执行文件,TX微云链接:https://share.weiyun.com/5l6rRtN
作者: 先锋小七    时间: 2020-2-19 21:17
这个论坛懂go的并不多,一个部署编译的环境就卡死一批人
作者: whisk    时间: 2020-2-19 22:05
牛皮 懂Go的确实不多
作者: 幻源    时间: 2020-2-20 22:58
哟呵GO友
作者: ck66    时间: 2020-2-22 10:05
66666   用go语言写的
作者: 列明    时间: 2020-2-24 22:09
不是易語言的呀!
作者: 啸龙在天    时间: 2020-2-25 16:50
运行直接闪退,86wind7是什么原因啊?
作者: 9a6c5609806a    时间: 2020-2-25 20:55
啸龙在天 发表于 2020-2-25 16:50
运行直接闪退,86wind7是什么原因啊?

命令行CLI的
作者: 9a6c5609806a    时间: 2020-2-25 20:55
列明 发表于 2020-2-24 22:09
不是易語言的呀!

是的,Golang的
作者: 得意须尽欢    时间: 2021-2-4 17:55
666666666666666666666666666666666666
作者: 点点丶滴滴    时间: 2021-2-5 08:35
路过围观一下,顺便帮顶
作者: lxh1230    时间: 2021-8-2 15:48
666666666666666666666666666
作者: linchen12306    时间: 2021-8-4 00:44
技能牛笔啊




欢迎光临 精易论坛 (https://125.confly.eu.org/) Powered by Discuz! X3.4