FictionDown(网络小说爬取工具) V0.1.2官方版
- 软件大小:4.5MB
- 更新日期:2020-11-24
- 软件语言:简体中文
- 软件授权:国产软件
- 软件热度:条
- 官方网站:暂无
- 适用平台:WinAll/
FictionDown是一款网文爬取专用工具,支持全自动校对、多格式转化,处理章节目录缺少和章节目录次序紊乱的难题,内嵌了简易的广告过滤,事实上绝大多数必须手动式删掉!
【软件特点】
以起点为样版,多网站线程同步爬取校对
支持导出来txt,以兼容大部分阅读软件
支持导出来markdown,可以用pandoc转化成epub,保存书籍信息、卷构造、创作者信息
内嵌简易的广告过滤(如今还不健全)
用Golang撰写,安裝布署便捷,外界依靠仅有PhantomJS
【操作方法】
键入起点连接
获得到书籍信息,刚开始爬取各章內容,碰到vip章节目录放进Example中做为校对样版
手动式设定笔趣阁等盗用小说集的相匹配连接,tamp字段名
再度起动,刚开始爬取,只爬取VIP一部分,并跟Example开展校对
手动式编写相匹配的缓存,手动式删掉广告宣传和一些任意标识符(有一部分是关键词,很有可能会造成 pandoc内存溢出或是款式不正确)
d -f md形成markwown
用pandoc转化成epub,pandoc -o xxxx.epub xxxx.md
【功能介绍】
未完成作用
爬取起点的情况下携带Cookie,用以爬取已选购章节目录
支持刺猬猫(即“欢乐书客”)
支持立即輸出epub,不用pandoc
支持小说集站内关键字搜索
线程同步变换md
梳理main库中的鲜面条逻辑性
梳理命令行参数设计风格
在windows下,md变换到epub时有途径难题
健全广告过滤
简单化应用流程
提升log輸出
书籍介绍也应当为HTML。即lt;pgt;??lt;/pgt;而不是如今的用t和n
【版本更新】
小说集站内关键字搜索
cmd梳理
改动网站搭配构造
每个輸出文件格式稍作梳理