jpg和jpg_2那两个文件相当于抓取了缩略图和重复的0.jpg,kemono改动过一次页面,插件把post里来自kemono的图片链接也嗅探导致的,这个问题应该在内部版本被修正了,不会编译的话就等等下一次内核更新吧
https://board.jdownloader.org/showthread.php?s=b57cdf1621ebfce810cbcccfc395b552&t=86792&page=3更新之前可以做的:
如果不需要自动爬取网盘链接的话可以通过插件页面找到kemono插件取消「Crawl http links in post text」勾选防止无效爬取
如果一定要爬取的话,可以设置下过滤器过滤掉这些烦人的文件
通过观察可以添加以下两条「下载url - 包含」规则
https://(.*?)\.kemono\.party/data/.*
https://kemono\.party/thumbnail/data/.*
注意需要把右边的星号打勾以启用正则匹配
第一条表示过滤掉重复的文件,第二条表示过滤掉缩略图
第一条不会过滤掉规则奏效的文件,是因为观察到那个副本文件的下载链接都是c??.kemono.party开头,而jd爬取的连接无c??.开头
不过如果kemono再做页面改动可能还需要继续做出变通
zip那个文件,猜测是因为google drive和kemono用的插件不一样,来源于kemono里的属性不被google drive继承导致<jd:prop:title>这些标签不能被那个压缩包使用,有条件可以去论坛反馈给开发者并给出例子让他增加需要的功能
如果还是要抓取站外链接的话,妥协的办法:
包装器增加一条规则,在原来的规则之后
条件为「下载url - 不包含 - kemono.party」;「源urls - 包含 - kemono.party」;
动作为「下载目录 - <jd:orgpackagename>」;「文件名 - <jd:orgfilename>」
原来的规则增加条件「下载url - 包含 - kemono.party」
并修改动作「下载目录 - <jd:orgpackagename>」
这样可以让google drive的文件保持文件名且和kemono下的文件置于同一文件夹了
缺点是文件夹只能是默认,不过文件名还是能用<jd:prop:date>这些标签的后面测试了下爬取作者页面的时候又会失效,建议就只保持来自kemono的文件的文件夹结构,外链就全部放到同一个文件夹好了
至于txt那个文件其实就是Content的文本信息,如果不需要可以改插件页面的「Select text crawl mode」为「Never」永远不抓取,要保留也可以同理修改包装器的规则达成我这边就没有试了