王维林

B93F 2023-03-09 16:42

只看该作者 | | 小中大

改图片规则了，站点的下载器抓取用idm都无法自动下载

顶端

三碗不能肛

B94F 2023-03-09 19:07

| ▼展开

只看该作者 | | 小中大

新锐战舰

B95F 2023-03-09 19:58

mark

| ▼展开

只看该作者 | | 小中大

油炸大虾

B96F 2023-03-09 20:20

只看该作者 | | 小中大

回 93楼(王维林) 的帖子

你是说我推荐的 Kemono批量下载 [IDM] 么？

顶端

otkg

B97F 2023-03-09 20:47

| ▼展开

只看该作者 | | 小中大

所罗门大卡车

B98F 2023-03-10 19:57

mark

| ▼展开

只看该作者 | | 小中大

db758c6a

B99F 2023-03-10 20:01

只看该作者 | | 小中大

用户被禁言,该主题自动屏蔽!

顶端

weweixiao

B100F 2023-03-10 21:18

mark

| ▼展开

只看该作者 | | 小中大

damedame

B101F 2023-03-10 21:50

只看该作者 | | 小中大

回 39楼(RRUUDJDJ) 的帖子

谢谢推荐，今天试了试JDownloader2发现确实好用，特别是能直接嗅探下载kemono帖子中的谷歌盘资源(而且绿色便携)
不过折腾一会儿后发现有些文件下载位置不对，且丢失名字(比如原名是1.jpg，错误的文件名是jpg)

测试链接：https://kemono.party/fanbox/user/7484613/post/5340139
图片：

我的规则是这样的
下载目录：
Downloads\<jd:prop:userid>\<jd:prop:date><jd:prop:title>\
文件名：
<jd:prop:postContentIndex>.<jd:orgfiletype>

顶端

8260365e

B102F 2023-03-11 03:32

（图床教程 - https://level-plus.net/read.php?tid-2046937.html）

只看该作者 | | 小中大

回 101楼(damedame) 的帖子

jpg和jpg_2那两个文件相当于抓取了缩略图和重复的0.jpg，kemono改动过一次页面，插件把post里来自kemono的图片链接也嗅探导致的，这个问题应该在内部版本被修正了，不会编译的话就等等下一次内核更新吧
https://board.jdownloader.org/showthread.php?s=b57cdf1621ebfce810cbcccfc395b552&t=86792&page=3
更新之前可以做的：
如果不需要自动爬取网盘链接的话可以通过插件页面找到kemono插件取消「Crawl http links in post text」勾选防止无效爬取
如果一定要爬取的话，可以设置下过滤器过滤掉这些烦人的文件
通过观察可以添加以下两条「下载url - 包含」规则
https://(.*?)\.kemono\.party/data/.*
https://kemono\.party/thumbnail/data/.*
注意需要把右边的星号打勾以启用正则匹配
第一条表示过滤掉重复的文件，第二条表示过滤掉缩略图
第一条不会过滤掉规则奏效的文件，是因为观察到那个副本文件的下载链接都是c??.kemono.party开头，而jd爬取的连接无c??.开头
不过如果kemono再做页面改动可能还需要继续做出变通

zip那个文件，猜测是因为google drive和kemono用的插件不一样，来源于kemono里的属性不被google drive继承导致<jd:prop:title>这些标签不能被那个压缩包使用，有条件可以去论坛反馈给开发者并给出例子让他增加需要的功能
如果还是要抓取站外链接的话，妥协的办法：包装器增加一条规则，在原来的规则之后
条件为「下载url - 不包含 - kemono.party」；「源urls - 包含 - kemono.party」；
动作为「下载目录 - <jd:orgpackagename>」；「文件名 - <jd:orgfilename>」
原来的规则增加条件「下载url - 包含 - kemono.party」
并修改动作「下载目录 - <jd:orgpackagename>」
这样可以让google drive的文件保持文件名且和kemono下的文件置于同一文件夹了
缺点是文件夹只能是默认，不过文件名还是能用<jd:prop:date>这些标签的

后面测试了下爬取作者页面的时候又会失效，建议就只保持来自kemono的文件的文件夹结构，外链就全部放到同一个文件夹好了

至于txt那个文件其实就是Content的文本信息，如果不需要可以改插件页面的「Select text crawl mode」为「Never」永远不抓取，要保留也可以同理修改包装器的规则达成我这边就没有试了

顶端