Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

关于在Getchu刮削里番时,使用“JANコード”作为关键词时会被无条件视为“无码”作品的问题。 #110

Closed
3 tasks done
auroracamus opened this issue Feb 28, 2024 · 4 comments
Labels
bug Something isn't working

Comments

@auroracamus
Copy link

auroracamus commented Feb 28, 2024

在提问之前...

  • 我已经搜索了现有的 issues
  • 我在提问题之前至少花费了 5 分钟来思考和准备
  • 我正在使用最新版本

描述你的问题

在Getchu刮削里番时,如果使用标题、品番作为关键词,有时无法获得正确的结果,但使用“JANコード”作为关键词则非常准确。

不过在使用“JANコード”作为关键词时,会被软件无条件的标为“无码”作品,且我暂时没有找到解决办法。

如何复现

1、将任意文件以“JANコード”作为文件名,例如:“4562215333534.mp4”(这是个有码作品)。
2、进行削刮
3、标签内会出现“無碼”字样,根据设置文件,图片也会被打上相应logo,文件名内也会出现相应标记。

预期行为

No response

相关 Logs

Create log file: X:\MDCx\Log\2024-02-29-03-32-23.txt

 🛠 当前配置:X:\MDCx\HAnime.ini 加载完成!
 📂 程序目录:X:\MDCx 
 📂 刮削目录:X:\MDCx 
 💠 刮削模式:正常模式 · 指定网站 · getchu 
 🖥️ 系统信息:Windows-10-10.0.22621-SP0 
 🐰 软件版本:120240220 

 ❌ JavDb 未填写 Cookie,影响 FC2 刮削!可在「设置」-「网络」添加!
基于 MDC-GUI 修改 · 当前版本: 120240220 ( <font color="green">你使用的是最新版本!🎉 </font>)
================================================================================
 ✅ 数据库连接成功, 共有 20783 条女优信息
 ❌ ThePornDB 未填写 API Token,影响欧美刮削!可在「设置」-「网络」添加!
 ✅ JavBus 连接正常!

 ⏰ Start time: 2024-02-29 03:33:43
 🖥 Movie path: X:\MDCx
 🔎 Searching all videos, Please wait...
    Done!!! Found (1)! Skip successfully scraped (0) repeat softlink (0)! (0s)  
 📺 Find 1 movies
 🕷 开启多线程,线程数量(1),线程延时(3)秒...
<font color="brown"> 🍯 间歇刮削 已启用,连续刮削 20 个文件后,将自动休息 62 秒...</font>
 🕷 03:33:43 开始刮削:1/1 4562215333534 字幕.mkv

1/1 (100.00%) round(1) 4562215333534 字幕.mkv
================================================================================
 🙈 [Movie] X:\MDCx\4562215333534 字幕.mkv
 🚘 [Number] 4562215333534
 😸 [Note] You specified 「 getchu 」, some videos may not have results! 
    🌐 getchu
       搜索地址: http://www.getchu.com/php/search.phtml?genre=all&search_keyword=4562215333534&gc=gc 
       番号地址: http://www.getchu.com/soft.phtml?id=784048&gc=gc 
       数据获取成功!
 🌐 [website] getchu(1s)
 🍀 Data done!(1s)
 🍀 Folder done! (new)
 🍀 Thumb done! (getchu)(1s) 
 🍀 Fanart done! (copy thumb)(0s)
 🍀 Poster done! (getchu)(0s)
 🍀 Thumb delete done!
 🍀 Poster add watermark: 字幕,无码!
 🍀 Fanart add watermark: 字幕,无码!
 🍀 Nfo done! (new)(0s)
 🍀 Sub done!
 🍀 Movie done! 
 🙉 [Movie] X:\MDCx\JAV_output\[魔人][2013-11-29][ACJDL0007-U-C][黒獣(クロイヌ)〜気高き聖女は白濁に染まる〜 〜カグヤ×ルー·ルー×マイア 柔肌に蠢く蟲、猛り狂う野獣達の夜編〜]\[2013-11-29][ACJDL0007-U-C][黒獣(クロイヌ)〜気高き聖女は白濁に染まる〜 〜カグヤ×ルー·ルー×マイア 柔肌に蠢く蟲、猛り狂う野獣達の夜編〜].mkv
================================================================================
 🕷 03:33:47 1/1 4562215333534 字幕.mkv 刮削完成!用时 3 秒!
 🕷 剩余正在刮削的线程:0
 🏖 已累计刮削 1/1,已连续刮削 1/20...
================================================================================
 🎉🎉🎉 All finished!!! Total 1 , Success 1 , Failed 0 
================================================================================
 ⏰ Start time  : 2024-02-29 03:33:43
 🏁 End time    : 2024-02-29 03:33:47
 ⏱ Used time   : 3.49S
 📺 Movies num  : 1
 🍕 Per time    : 3.49S
================================================================================

截图

No response

还有别的吗?

@sqzw-x sqzw-x added the bug Something isn't working label Feb 29, 2024
@sqzw-x
Copy link
Owner

sqzw-x commented Feb 29, 2024

这是因为程序会把全数字文件名默认识别为无码, 可以删除这一判断, 不过不清楚是否会对其它番号造成影响
你是否能提供更多有关 JANコード 的信息? 例如其长度是否一定, 是否有某些特征

@auroracamus
Copy link
Author

auroracamus commented Feb 29, 2024

这是因为程序会把全数字文件名默认识别为无码, 可以删除这一判断, 不过不清楚是否会对其它番号造成影响 你是否能提供更多有关 JANコード 的信息? 例如其长度是否一定, 是否有某些特征

目前我所知:

1、“JANコード”是日本的标准商品条码,有一套专门的国家标准。(管理机构网站:https://www.gs1jp.org/)

2、日本采用8位或13位的长度

3、Getchu上用的是13位,数字的头两位是代表国家,日本是45或49。其他数字代表什么我就不清楚了

比起直接删除现有判断,是否可以采取以下的解决方式?

1、因为配置文件可以单独保存、切换,那么增加一个跳过现有数字判断的开关。

2、直接对判断逻辑进行修改。

我个人倾向于第一种,因为我个人刮里番的配置文件是单独的,和AV的分开比较易于管理。

@sqzw-x
Copy link
Owner

sqzw-x commented Mar 1, 2024

原则上来讲最好的方法是允许用户添加自定义规则用于分类番号,但是 mdcx 的架构已经不允许引入这种灵活性了,判断番号的正则表达式全部是硬编码在代码里的,这类判断不下几十处,我不是很想单独为此引入配置项以及 UI 变动。
另一方面,此逻辑本身就有很大问题,过于笼统了,因此我还是考虑将其删除。

@auroracamus
Copy link
Author

原则上来讲最好的方法是允许用户添加自定义规则用于分类番号,但是 mdcx 的架构已经不允许引入这种灵活性了,判断番号的正则表达式全部是硬编码在代码里的,这类判断不下几十处,我不是很想单独为此引入配置项以及 UI 变动。 另一方面,此逻辑本身就有很大问题,过于笼统了,因此我还是考虑将其删除。

了解了~

想起了我那写了好几版然后扔在一边的H本和H漫的分类软件,也是判断逻辑最麻烦……

@sqzw-x sqzw-x closed this as completed Mar 6, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

2 participants