Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

代码塞给CHATGPT,让她炼。 #5

Open
daiaji opened this issue Jul 29, 2023 · 5 comments
Open

代码塞给CHATGPT,让她炼。 #5

daiaji opened this issue Jul 29, 2023 · 5 comments

Comments

@daiaji
Copy link

daiaji commented Jul 29, 2023

我要求她修改去重的实现。
从简单的匹配URL修改为判断三级或者二级域名进行去重。

重定向的网站修改域名。

后者的话,难说。
因为有时候重定向可能是域名寄了。

或者被别人拿了。
可能要解析原先的元素是不是还在。

这个怕不是要实现搜索校验。

还有一个想搞。

自动化添加CF或者WAF策略。

用TypeScript在node.js跑吧。

如果你的项目需要大量使用JavaScript、XPath和JSOUP,那么可能直接在Node.js环境中使用TypeScript会更为方便,因为Node.js本身就支持JavaScript,而且有许多库可以支持XPath和JSOUP(或类似JSOUP的HTML解析库)。

TypeScript是JavaScript的一个超集,添加了静态类型和一些其他的语言特性,这使得在大型项目中编写和维护代码更为容易。另外,Node.js有一个活跃的社区和大量的第三方库,这可能会对你的项目有所帮助。

然而,将Python代码翻译成TypeScript并不是一个简单的任务。虽然两者都是高级语言,但它们的语法和语义有很大的不同。一些在Python中很简单的任务在JavaScript或TypeScript中可能需要更多的代码,反之亦然。因此,你可能需要花费一些时间来重新实现你的代码,而且可能需要解决一些在翻译过程中出现的问题。

如果你决定采取这种方法,你可能会发现一些工具可以帮助你进行翻译,例如,有一些工具可以将Python代码转换成JavaScript代码。然而,请注意这些工具通常不能完美地进行转换,你可能需要手动修改一些代码。

总的来说,如果你的项目需要大量使用JavaScript、XPath和JSOUP,那么使用TypeScript和Node.js可能是一个好选择。然而,这需要你花费一些时间来学习新的语言和环境,以及重新实现你的代码。

@WuSuoV
Copy link
Owner

WuSuoV commented Jul 31, 2023

我要求她修改去重的实现。 从简单的匹配URL修改为判断三级或者二级域名进行去重。

重定向的网站修改域名。

后者的话,难说。 因为有时候重定向可能是域名寄了。

或者被别人拿了。 可能要解析原先的元素是不是还在。

这个怕不是要实现搜索校验。

还有一个想搞。

自动化添加CF或者WAF策略。

用TypeScript在node.js跑吧。

如果你的项目需要大量使用JavaScript、XPath和JSOUP,那么可能直接在Node.js环境中使用TypeScript会更为方便,因为Node.js本身就支持JavaScript,而且有许多库可以支持XPath和JSOUP(或类似JSOUP的HTML解析库)。
TypeScript是JavaScript的一个超集,添加了静态类型和一些其他的语言特性,这使得在大型项目中编写和维护代码更为容易。另外,Node.js有一个活跃的社区和大量的第三方库,这可能会对你的项目有所帮助。
然而,将Python代码翻译成TypeScript并不是一个简单的任务。虽然两者都是高级语言,但它们的语法和语义有很大的不同。一些在Python中很简单的任务在JavaScript或TypeScript中可能需要更多的代码,反之亦然。因此,你可能需要花费一些时间来重新实现你的代码,而且可能需要解决一些在翻译过程中出现的问题。
如果你决定采取这种方法,你可能会发现一些工具可以帮助你进行翻译,例如,有一些工具可以将Python代码转换成JavaScript代码。然而,请注意这些工具通常不能完美地进行转换,你可能需要手动修改一些代码。
总的来说,如果你的项目需要大量使用JavaScript、XPath和JSOUP,那么使用TypeScript和Node.js可能是一个好选择。然而,这需要你花费一些时间来学习新的语言和环境,以及重新实现你的代码。

  1. 判断去重的话,用的是笨方法,至于判断依据为根域名,这个我也不好评判。
  2. 对于重定向的网站,只要是重定向之后仍可访问的,在程序里也会被判定为有效书源。
  3. 你想把它用Typescript重写,这是因为你钟爱于Node.js?还是说想实现网页端访问?如果是后者,可以通过flask等python web框架实现。
  4. 更深入的书源校验,目前的程序判定很简单,就是看网站返回码是不是200(也就是网站能不能访问),更深入的搜索校验之类的,就相对而言比较复杂了。我最开始的想法是,对于大量书源进行一次筛选,剔除不可访问的书源。再将剩下的书源通过阅读app进行二次校验,这样可以更加省时一些。

后面再看吧,有时间就再多优化优化。

@daiaji
Copy link
Author

daiaji commented Jul 31, 2023

3. 你想把它用Typescript重写,这是因为你钟爱于Node.js?还是说想实现网页端访问?如果是后者,可以通过flask等python web框架实现。

原生实现是一部分,还有就是GPT4列出的理由,然后用Node.js实现的话,部署到cloudflare Workers需要的改动很少,等于是直接部署成网站,让用户上传或者通过抓取包含json的url进行校验,主要是免费。

4. 更深入的书源校验,目前的程序判定很简单,就是看网站返回码是不是200(也就是网站能不能访问),更深入的搜索校验之类的,就相对而言比较复杂了。我最开始的想法是,对于大量书源进行一次筛选,剔除不可访问的书源。再将剩下的书源通过阅读app进行二次校验,这样可以更加省时一些。

阅读校验自己爱崩溃,还有就是她只能校验,不能帮我修正,翻译到Node.js之后,我需要她自动化修正很多东西,比如重定向,和WAF和CF绕过,如果可以的话,说不定实现提供搜索链接让她自己通过元素判断,使用哪个模板,自动创建书源。

@daiaji
Copy link
Author

daiaji commented Aug 3, 2023

gedoor/legado#3271

https://github.com/daiaji/verifyBookSource-TS
进度有点了,剩下的原理我不太懂。
不太敢动。

@WuSuoV
Copy link
Owner

WuSuoV commented Aug 4, 2023

gedoor/legado#3271

https://github.com/daiaji/verifyBookSource-TS 进度有点了,剩下的原理我不太懂。 不太敢动。

👍

@daiaji
Copy link
Author

daiaji commented Aug 4, 2023

阅读的自定义库,加起来也有2000多行代码,我不觉得你用py重构阅读的库会比js容易,可能还更难,node.js运行js好歹还原生。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants