Skip to content

Monster2848/sougou_dic_spider

Repository files navigation

sougou_dic_spider

  1. 爬搜狗官网.py 这里只爬了一个子分类(1和2可以只选一个爬)

  2. 搜狗爬非官网.py 这里爬了第三方网站,由于第三方网站没有分类限制,可以爬到大部分

上面两个文件运行后会生成一个词库名称,词库下载地址的文本文件

  1. 搜狗词库下载.py 这里会读取上面保存的文本文件下载词库scel文件

  2. 深蓝词库转换1.1 可以实现批量scel转txt转换

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages