Skip to content

Latest commit

 

History

History
10 lines (7 loc) · 361 Bytes

README.md

File metadata and controls

10 lines (7 loc) · 361 Bytes

AitSimwords

通过维基百科构建的一个中文同义词库,每一行(每一个\n分隔)为一组同义词。

构建原理:

  1. 将wiki条目下的黑体字作为同义词,用爬虫抓取解析
  2. a是b的同义词, b是c的同义词, 那么a与c是同义词

2023.07.19: 通过维基百科构建的同义词库已经被llm降维打击了hh