Skip to content

Hanscal/unlp

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

52 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PyPI version Supported Python Versions PRs Welcome

star star star

gitHub欢迎提pull requests, 如果有bug新需求,请反馈issue

unlp

unlp是一些经常需要用到的NLP算法包,有助于您学习和使用基于深度学习的文本处理。

安装

python3.6+

pip install unlp 
pip install -r requirements.txt

unlp模块


  1. 根据nlp的任务来构建这个包,主要有无监督学习、有监督学习以及文本增强的一些常有方法;
  2. 无监督学习中有关键词抽取,向量嵌入和相似度计算;
  3. 监督学习中有分类任务,命名实体识别,文本生成等;
  4. 文本增强常用方法,比如回译,同义词替换等。

unlp使用

  1. 具体参见示例目录
  2. 项目中有的任务需要自动下载预训练模型,在百度网盘提供部分已经下载了的模型:
    预训练模型 密码: 6lk1

无监督学习方法

详细使用说明

  1. 关键词抽取;
  2. 向量嵌入;
  3. 相似度计算;
  4. 语义搜索;
    ...

监督学习方法

详细使用说明

  1. 文本分类;
  2. 命名实体识别;
  3. 文本摘要;
  4. 对话生成;
    ...

文本数据增强

详细使用说明

  1. 回译;
  2. EDA(同义词替换、插入、交换和删除);
    ...

About

一些经常需要用到的NLP算法包,有助于学习和使用基于深度学习的文本处理。

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages