<h2 align="center">点击下列图标在线运行HanLP</h2>
<div align="center">
	<a href="https://colab.research.google.com/github/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/ner_restful.ipynb" target="_blank"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>
	<a href="https://mybinder.org/v2/gh/hankcs/HanLP/doc-zh?filepath=plugins%2Fhanlp_demo%2Fhanlp_demo%2Fzh%2Fner_restful.ipynb" target="_blank"><img src="https://mybinder.org/badge_logo.svg" alt="Open In Binder"/></a>
</div>

## 安装

无论是Windows、Linux还是macOS，HanLP的安装只需一句话搞定：

In [None]:
pip install hanlp_restful -U

## 创建客户端

In [1]:
from hanlp_restful import HanLPClient
HanLP = HanLPClient('https://www.hanlp.com/api', auth=None, language='zh') # auth不填则匿名，zh中文，mul多语种

#### 申请秘钥
由于服务器算力有限，匿名用户每分钟限2次调用。如果你需要更多调用次数，[建议申请免费公益API秘钥auth](https://bbs.hanlp.com/t/hanlp2-1-restful-api/53)。

## 命名实体识别

同时执行所有标准的命名实体识别：

In [2]:
print(HanLP('2021年HanLPv2.1为生产环境带来次世代最先进的多语种NLP技术。阿婆主来到北京立方庭参观自然语义科技公司。', tasks='ner*'))

{
  "tok/fine": [
    ["2021年", "HanLPv2.1", "为", "生产", "环境", "带来", "次", "世代", "最", "先进", "的", "多", "语种", "NLP", "技术", "。"],
    ["阿婆主", "来到", "北京", "立方庭", "参观", "自然", "语义", "科技", "公司", "。"]
  ],
  "ner/msra": [
    [["2021年", "DATE", 0, 1], ["HanLPv2.1", "ORGANIZATION", 1, 2]],
    [["北京立方庭", "LOCATION", 2, 4], ["自然语义科技公司", "ORGANIZATION", 5, 9]]
  ],
  "ner/pku": [
    [],
    [["北京", "ns", 2, 3], ["立方庭", "ns", 3, 4], ["自然语义科技公司", "nt", 5, 9]]
  ],
  "ner/ontonotes": [
    [["2021年", "DATE", 0, 1], ["次世代", "DATE", 6, 8]],
    [["北京", "FAC", 2, 3], ["立方庭", "LOC", 3, 4], ["自然语义科技公司", "ORG", 5, 9]]
  ]
}


每个四元组表示`[命名实体, 类型标签, 起始下标, 终止下标]`，下标指的是命名实体在单词数组中的下标，单词数组默认为第一个以`tok`开头的数组。

任务越少，速度越快。如指定仅执行命名实体识别，默认MSRA标准：

In [3]:
HanLP('2021年HanLPv2.1为生产环境带来次世代最先进的多语种NLP技术。阿婆主来到北京立方庭参观自然语义科技公司。', tasks='ner').pretty_print()

Token    	NER Type        
─────────	────────────────
2021年    	───►DATE        
HanLPv2.1	───►ORGANIZATION
为        	                
生产       	                
环境       	                
带来       	                
次        	                
世代       	                
最        	                
先进       	                
的        	                
多        	                
语种       	                
NLP      	                
技术       	                
。        	                

Tok	NER Type        
───	────────────────
阿婆主	                
来到 	                
北京 	◄─┐             
立方庭	◄─┴►LOCATION    
参观 	                
自然 	◄─┐             
语义 	  │             
科技 	  ├►ORGANIZATION
公司 	◄─┘             
。  	                


执行OntoNotes命名实体识别：

In [4]:
HanLP('2021年HanLPv2.1为生产环境带来次世代最先进的多语种NLP技术。阿婆主来到北京立方庭参观自然语义科技公司。', tasks='ner/ontonotes').pretty_print()

Token    	NER Type
─────────	────────
2021年    	───►DATE
HanLPv2.1	        
为        	        
生产       	        
环境       	        
带来       	        
次        	◄─┐     
世代       	◄─┴►DATE
最        	        
先进       	        
的        	        
多        	        
语种       	        
NLP      	        
技术       	        
。        	        

Tok	NER Typ
───	───────
阿婆主	       
来到 	       
北京 	───►FAC
立方庭	───►LOC
参观 	       
自然 	◄─┐    
语义 	  │    
科技 	  ├►ORG
公司 	◄─┘    
。  	       


为已分词的句子执行命名实体识别：

In [5]:
HanLP(tokens=[["阿婆主", "来到", "北京立方庭", "参观", "自然语义科技公司", "。"]], tasks='ner').pretty_print()

Token   	NER Type        
────────	────────────────
阿婆主     	                
来到      	                
北京立方庭   	───►LOCATION    
参观      	                
自然语义科技公司	───►ORGANIZATION
。       	                
