# PaddlePaddle NLP TaskFlow 教程

In [1]:
from paddlenlp import Taskflow

## 中文分词

In [2]:
seg = Taskflow("word_segmentation")

In [90]:
seg("山东省日照市北京路街道兴业春天花园社区居委会村天津路中铁十九=王玉阁")

['山东省', '日照市', '北京路街道', '兴业春天花园社区居委会村', '天津路', '中铁', '十九', '=', '王玉', '阁']

## 词性标注

In [20]:
tag = Taskflow("pos_tagging",user_dict="user_dict.txt")

In [78]:
tag("山东省日照市北京路街道兴业春天花园社区居委会村天津路中铁十九|赵文启")

[('山东省', 'LOC'),
 ('日照市', 'LOC'),
 ('北京路街道', 'LOC'),
 ('兴业春天花园社区居委会村', 'LOC'),
 ('天津路', 'LOC'),
 ('中铁', 'ORG'),
 ('十九', 'm'),
 ('|', 'w'),
 ('赵文启', 'PER')]

In [80]:
tag("山东省日照市北京路街道兴业春天花园社区居委会村天津路中铁十九|赵文启")

[('山东省', 'LOC'),
 ('日照市', 'LOC'),
 ('北京路街道', 'LOC'),
 ('兴业春天花园社区居委会村', 'LOC'),
 ('天津路', 'LOC'),
 ('中铁', 'ORG'),
 ('十九', 'm'),
 ('|', 'w'),
 ('赵文启', 'PER')]

## 命名实体识别

In [6]:
ner = Taskflow("ner")

[32m[2022-04-21 17:00:15,464] [    INFO][0m - Already cached /Users/lorne/.paddlenlp/models/wordtag/vocab.txt[0m


In [94]:
ner("山东省日照市北京路街道兴业春天花园社区居委会村天津路中铁十九局王玉阁")

[('山东省', '世界地区类'),
 ('日照市', '世界地区类'),
 ('北京路街道', '场所类_交通场所'),
 ('兴业春天花园社区居委会村', '世界地区类'),
 ('天津路', '场所类_交通场所'),
 ('中铁十九局', '组织机构类_国家机关'),
 ('王玉阁', '人物类_实体')]

## 『解语』- 名词短语标注

In [8]:
nptag = Taskflow("knowledge_mining", model="nptag")

[32m[2022-04-21 17:00:17,321] [    INFO][0m - Downloading model_state.pdparms from https://bj.bcebos.com/paddlenlp/taskflow/knowledge_mining/nptag/model_state.pdparams[0m
[32m[2022-04-21 17:00:18,597] [    INFO][0m - Already cached /Users/lorne/.paddlenlp/models/nptag/vocab.txt[0m


In [9]:
nptag("红曲霉菌")

[{'text': '红曲霉菌', 'label': '微生物'}]

## 句法分析

In [10]:
ddp = Taskflow("dependency_parsing")

[32m[2022-04-21 17:00:22,755] [    INFO][0m - Downloading vocab.json from https://bj.bcebos.com/paddlenlp/taskflow/dependency_parsing/ddparser/word_vocab.json[0m


In [11]:
ddp("9月9日上午纳达尔在亚瑟·阿什球场击败俄罗斯球员梅德韦杰夫")

[{'word': ['9月9日', '上午', '纳达尔', '在', '亚瑟·阿什球场', '击败', '俄罗斯', '球员', '梅德韦杰夫'],
  'head': [2, 6, 6, 5, 6, 0, 8, 9, 6],
  'deprel': ['ATT', 'ADV', 'SBV', 'MT', 'ADV', 'HED', 'ATT', 'ATT', 'VOB']}]

## 情感分析

In [12]:
senta = Taskflow("sentiment_analysis")

In [13]:
senta("这个产品用起来真的很流畅，我非常喜欢")

[{'text': '这个产品用起来真的很流畅，我非常喜欢',
  'label': 'positive',
  'score': 0.9938690066337585}]