In [1]:
from hanlp_restful import HanLPClient

In [2]:
# 初始化客户端
client = HanLPClient('https://www.hanlp.com/api', language='zh')

sentence = "商品和服务。阿婆主来到北京立方庭参观自然语义科技公司。"

In [3]:
# 分詞：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/tok_restful.ipynb
tokens = client.tokenize(sentence)
print(tokens)

[['商品', '和', '服务', '。'], ['阿婆主', '来到', '北京', '立方庭', '参观', '自然', '语义', '科技', '公司', '。']]


In [4]:
# 詞性標註：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/pos_restful.ipynb
client(sentence, tasks="pos").pretty_print()

In [6]:
# 命名實體識別：https://hanlp.hankcs.com/demos/ner.html#%E7%AE%80%E4%BB%8B
client.parse(sentence, tasks='ner/msra').pretty_print()

In [8]:
# 依存語法分析：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/dep_restful.ipynb
client(sentence, tasks="dep").pretty_print()

In [10]:
# 成分句法分析：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/con_restful.ipynb
client(sentence, tasks="con").pretty_print()

In [12]:
# 語意依存分析：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/sdp_restful.ipynb
client(sentence, tasks="sdp").pretty_print()

In [14]:
# 語意角色標註：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/srl_restful.ipynb
client(sentence, tasks="srl").pretty_print()

In [16]:
# 抽象意義表示：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/amr_restful.ipynb
graphs = client.abstract_meaning_representation(sentence)
print(graphs[0])

{'id': '0', 'input': '商品 和 服务 。', 'nodes': [{'id': 0, 'label': '商品', 'anchors': [{'from': 0, 'to': 2}]}, {'id': 1, 'label': 'and', 'anchors': []}, {'id': 2, 'label': '服务', 'anchors': [{'from': 5, 'to': 7}]}], 'edges': [{'source': 1, 'target': 0, 'label': 'op1'}, {'source': 1, 'target': 2, 'label': 'op2'}], 'tops': [1], 'framework': 'amr'}


In [18]:
# 指代消解：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/cor_restful.ipynb
cor = client.coreference_resolution(sentence)
print(cor)

HTTPError: HTTP Error 401: {"detail":"此接口不对匿名用户开放。请申请免费公益API秘钥auth https://bbs.hanlp.com/t/hanlp2-1-restful-api/53 "}

In [20]:
# 語意文本相似度：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/sts_restful.ipynb
similarity = client.semantic_textual_similarity([
    ('看图猜一电影名', '看图猜电影'),
    ('无线路由器怎么无线上网', '无线上网卡和无线路由器怎么用'),
    ('北京到上海的动车票', '上海到北京的动车票'),
])
print(similarity)

[0.9764469861984253, 0.0, 0.003458678722381592]


In [22]:
# 文本風格轉換：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/tst_restful.ipynb
print(client.text_style_transfer(['国家对中石油抱有很大的期望.', '要用创新去推动高质量的发展。'], target_style='gov_doc'))

['国家对中石油寄予巨大期望。', '要用创新推动高质量发展。']


In [24]:
# 關鍵字提取：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/keyphrase_restful.ipynb
print(client.keyphrase_extraction(sentence))

{'商品和服务。': 1.0, '自然语义科技公司': 0.4294601380825043, '阿婆主': 0.14773835241794586, '北京立方庭': 0.07079628854990005}


In [26]:
# 抽取式自動摘要：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/extractive_summarization_restful.ipynb
text = '''
据DigiTimes报道，在上海疫情趋缓，防疫管控开始放松后，苹果供应商广达正在逐步恢复其中国工厂的MacBook产品生产。
据供应链消息人士称，生产厂的订单拉动情况正在慢慢转强，这会提高MacBook Pro机型的供应量，并缩短苹果客户在过去几周所经历的延长交货时间。
仍有许多苹果笔记本用户在等待3月和4月订购的MacBook Pro机型到货，由于苹果的供应问题，他们的发货时间被大大推迟了。
据分析师郭明錤表示，广达是高端MacBook Pro的唯一供应商，自防疫封控依赖，MacBook Pro大部分型号交货时间增加了三到五周，
一些高端定制型号的MacBook Pro配置要到6月底到7月初才能交货。
尽管MacBook Pro的生产逐渐恢复，但供应问题预计依然影响2022年第三季度的产品销售。
苹果上周表示，防疫措施和元部件短缺将继续使其难以生产足够的产品来满足消费者的强劲需求，这最终将影响苹果6月份的收入。
'''
print(client.extractive_summarization(text, topk=3))

{'据DigiTimes报道，在上海疫情趋缓，防疫管控开始放松后，苹果供应商广达正在逐步恢复其中国工厂的MacBook产品生产。': 0.9999712109565735, '据供应链消息人士称，生产厂的订单拉动情况正在慢慢转强，这会提高MacBook Pro机型的供应量，并缩短苹果客户在过去几周所经历的延长交货时间。': 0.4486207664012909, '苹果上周表示，防疫措施和元部件短缺将继续使其难以生产足够的产品来满足消费者的强劲需求，这最终将影响苹果6月份的收入。': 0.14398568868637085}


In [28]:
# 生成式自動摘要：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/abstractive_summarization_restful.ipynb
print(client.abstractive_summarization('''
每经AI快讯，2月4日，长江证券研究所金属行业首席分析师王鹤涛表示，2023年海外经济衰退，美债现处于历史高位，
黄金的趋势是值得关注的；在国内需求修复的过程中，看好大金属品种中的铜铝钢。
此外，在细分的小品种里，建议关注两条主线，一是新能源，比如锂、钴、镍、稀土，二是专精特新主线。（央视财经）
'''))

长江证券：看好大金属品种中的铜铝钢


In [30]:
# 文本與法糾錯：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/gec_restful.ipynb
print(client.grammatical_error_correction(['每个青年都应当有远大的报复。', '有的同学对语言很兴趣。', '我市本地居民约占全市人口的70%多。']))

['每个青年都应当有远大的抱负。', '有的同学对语言很有兴趣。', '我市本地居民约占全市人口的70%。']


In [32]:
# 文本分類：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/classification_restful.ipynb
print(client.text_classification('2021年 HanLPv2.1为生产环境带来次世代最先进的多语种NLP技术。', model='news_zh', topk=True, prob=True))

{'科技': 0.999642014503479, '家居': 0.00010509398998692632, '游戏': 9.744218550622463e-05, '时尚': 2.629891605465673e-05, '时政': 2.578065868874546e-05, '股票': 2.2699641704093665e-05, '教育': 1.9568053176044486e-05, '财经': 1.0455660230945796e-05, '彩票': 1.0110467883350793e-05, '社会': 9.36029027798213e-06, '体育': 9.146616321231704e-06, '娱乐': 8.645682100905105e-06, '星座': 7.075848316162592e-06, '房产': 6.390789167198818e-06}


In [34]:
# 情感分析：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/sentiment_restful.ipyn
text = '''“这是一部男人必看的电影。”人人都这么说。但单纯从性别区分，就会让这电影变狭隘。
《肖申克的救赎》突破了男人电影的局限，通篇几乎充满令人难以置信的温馨基调，而电影里最伟大的主题是“希望”。
当我们无奈地遇到了如同肖申克一般囚禁了心灵自由的那种囹圄，我们是无奈的老布鲁克，灰心的瑞德，还是智慧的安迪？
运用智慧，信任希望，并且勇敢面对恐惧心理，去打败它？
经典的电影之所以经典，因为他们都在做同一件事——让你从不同的角度来欣赏希望的美好。'''
print(client.sentiment_analysis(text))

0.9505730271339417


In [36]:
# 語種檢測：https://github.com/hankcs/HanLP/blob/doc-zh/plugins/hanlp_demo/hanlp_demo/zh/lid_restful.ipynb
print(client.language_identification('2021年、HanLPv2.1は次世代の最先端多言語NLP技術を本番環境に導入します。', prob=True))

['ja', 0.9976244568824768]
