## Introduction to Hugging Face Transformer Library

*   Model Hub https://huggingface.co/models
*   Auto NLP https://huggingface.co/autonlp
*   Pricing https://huggingface.co/pricing




### Installing Hugging Face Transformer Library

In [None]:
!pip install transformers

### Introduction to Pipelines
* Sentiment analysis
* Text generation (in English)
* Name entity recognition (NER)
* Question answering
* Filling masked text
* Summarization
* Translation
* Feature extraction

In [None]:
from transformers import pipeline

### Sentiment Analysis
uses "distilbert-base-uncased-finetuned-sst-2-english" by default

In [None]:
classifier = pipeline('sentiment-analysis')

In [None]:
classifier('i love you')

[{'label': 'POSITIVE', 'score': 0.9998656511306763}]

In [None]:
classifier('i hate you')

[{'label': 'NEGATIVE', 'score': 0.9991129040718079}]

####Using Other Models

In [None]:
classifier = pipeline('sentiment-analysis', model="nlptown/bert-base-multilingual-uncased-sentiment")

In [None]:
classifier('je taime')

[{'label': '5 stars', 'score': 0.3085957169532776}]

In [None]:
classifier('je te déteste')

[{'label': '1 star', 'score': 0.45717522501945496}]

### NER
It leverages a fine-tuned model on CoNLL-2003

In [None]:
ner = pipeline('ner')

HBox(children=(FloatProgress(value=0.0, description='Downloading', max=998.0, style=ProgressStyle(description_…




HBox(children=(FloatProgress(value=0.0, description='Downloading', max=1334448817.0, style=ProgressStyle(descr…




HBox(children=(FloatProgress(value=0.0, description='Downloading', max=213450.0, style=ProgressStyle(descripti…




HBox(children=(FloatProgress(value=0.0, description='Downloading', max=60.0, style=ProgressStyle(description_w…




In [None]:
k = ner("My name is Clara and I live in Berkeley, California. I work at Google.")
for i in k:
  for item in i:
    print(item,i[item])
  print()

word Clara
score 0.9962673783302307
entity I-PER
index 4
start 11
end 16

word Berkeley
score 0.9969068169593811
entity I-LOC
index 9
start 31
end 39

word California
score 0.9990561008453369
entity I-LOC
index 11
start 41
end 51

word Google
score 0.9980074167251587
entity I-ORG
index 16
start 63
end 69



### Masked Language Modeling

In [None]:
mlm = pipeline("fill-mask")

In [None]:
ml = mlm(f"HuggingFace is creating a {mlm.tokenizer.mask_token} that the community uses to solve NLP tasks.")

for i in ml:
  print(i["score"], "\t", i["token_str"])

0.17927460372447968 	  tool
0.1134939044713974 	  framework
0.05243545398116112 	  library
0.03493543714284897 	  database
0.02860247902572155 	  prototype


#### using a persian model for MLM
"HooshvareLab/bert-fa-base-uncased" https://huggingface.co/HooshvareLab/bert-fa-base-uncased

In [None]:
mlmpersian = pipeline("fill-mask", model='HooshvareLab/bert-fa-base-uncased')

In [None]:
mlpers = mlmpersian(f"ما فرزندان {mlmpersian.tokenizer.mask_token} هستیم")

print("ما فرزندان *** هستیم")
for i in mlpers:
  print(i["score"], "\t", i["token_str"])

ما فرزندان *** هستیم
0.0844496563076973 	 خدا
0.053226288408041 	 شما
0.05265511944890022 	 ایران
0.04756195470690727 	 انقلاب
0.037145309150218964 	 شهدا


In [None]:
mlpers = mlmpersian(f"او فوتبال را در نوجوانی در تیم {mlmpersian.tokenizer.mask_token} آغاز کرد. بعد از دو سال به پرسپولیس پیوست")

print("او فوتبال را در نوجوانی در تیم *** آغاز کرد. بعد از دو سال به پرسپولیس پیوست")
for i in mlpers:
  print(i["score"], "\t", i["token_str"])

او فوتبال را در نوجوانی در تیم *** آغاز کرد. بعد از دو سال به پرسپولیس پیوست
0.1425524204969406 	 پرسپولیس
0.1251094490289688 	 راهاهن
0.11589838564395905 	 ملی
0.0697779506444931 	 استقلال
0.05113454535603523 	 پیکان


In [None]:
mlpers = mlmpersian(f"او فوتبال را در نوجوانی در تیم {mlmpersian.tokenizer.mask_token} آغاز کرد. بعد از دو سال به چلسی پیوست")

print("او فوتبال را در نوجوانی در تیم *** آغاز کرد. بعد از دو سال به چلسی پیوست")
for i in mlpers:
  print(i["score"], "\t", i["token_str"])

او فوتبال را در نوجوانی در تیم *** آغاز کرد. بعد از دو سال به چلسی پیوست
0.13366243243217468 	 اورتون
0.0713595449924469 	 چلسی
0.04446231201291084 	 ارسنال
0.03933807834982872 	 لیورپول
0.03292488306760788 	 پورتسموث


In [None]:
mlpers = mlmpersian(f"رتبه من در کنکور ارشد 1400 برابر با [MASK] خواهد شد")

print("رتبه من در کنکور ارشد 1400 برابر با *** خواهد شد")
for i in mlpers:
  print(i["score"], "\t", i["token_str"])

رتبه من در کنکور ارشد 1400 برابر با *** میشود
0.0288712065666914 	 ۶۳
0.01915029250085354 	 ۲
0.01827997900545597 	 ۹۰
0.017009330913424492 	 ۱
0.01648857071995735 	 ۷


## References

https://huggingface.co/

https://huggingface.co/transformers/quicktour.html

https://huggingface.co/transformers/main_classes/pipelines.html#pipelines

https://huggingface.co/transformers/custom_datasets.html#seq-imdb

https://huggingface.co/transformers/pretrained_models.html

https://huggingface.co/transformers/task_summary.html

https://huggingface.co/transformers/notebooks.html




Models
* https://huggingface.co/HooshvareLab/bert-fa-base-uncased
* https://huggingface.co/transformers/model_doc/distilbert.html

