<h1 align="center"><font color="yellow">Using HuggingFace's Inference API with an NLP model.</font></h1>

<font color="yellow">Data Scientist.: Dr.Eddy Giusepe Chirinos Isidro</font>

# Contextualizando

Neste pequeno script vamos usar um modelo de NLP hospedado no [Ecosistema do Hugging Face](https://huggingface.co/). O modelo que vamos a Instanciar é um Modelo de Classificação de Sentimento. Este modelo de classificador MULTILÍNGUE, `cardiffnlp/twitter-xlm-roberta-base-sentiment`, pode ser baixado [aqui](https://huggingface.co/cardiffnlp/twitter-xlm-roberta-base-sentiment).


# Instanciando o modelo da HuggingFace

<font color="orange">Para usar os Modelos do HuggingFace você precisa criar uma conta lá e pegar o TOKEN da API de Inferência.</font>

In [94]:
# Isto é quando usas o arquivo .env:
from dotenv import load_dotenv
import os
print('Carregando a minha chave Key: ', load_dotenv())
Eddy_HUGGINGFACEHUB_API_TOKEN = os.environ['HUGGINGFACEHUB_API_TOKEN'] 

Carregando a minha chave Key:  True


# <font color="red">Modelo em Inglês</font>

In [95]:
import requests


API_URL = "https://api-inference.huggingface.co/models/cardiffnlp/twitter-roberta-base-sentiment"
headers = {"Authorization": Eddy_HUGGINGFACEHUB_API_TOKEN}


def query(payload):
	response = requests.post(API_URL, headers=headers, json=payload)
	return response.json()
	

output = query({
	"inputs": "It's fantastic to be a data scientist!",
})

# A nossa saída é uma lista Bidimensional:
output

[[{'label': 'LABEL_0', 'score': 0.0016051668208092451},
  {'label': 'LABEL_1', 'score': 0.012928708456456661},
  {'label': 'LABEL_2', 'score': 0.9854661226272583}]]

In [96]:
output[0]

[{'label': 'LABEL_0', 'score': 0.0016051668208092451},
 {'label': 'LABEL_1', 'score': 0.012928708456456661},
 {'label': 'LABEL_2', 'score': 0.9854661226272583}]

In [97]:
# Criamos um obejto para ORDENAR A NOSSA SAÍDA:
sorted_output = sorted(output[0], key=lambda x: x['score'], reverse=True) 
sorted_output

[{'label': 'LABEL_2', 'score': 0.9854661226272583},
 {'label': 'LABEL_1', 'score': 0.012928708456456661},
 {'label': 'LABEL_0', 'score': 0.0016051668208092451}]

In [98]:
# Agora a predição será apenas uma Label (aquela de máxima SCORE):
prediction = sorted_output[0]
prediction


{'label': 'LABEL_2', 'score': 0.9854661226272583}

In [99]:
# Podemos mapear todas as LABELS ao respectivo SENTIMENTO:
label_mapping = {
    'LABEL_0':'Negative',
    'LABEL_1':'Neutral',
    'LABEL_2':'Positive'
}

In [100]:
# Printamos o SENTIMENTO da query: 
label_mapping[prediction['label']]

'Positive'

# <font color="red">Modelo em Português</font>

<font color="orange">Este é um modelo de `base XLM-roBERTa multilíngue` treinado em `~ 198 milhões de tweets` e ajustado para ANÁLISE DE SENTIMENTO. O ajuste fino de sentimento foi feito em `8` idiomas (Ar, En, Fr, De, Hi, It, Sp, `Pt`), mas pode ser usado para mais idiomas (consulte o artigo para obter detalhes).</font>


In [101]:
import requests


API_URL = "https://api-inference.huggingface.co/models/cardiffnlp/twitter-xlm-roberta-base-sentiment"
headers = {"Authorization": Eddy_HUGGINGFACEHUB_API_TOKEN}


def query(payload):
	response = requests.post(API_URL, headers=headers, json=payload)
	return response.json()
	
input_texto = input("Digite a sua sentença em Português: ") #"Feliz porque todos na minha família estão com saúde, graças a DEUS!"

output = query({
	"inputs": input_texto
})

# A nossa saída é uma lista Bidimensional:
output

[[{'label': 'positive', 'score': 0.9046845436096191},
  {'label': 'neutral', 'score': 0.07992047071456909},
  {'label': 'negative', 'score': 0.015395013615489006}]]

In [102]:
# Aqui, observamos que já está ordenado de maneira DECRESCENTE:
output[0]

[{'label': 'positive', 'score': 0.9046845436096191},
 {'label': 'neutral', 'score': 0.07992047071456909},
 {'label': 'negative', 'score': 0.015395013615489006}]

In [103]:
# A predição será apenas uma Label (aquela de máxima SCORE):
prediction = output[0][0]['label']
prediction

'positive'

In [104]:
print("A sentença: ")
print(f"{input_texto}")
print(f"Tem SENTIMENTO --> {prediction}")

A sentença: 
É muito massa ser um Cientista de Dados 🤗.
Tem SENTIMENTO --> positive
