## Tout d'abord, qu'est-ce que BERT ?

BERT est l'acronyme de Bidirectional Encoder Representations from Transformers. Le nom lui-même nous donne plusieurs indices sur ce qu'est BERT.

L'architecture BERT se compose de plusieurs encodeurs Transformer empilés ensemble. Chaque encodeur Transformer encapsule deux sous-couches : une couche d'auto-attention et une couche de feed-forward.

### Il existe deux modèles différents de BERT :

- BERT base, qui est un modèle BERT composé de 12 couches d'encodeur Transformer, 12 têtes d'attention, 768 couche cachée, et 110M paramètres.

- BERT large, qui est un modèle BERT composé de 24 couches d'encodeur Transformer, 16 têtes d'attention, 1024 couche cachée, et 340M paramètres.



Entrée et sortie de BERT
Le modèle BERT attend une séquence de tokens (mots) en entrée. Dans chaque séquence de tokens, il y a deux tokens spéciaux que BERT attend en entrée :

- [CLS] : C'est le premier token de chaque séquence, qui représente le token de classification.
- [SEP] : C'est le jeton qui permet à BERT de savoir quel jeton appartient à quelle séquence. Ce jeton spécial est principalement important pour une tâche de prédiction de la phrase suivante ou une tâche de réponse à une question. Si nous n'avons qu'une seule séquence, alors ce jeton sera ajouté à la fin de la séquence.


Il est également important de noter que la taille maximale des tokens qui peuvent être introduits dans le modèle BERT est de 512. Si les jetons d'une séquence sont inférieurs à 512, nous pouvons utiliser le padding pour remplir les emplacements de jetons non utilisés avec le jeton [PAD]. Si les jetons d'une séquence sont plus longs que 512, alors nous devons faire une troncature.

Et c'est tout ce que BERT attend en entrée.

Le modèle BERT produira alors un vecteur d'incorporation de taille 768 dans chacun des tokens. Nous pouvons utiliser ces vecteurs comme entrée pour différents types d'applications NLP, qu'il s'agisse de classification de texte, de prédiction de la prochaine phrase, de reconnaissance d'entités nommées (NER) ou de réponse à des questions.


------------

**Pour une tâche de classification de texte**, nous concentrons notre attention sur le vecteur d'intégration produit par le jeton spécial [CLS]. Cela signifie que nous allons utiliser le vecteur d'intégration de taille 768 du token [CLS] comme entrée pour notre classificateur, qui produira ensuite un vecteur de taille égale au nombre de classes dans notre tâche de classification.

-----------------------

![Imgur](https://imgur.com/NpeB9vb.png)

-------------------------

La partie centrale de BERT est constituée des encodeurs bidirectionnels empilés du modèle de transformation, mais pendant la pré-formation, une modélisation du langage masqué et une tête de prédiction de la phrase suivante sont ajoutées à BERT.

Quand je dis "tête", je veux dire que quelques couches supplémentaires sont ajoutées à BERT et peuvent être utilisées pour générer une sortie spécifique. La sortie brute de BERT est la sortie des encodeurs bidirectionnels empilés.

### Tokenisation pour les modèles Bert

La tokenisation joue un rôle essentiel dans le traitement automatique des langues car elle permet de convertir le texte en chiffres que les modèles d'apprentissage profond peuvent utiliser pour le traitement.

Aucun modèle d'apprentissage profond ne peut travailler directement avec le texte. Vous devez le convertir en chiffres ou dans un format que le modèle peut comprendre.

In [None]:
# Bien respecter l'ordre suivant
# Pour utiliser camembert
!pip install sentencepiece

!pip install transformers

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting sentencepiece
  Downloading sentencepiece-0.1.97-cp38-cp38-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (1.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m1.3/1.3 MB[0m [31m33.9 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: sentencepiece
Successfully installed sentencepiece-0.1.97
Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting transformers
  Downloading transformers-4.26.0-py3-none-any.whl (6.3 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m6.3/6.3 MB[0m [31m12.7 MB/s[0m eta [36m0:00:00[0m
Collecting huggingface-hub<1.0,>=0.11.0
  Downloading huggingface_hub-0.12.0-py3-none-any.whl (190 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m190.3/190.3 KB[0m [31m14.3 MB/s[0m eta [36m0:00:00[0m
Collecting tokenizers!=0.11.3,<0.14

In [None]:
from transformers import BertTokenizer
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

Downloading (…)solve/main/vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

Downloading (…)okenizer_config.json:   0%|          | 0.00/28.0 [00:00<?, ?B/s]

Downloading (…)lve/main/config.json:   0%|          | 0.00/570 [00:00<?, ?B/s]

In [9]:
# Plus d'infos sur le modèle ici : https://huggingface.co/camembert-base
from transformers import CamembertModel, CamembertTokenizer
tokenizer = CamembertTokenizer.from_pretrained("camembert-base")

Downloading (…)"pytorch_model.bin";:   0%|          | 0.00/445M [00:00<?, ?B/s]

Downloading (…)/main/tokenizer.json:   0%|          | 0.00/1.40M [00:00<?, ?B/s]

In [None]:
text = 'Bonjour je m\'appel david'
encoding = tokenizer.encode_plus(text, add_special_tokens = True, truncation = True, padding = "max_length", return_attention_mask = True, return_tensors = "pt")
encoding

{'input_ids': tensor([[    5,  1285,    50,   115,    11,  2052,    18,    55, 13700,     6,
             1,     1,     1,     1,     1,     1,     1,     1,     1,     1,
             1,     1,     1,     1,     1,     1,     1,     1,     1,     1,
             1,     1,     1,     1,     1,     1,     1,     1,     1,     1,
             1,     1,     1,     1,     1,     1,     1,     1,     1,     1,
             1,     1,     1,     1,     1,     1,     1,     1,     1,     1,
             1,     1,     1,     1,     1,     1,     1,     1,     1,     1,
             1,     1,     1,     1,     1,     1,     1,     1,     1,     1,
             1,     1,     1,     1,     1,     1,     1,     1,     1,     1,
             1,     1,     1,     1,     1,     1,     1,     1,     1,     1,
             1,     1,     1,     1,     1,     1,     1,     1,     1,     1,
             1,     1,     1,     1,     1,     1,     1,     1,     1,     1,
             1,     1,     1,     1,  

**padding = "max_length"** => L'argument padding contrôle le rembourrage. Le texte sera rembourré par des zéros pour que tout le texte ait la longueur de `max_length`. Ainsi, il sera padding à une longueur spécifiée par l'argument `max_length` ou la longueur maximale acceptée par le modèle si aucun max_length n'est fourni. Le remplissage sera toujours appliqué si vous ne fournissez qu'une seule séquence.

**truncation = True** => True ou 'longest_first' : tronque à une longueur maximale spécifiée par l'argument 'max_length' ou à la longueur maximale acceptée par le modèle si aucune longueur maximale n'est fournie (max_length=None). Ceci va tronquer jeton par jeton, en retirant un jeton de la séquence la plus longue de la paire jusqu'à ce que la longueur appropriée soit atteinte.

Comme BERT ne peut accepter en entrée que 512 tokens à la fois, nous devons spécifier le paramètre truncation à True. 

Le paramètre **`add_special_tokens`** permet à BERT d'ajouter des tokens tels que start, end, [SEP], et [CLS]. Le paramètre `Return_tensors = "pt"` permet juste au tokenizer de retourner des tenseurs PyTorch. Si vous ne voulez pas que cela arrive (peut-être que vous voulez qu'il retourne une liste), alors vous pouvez enlever le paramètre et il retournera des listes.

**tokenizer.encode_plus()** renvoie spécifiquement un dictionnaire de valeurs au lieu d'une simple liste de valeurs. Parce que tokenizer.encode_plus() peut retourner de nombreux types d'informations différents, comme les masques d'attention et les identifiants de type de jeton, tout est retourné dans un format de dictionnaire, et si vous voulez récupérer les parties spécifiques de l'encodage, vous pouvez le faire comme suit

In [5]:
input = encoding["input_ids"][0]
attention_mask = encoding["attention_mask"][0]

De plus, comme le tokenizer renvoie un dictionnaire de différentes valeurs, au lieu de trouver ces valeurs comme indiqué ci-dessus et de les passer individuellement dans le modèle, nous pouvons simplement passer l'encodage complet comme ceci

```
output = model(**encoding)
```


Une autre chose très importante à savoir sur le tokenizer est que vous pouvez spécifier la récupération de tokens spécifiques si vous le souhaitez. Par exemple, si vous effectuez une modélisation du langage masqué et que vous souhaitez insérer un masque à un endroit pour que votre modèle le décode, vous pouvez simplement récupérer le token du masque comme suit

In [7]:
tokenizer.mask_token

'<mask>'

## Masked Language Modeling

La modélisation du langage masqué est un moyen d'effectuer la prédiction de mots qui étaient à l'origine cachés intentionnellement dans une phrase.

En termes simples, il s'agit de remplir les blancs.

La modélisation du langage masqué peut être considérée comme similaire à la modélisation de l'auto-encodage, qui fonctionne sur la base de la construction de résultats à partir d'entrées non organisées ou corrompues.

In [8]:
from transformers import BertTokenizer, BertForMaskedLM
from torch.nn import functional as F
import torch


tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')

model = BertForMaskedLM.from_pretrained('bert-base-uncased', return_dict = True)

''' Masked Language Modeling works by inserting a mask token at the desired position where you want to predict the best candidate word that would go in that position.

You can simply insert the mask token by concatenating it at the desired position

The Bert Model for Masked Language Modeling predicts the best word/token in its vocabulary that would replace that word. 

The logits are the output of the BERT Model before a softmax activation function is applied to the output of BERT. 
i.e. logits are the Prediction scores of the language modeling head (scores for each vocabulary token before SoftMax).

And in order to get the logits, we have to specify "return_dict = True" in the parameters when initializing the model, otherwise, the above code will result in a compilation error. 

"return_dict" - If set to True, the model will return a ModelOutput class instead of a plain tuple.

On "return_dict = True" see my note - HuggingFace/input_dict_true_its_purpose.ipynb

'''

text = "The Opera House in Australia is in , " + tokenizer.mask_token + " city"

input = tokenizer.encode_plus(text, return_tensors = "pt")


''' In order to get the tensor of softmax values of all the words in BERT’s vocabulary for replacing the mask token, we need to specify the masked token index.

And these we can get using torch.where(). And in this particular example I am retrieving the top 10 candidate replacement words for the mask token. '''
mask_index = torch.where(input["input_ids"][0] == tokenizer.mask_token_id)

''' mask_token (str or tokenizers.AddedToken, optional) — A special token representing a masked token (used by masked-language modeling pretraining objectives, like BERT). Will be associated to self.mask_token and self.mask_token_id. '''

output = model(**input)

logits = output.logits

''' After we pass the input encoding into the BERT Model, we can get the logits simply by specifying output.logits, which returns a tensor, and after this we can finally apply a softmax activation function to the logits. '''

softmax = F.softmax(logits, dim = -1)
''' By applying a softmax onto the output of BERT, we get probabilistic distributions for each of the words in BERT’s vocabulary. Word’s with a higher probability value will be better candidate replacement words for the mask token.  '''

mask_word = softmax[0, mask_index, :]
''' In order to get the tensor of softmax values of all the words in BERT’s vocabulary for replacing the mask token, we can specify the masked token index, which we already got using torch.where(). 

Further, Because in this particular example I am retrieving the top 10 candidate replacement words for the mask token. '''

top_10 = torch.topk(mask_word, 10, dim = 1)[1][0]
''' I used the torch.topk() function, which allows you to retrieve the top k values in a given tensor, and it returns a tensor containing those top k values. '''

'''  After this, the process becomes relatively simple, as all we have to do is iterate through the tensor, and replace the mask token in the sentence with the candidate token. '''
for token in top_10:
   word = tokenizer.decode([token])
   new_sentence = text.replace(tokenizer.mask_token, word)
   print(new_sentence)

Downloading (…)"pytorch_model.bin";:   0%|          | 0.00/440M [00:00<?, ?B/s]

Some weights of the model checkpoint at bert-base-uncased were not used when initializing BertForMaskedLM: ['cls.seq_relationship.weight', 'cls.seq_relationship.bias']
- This IS expected if you are initializing BertForMaskedLM from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForMaskedLM from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


The Opera House in Australia is in , sydney city
The Opera House in Australia is in , melbourne city
The Opera House in Australia is in , brisbane city
The Opera House in Australia is in , adelaide city
The Opera House in Australia is in , the city
The Opera House in Australia is in , canberra city
The Opera House in Australia is in , auckland city
The Opera House in Australia is in , hobart city
The Opera House in Australia is in , griffith city
The Opera House in Australia is in , hume city


In [13]:
# Test avec camembert
from transformers import pipeline 

camembert_fill_mask  = pipeline("fill-mask", model="camembert-base", tokenizer="camembert-base")
results = camembert_fill_mask("Le camembert est <mask> :)")

for token in results:
   word = token['token_str']
   new_sentence = token['sequence']
   score = token['score']
   print(f'score = {score} completion = {word} new_sentence = {new_sentence}')



score = 0.49091097712516785 completion = délicieux new_sentence = Le camembert est délicieux :)
score = 0.1055697426199913 completion = excellent new_sentence = Le camembert est excellent :)
score = 0.03453319892287254 completion = succulent new_sentence = Le camembert est succulent :)
score = 0.03303128108382225 completion = meilleur new_sentence = Le camembert est meilleur :)
score = 0.030076386407017708 completion = parfait new_sentence = Le camembert est parfait :)


If you want to only get the top candidate word, you can do this:

```py
softmax = F.softmax(logits, dim = -1)

mask_word = softmax[0, mask_index, :]

top_word = torch.argmax(mask_word, dim=1)

print(tokenizer.decode(top_word))
```

Instead of using torch.topk() for retrieving the top 10 values, we just use torch.argmax(), which returns the index of the maximum value in the tensor. The rest of the code is pretty much the same thing as the original code.

---

## Prédiction de la phrase suivante

La prédiction de la phrase suivante est la tâche de prédire si une phrase suit une autre phrase. Voici mon code pour cela :


[BertForNextSentencePrediction](https://huggingface.co/transformers/v4.9.2/model_doc/bert.html#bertfornextsentenceprediction)

Il retourne les logits (torch.FloatTensor of shape (batch_size, 2)) - Les scores de prédiction de la tête de prédiction de la séquence suivante (classification) (les scores de la continuation Vrai/Faux avant SoftMax).

In [None]:
from transformers import BertTokenizer, BertForNextSentencePrediction
import torch
from torch.nn import functional as F
tokenizer = BertTokenizer.from_pretrained('bert-base-uncased')
model = BertForNextSentencePrediction.from_pretrained('bert-base-uncased')

prompt = "I came back from Office in the evening"

next_sentence = "I opened my Beer after Office"

encoding = tokenizer.encode_plus(prompt, next_sentence, return_tensors='pt')
outputs = model(**encoding)[0]
softmax = F.softmax(outputs, dim = 1)
print(softmax)

Some weights of the model checkpoint at bert-base-uncased were not used when initializing BertForNextSentencePrediction: ['cls.predictions.transform.dense.bias', 'cls.predictions.bias', 'cls.predictions.transform.dense.weight', 'cls.predictions.transform.LayerNorm.weight', 'cls.predictions.decoder.weight', 'cls.predictions.transform.LayerNorm.bias']
- This IS expected if you are initializing BertForNextSentencePrediction from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForNextSentencePrediction from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


tensor([[9.9998e-01, 1.5085e-05]], grad_fn=<SoftmaxBackward0>)


La prédiction de la phrase suivante est la tâche qui consiste à prédire la pertinence d'une phrase en tant que phrase suivante pour une phrase donnée. 

Dans ce cas, la variable prompt est la phrase donnée et nous essayons de prédire si next_sentence est la phrase suivante. 


Pour ce faire, le tokenizer de BERT insère automatiquement un token [SEP] entre les phrases, qui représente la séparation entre les deux phrases, et le token Bert spécifique. 

Pour la prédiction de la phrase suivante, le modèle prédit deux valeurs pour savoir si la phrase est la suivante. 

Bert retourne deux valeurs dans un tenseur : la première valeur représente si la deuxième phrase est une continuation de la première, et la deuxième valeur représente si la deuxième phrase est une séquence aléatoire ou n'est pas une bonne continuation de la première. 

### Contrairement à la modélisation du langage masqué, nous ne récupérons pas de logits car nous n'essayons pas de calculer un softmax sur le vocabulaire de BERT ; 

### Nous essayons simplement de calculer une softmax sur les deux valeurs que BERT renvoie pour la prédiction de la prochaine phrase afin de voir quelle valeur a la plus grande probabilité. 

### Et cela représentera si la deuxième phrase est une bonne phrase suivante pour la première. 


Une fois que nous avons obtenu les valeurs softmax, nous pouvons simplement regarder le tenseur en l'imprimant. Voici les valeurs que j'ai obtenues :

`tensor([[0.9953, 0.0047]], grad_fn=<SoftmaxBackward0>)`

Comme la première valeur est considérablement plus élevée que le second indice, BERT pense que la seconde phrase suit la première, ce qui est la bonne réponse.

---

## Question Answering

In [14]:
from transformers import BertTokenizer, BertForQuestionAnswering
import torch

tokenizer = BertTokenizer.from_pretrained("deepset/bert-base-cased-squad2")

model = BertForQuestionAnswering.from_pretrained("deepset/bert-base-cased-squad2")

example_text = "GPT-3 came in 2020"

example_question = "When did GPT-3 come"

# We can use our tokenizer to automatically generate 2 sentence by passing the
# two sequences to tokenizer as two arguments
tokenized_inputs = tokenizer(example_question, example_text, return_tensors="pt")
tokenized_inputs

Downloading (…)solve/main/vocab.txt:   0%|          | 0.00/213k [00:00<?, ?B/s]

Downloading (…)cial_tokens_map.json:   0%|          | 0.00/112 [00:00<?, ?B/s]

Downloading (…)okenizer_config.json:   0%|          | 0.00/152 [00:00<?, ?B/s]

Downloading (…)lve/main/config.json:   0%|          | 0.00/508 [00:00<?, ?B/s]

Downloading (…)"pytorch_model.bin";:   0%|          | 0.00/433M [00:00<?, ?B/s]

{'input_ids': tensor([[  101,  1332,  1225, 15175,  1942,   118,   124,  1435,   102, 15175,
          1942,   118,   124,  1338,  1107, 12795,   102]]), 'token_type_ids': tensor([[0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1, 1]]), 'attention_mask': tensor([[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]])}

Bert QA ajoute la question avant le contexte.

Tokenizer nous retourne 3 tenseurs.

#### "inputs_ids" sont les identifiants tokenisés du texte.

----------------------

### "'token_type_ids' => Pour les comprendre, il faut d'abord noter que certains modèles ont pour but de faire de la classification sur des paires de phrases ou de répondre à des questions.

https://huggingface.co/docs/transformers/v4.20.1/en/glossary#token-type-ids

Ceux-ci nécessitent que deux séquences différentes soient réunies dans une seule entrée "input_ids", ce qui est généralement réalisé à l'aide de jetons spéciaux, tels que les jetons classificateur ([CLS]) et séparateur ([SEP]). Par exemple, le modèle BERT construit ses deux entrées de séquence comme suit


### [CLS] SÉQUENCE_A [SEP] SÉQUENCE_B [SEP]

Nous avons utilisé notre tokenizer pour générer automatiquement une telle phrase en passant les deux séquences au tokenizer comme deux arguments

BERT possède des ID de type de jeton (également appelés ID de segment). Ils sont représentés comme un masque binaire identifiant les deux types de séquences dans le modèle.

Ici, ces deux types de séquences sont les Questions et le Contexte.

Le type de jeton 0 correspond à la partie question et 1 au contexte.


**Le modèle vous dira à quelle position de début et de fin des input_ids la réponse à la question sera située.**

----------------------

In [15]:
text = "The Vatican Apostolic Library (), more commonly called the Vatican Library or simply the Vat, is the library of the Holy See, located in Vatican City. Formally established in 1475, although it is much older, it is one of the oldest libraries in the world and contains one of the most significant collections of historical texts. It has 75,000 codices from throughout history, as well as 1.1 million printed books, which include some 8,500 incunabula.   The Vatican Library is a research library for history, law, philosophy, science and theology. The Vatican Library is open to anyone who can document their qualifications and research needs. Photocopies for private study of pages from books published between 1801 and 1990 can be requested in person or by mail.   In March 2014, the Vatican Library began an initial four-year project of digitising its collection of manuscripts, to be made available online.   The Vatican Secret Archives were separated from the library at the beginning of the 17th century; they contain another 150,000 items.   Scholars have traditionally divided the history of the library into five periods, Pre-Lateran, Lateran, Avignon, Pre-Vatican and Vatican.   The Pre-Lateran period, comprising the initial days of the library, dated from the earliest days of the Church. Only a handful of volumes survive from this period, though some are very significant."

question = "When was the Vat formally opened?"

In [16]:
tokenizer = BertTokenizer.from_pretrained("deepset/bert-base-cased-squad2")

model = BertForQuestionAnswering.from_pretrained("deepset/bert-base-cased-squad2")

tokenized_inputs = tokenizer(question, text, return_tensors="pt")

with torch.no_grad():
    outputs = model(**tokenized_inputs)

answer_start_index = outputs.start_logits.argmax()
answer_end_index = outputs.end_logits.argmax()

''' start_logits (torch.FloatTensor of shape (batch_size, sequence_length)) — Span-start scores (before SoftMax).

end_logits (torch.FloatTensor of shape (batch_size, sequence_length)) — Span-end scores (before SoftMax). '''

predict_answer_tokens = tokenized_inputs.input_ids[0, answer_start_index : answer_end_index + 1]
tokenizer.decode(predict_answer_tokens)

'1475'

In [18]:
# Idem avec camembert
from transformers import pipeline
  
nlp = pipeline('question-answering', model='etalab-ia/camembert-base-squadFR-fquad-piaf', tokenizer='etalab-ia/camembert-base-squadFR-fquad-piaf')  

histoire = """ 
Bonjour je m'appel David. J'ai 46 ans et je suis pationné par la blockchaine, la data science et les cryptos. je cherche à créer un agent conversationnel pouvez vous m'aider 
""" 
 
question = "Qui parle ?"  
reponse = nlp({'question': question,'context': histoire}) 

print(reponse) 
# {'score': 0.8011658374498409, 'start': 282, 'end': 291, 'answer': 'le lièvre'} 

{'score': 0.3366648256778717, 'start': 20, 'end': 27, 'answer': ' David.'}


In [19]:
question = "Quel age à le narateur ?"  
reponse = nlp({'question': question,'context': histoire}) 

print(reponse) 

{'score': 0.8756663203239441, 'start': 32, 'end': 39, 'answer': ' 46 ans'}


In [20]:
question = "Quelles sont les pations du narateur ?"  
reponse = nlp({'question': question,'context': histoire}) 

print(reponse) 

{'score': 0.5125052332878113, 'start': 63, 'end': 111, 'answer': ' la blockchaine, la data science et les cryptos.'}


In [21]:
question = "Quelle est l'intention du narateur ?"  
reponse = nlp({'question': question,'context': histoire}) 

print(reponse)

{'score': 0.32325002551078796, 'start': 124, 'end': 155, 'answer': ' créer un agent conversationnel'}


In [28]:
histoire = """ 
agent: Bonjour que puis je pour vous 
client: Bonjour je voudrais acheter des timbres 
agent: très bien timbre verte ou timbre prioritaire 
client: pour une lettre prioritaire
agent: ok vous pensez la poster à quelle date ?
client: surement demain ou jeudi
""" 
 
question = "Quel est l'intention du client ?"  
reponse = nlp({'question': question,'context': histoire}) 

print(reponse)

{'score': 0.6646493673324585, 'start': 67, 'end': 87, 'answer': ' acheter des timbres'}


In [26]:
question = "Quel jour le client vut il poster sa lettre ?"  
reponse = nlp({'question': question,'context': histoire}) 

print(reponse)

{'score': 0.6371554136276245, 'start': 250, 'end': 266, 'answer': ' demain ou jeudi'}


In [30]:
question = "Quels types de timbres sont proposés par l'agent ?"  
reponse = nlp({'question': question,'context': histoire}) 

print(reponse)

{'score': 0.6232069134712219, 'start': 105, 'end': 140, 'answer': ' timbre verte ou timbre prioritaire'}
