L'architecture de GPT-3 repose sur un réseau neuronal de type Transformer, conçu spécifiquement pour traiter des données séquentielles telles que du texte.

### Vue d'ensemble de l'architecture :
- **Architecture Transformer :** L'architecture de GPT-3 est basée sur le modèle transformer, qui utilise des mécanismes d'auto-attention pour pondérer différents mots dans une phrase et comprendre les relations entre eux. Cela permet au modèle de capturer les dépendances à longue portée dans le texte d'entrée.
- **Attention multi-têtes :** Il utilise une auto-attention multi-têtes, permettant au modèle de se concentrer sur différentes parties du texte d'entrée simultanément, capturant ainsi des relations diverses au sein du texte.
- **Encodage positionnel :** Pour conserver l'ordre séquentiel des mots, des encodages positionnels sont ajoutés aux plongements d'entrée, fournissant au modèle des informations sur la position des mots dans la séquence.
- **Réseaux neuronaux à propagation avant :** GPT-3 est également constitué de réseaux neuronaux à propagation avant, qui traitent les informations recueillies par les mécanismes d'attention.

### Pré-entraînement :
GPT-3 est pré-entraîné à l'aide d'une vaste quantité de données textuelles provenant d'Internet, de livres, d'articles, etc. Le processus de pré-entraînement comprend deux étapes clés :

- **Apprentissage non supervisé :** Le modèle apprend à partir des données textuelles en prédisant le mot suivant dans une séquence de mots. Ce processus est appelé "modélisation de langage masqué". Des portions du texte d'entrée sont masquées de manière aléatoire, et le modèle est entraîné à prédire les mots manquants en se basant sur le contexte environnant.
- **Ajustement fin :** Après le pré-entraînement sur un corpus important de textes, GPT-3 peut être affiné sur des ensembles de données spécifiques à une tâche ou à un domaine. Cet affinement permet au modèle de se spécialiser dans diverses tâches telles que la traduction, la résumé, la réponse à des questions, etc.

### Échelle et paramètres :
GPT-3 est reconnu pour sa taille immense, contenant 175 milliards de paramètres. Un nombre plus élevé de paramètres signifie généralement que le modèle peut capturer un plus large éventail de schémas et de nuances dans les données, ce qui se traduit par de meilleures performances dans diverses tâches linguistiques.

### Avancées et capacités :
- GPT-3 présente de solides capacités de génération de langage, produisant un texte pertinent et cohérent sur une large gamme de sujets.
- Il a montré des performances impressionnantes dans des tâches telles que la traduction, le résumé, la réponse à des questions, le complément de texte, etc., sans entraînement spécifique à une tâche.
- La grande échelle de GPT-3 lui permet de générer des réponses humaines et de comprendre des nuances linguistiques complexes, le rendant polyvalent dans la compréhension et la génération de langage naturel.

En somme, l'architecture de GPT-3, ses méthodes de pré-entraînement et sa taille massive contribuent à ses remarquables capacités linguistiques et à sa polyvalence dans diverses tâches de traitement de langage naturel.

### Mécanismes de Prompting(Guides)  :
La capacité du GPT-3 à gérer ces scénarios repose sur son architecture et la manière dont il interprète les guides. En fournissant au modèle des guides ou des exemples soigneusement conçus, les utilisateurs peuvent orienter sa compréhension et façonner la direction de sa sortie. Le guide sert de repère pour le modèle, le dirigeant vers la tâche ou le contexte souhaité.

La préformation à grande échelle du modèle sur des données textuelles diverses lui permet de généraliser sur différentes tâches et domaines, lui permettant d'exceller dans ces scénarios d'apprentissage en quelques exemples, d'un seul exemple ou même sans exemple supplémentaire, ce qui le rend polyvalent pour un large éventail de tâches de traitement du langage naturel.

<img src="https://drive.google.com/uc?export=view&id=1duewWXVGFIP9hrXR7ZdOvQyYAhGiPZrT">



### Apprentissage en Quelques Exemples :
Dans ce scénario, le modèle reçoit un petit nombre d'exemples ("quelques exemples") pour une tâche spécifique avant de faire des prédictions. GPT-3 peut accomplir cela en fournissant au modèle un contexte ou des exemples liés à la tâche qu'il doit effectuer. Par exemple, s'il doit compléter une phrase ou réaliser une traduction, il peut être alimenté avec quelques exemples ou un guide pour orienter sa compréhension de la tâche.

### Apprentissage d'un Seul Exemple :
Ici, le modèle est exposé à un seul exemple ou à une quantité d'informations très limitée avant d'effectuer une tâche. GPT-3 démontre sa capacité dans ce domaine en utilisant un seul exemple ou un guide pour générer ou comprendre du texte en fonction du contexte donné.

### Apprentissage sans Exemple :
L'apprentissage sans exemple survient lorsque le modèle effectue une tâche sans formation spécifique sur cette tâche. GPT-3 excelle dans ces scénarios grâce à sa vaste connaissance préalable. Même s'il n'a pas été explicitement entraîné sur une tâche particulière, il peut générer des réponses raisonnables ou s'en sortir correctement en utilisant le contexte fourni dans le guide et sa compréhension préalable du langage issue de ses données d'entraînement.



In [None]:
# Install openai python library
!pip install openai
!pip install scikit-learn

In [None]:
En l'état de mes informations en janvier 2022, "Text-Ada-101" désigne une variante du modèle GPT-3 d'OpenAI, spécifiquement adaptée et affinée pour les tâches de programmation et de code. Cette variante a été créée pour exceller dans la compréhension et la génération de morceaux de code, fournissant une assistance pour les requêtes liées à la programmation et aidant dans diverses tâches de développement logiciel.

Text-Ada-101 est basé sur l'architecture de GPT-3, mais il a été affiné à partir d'ensembles de données principalement constitués de langages de programmation, d'échantillons de code et de textes techniques connexes. Cette spécialisation lui permet de mieux comprendre la syntaxe de programmation, la logique et d'aider à générer des extraits de code ou des explications pour des questions liées au codage.

Son utilisation concerne le développement logiciel, les plates-formes d'assistance au codage, l'écriture technique, les outils éducatifs pour la programmation et tout domaine nécessitant une assistance basée sur l'IA pour les tâches de codage. Les développeurs, programmeurs, éducateurs et toute personne cherchant de l'aide pour des problèmes de codage ou des explications peuvent utiliser Text-Ada-101 pour améliorer leur productivité et leur compréhension dans les domaines liés à la programmation.

L'API OpenAI est une plateforme qui donne accès à divers modèles d'IA développés par OpenAI, dont GPT-3 (Generative Pre-trained Transformer 3). Elle permet aux développeurs d'intégrer ces modèles dans leurs applications, exploitant ainsi les capacités de l'IA pour des tâches de traitement du langage naturel.

### Utilisation de l'API OpenAI pour solliciter GPT-3 :
L'API permet aux utilisateurs d'interagir avec GPT-3 en envoyant des requêtes contenant des invites (prompts) - des entrées textuelles qui guident le modèle sur la tâche à effectuer ou le type de sortie à générer. Les utilisateurs peuvent spécifier les paramètres du modèle, tels que l'invite, le nombre de jetons (mots) dans la réponse, ainsi que d'autres réglages comme la température (qui contrôle le degré de variation du texte généré) et le nombre maximal de jetons.

Par exemple, un utilisateur pourrait fournir une invite du type "Traduire la phrase suivante en espagnol", suivie de la phrase à traduire. L'API traitera cette invite et générera une réponse en conséquence.

<img src="https://drive.google.com/uc?export=view&id=1d9G8kbNjN5zD2w3ZHq6ezRIJH_4ShNEJ">

### Moteurs de ChatGPT-3 :
ChatGPT-3 propose différents moteurs ou variantes qui répondent à des besoins spécifiques ou offrent des compromis en termes de performances, de coûts et de rapidité de réponse. Ces moteurs varient selon le nombre de jetons qu'ils peuvent traiter, impactant ainsi les capacités du modèle et le coût associé à leur utilisation.



1. **Davinci :** Davinci est la variante la plus puissante et complète, offrant la plus grande taille de modèle et traitant jusqu'à 4096 jetons par invite. Il est capable de gérer des tâches complexes et de générer des réponses plus longues et détaillées.

2. **Curie :** Curie est une version plus réduite par rapport à Davinci, avec une limite de 2048 jetons par invite. Elle est conçue pour équilibrer performances et coûts, adaptée à diverses tâches de conversation et offrant des réponses raisonnables dans des limites spécifiques.

3. **Babbage :** Babbage est la variante la plus petite, traitant jusqu'à 1024 jetons par invite. Elle est plus rentable et adaptée à des scénarios où des réponses plus courtes ou une puissance de traitement limitée sont suffisantes.


### Cas d'utilisation pour différents moteurs :
- **Davinci :** Idéal pour des applications exigeantes nécessitant une compréhension sophistiquée du langage, le traitement d'un contexte étendu et la génération de contenus plus longs. Les cas d'utilisation incluent la création de contenu, les systèmes de dialogue complexes et la compréhension approfondie du langage naturel.

- **Curie :** Adapté à une grande variété d'applications conversationnelles, au support client, aux chatbots et aux scénarios où un bon équilibre entre capacités et coûts est nécessaire.

- **Babbage :** Rentable pour des tâches plus simples telles que la génération de contenus courts, les chatbots plus simples et les applications où des réponses plus courtes sont acceptables.

Le choix du moteur approprié dépend des exigences spécifiques de l'application, en tenant compte de facteurs tels que la puissance de traitement, le coût, la longueur des réponses et la complexité des tâches.

In [None]:
import os
import openai

Pour configurer un moteur openai, nous devons trouver l'identifiant de l'organisation et la clé de l'api. Pour trouver l'identifiant de l'organisation, allez sur [https://beta.openai.com/account/org-settings](https://beta.openai.com/account/org-settings) et copiez la valeur de l'identifiant de l'organisation. Pour trouver la clé api, allez sur [https://beta.openai.com/account/api-keys](https://beta.openai.com/account/api-keys) et copiez la valeur de la clé secrète.

In [None]:
openai.organization = ""
openai.api_key = ""

Pour tenter de reproduire les résultats de l'étude "Language models are few shot learners", nous utiliserons l'ensemble de données IMDB reviews.

In [None]:
!pip install datasets

Collecting datasets
  Downloading datasets-2.2.1-py3-none-any.whl (342 kB)
[K     |████████████████████████████████| 342 kB 4.9 MB/s 
Collecting huggingface-hub<1.0.0,>=0.1.0
  Downloading huggingface_hub-0.6.0-py3-none-any.whl (84 kB)
[K     |████████████████████████████████| 84 kB 2.9 MB/s 
Collecting aiohttp
  Downloading aiohttp-3.8.1-cp37-cp37m-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_12_x86_64.manylinux2010_x86_64.whl (1.1 MB)
[K     |████████████████████████████████| 1.1 MB 48.0 MB/s 
Collecting xxhash
  Downloading xxhash-3.0.0-cp37-cp37m-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (212 kB)
[K     |████████████████████████████████| 212 kB 64.1 MB/s 
[?25hCollecting fsspec[http]>=2021.05.0
  Downloading fsspec-2022.3.0-py3-none-any.whl (136 kB)
[K     |████████████████████████████████| 136 kB 70.7 MB/s 
Collecting responses<0.19
  Downloading responses-0.18.0-py3-none-any.whl (38 kB)
Collecting urllib3!=1.25.0,!=1.25.1,<1.26,>=1.21.1
  Downloading urllib3-1.25

In [None]:
from datasets import load_dataset
dataset = load_dataset("imdb")

Downloading builder script:   0%|          | 0.00/1.79k [00:00<?, ?B/s]

Downloading metadata:   0%|          | 0.00/1.05k [00:00<?, ?B/s]

Downloading and preparing dataset imdb/plain_text (download: 80.23 MiB, generated: 127.02 MiB, post-processed: Unknown size, total: 207.25 MiB) to /root/.cache/huggingface/datasets/imdb/plain_text/1.0.0/2fdd8b9bcadd6e7055e742a706876ba43f19faee861df134affd7a3f60fc38a1...


Downloading data:   0%|          | 0.00/84.1M [00:00<?, ?B/s]

Generating train split:   0%|          | 0/25000 [00:00<?, ? examples/s]

Generating test split:   0%|          | 0/25000 [00:00<?, ? examples/s]

Generating unsupervised split:   0%|          | 0/50000 [00:00<?, ? examples/s]

Dataset imdb downloaded and prepared to /root/.cache/huggingface/datasets/imdb/plain_text/1.0.0/2fdd8b9bcadd6e7055e742a706876ba43f19faee861df134affd7a3f60fc38a1. Subsequent calls will reuse this data.


  0%|          | 0/3 [00:00<?, ?it/s]

In [None]:
dataset

DatasetDict({
    train: Dataset({
        features: ['text', 'label'],
        num_rows: 25000
    })
    test: Dataset({
        features: ['text', 'label'],
        num_rows: 25000
    })
    unsupervised: Dataset({
        features: ['text', 'label'],
        num_rows: 50000
    })
})

## Préparation de l'ensemble de données

Nous ne prendrons qu'un petit échantillon de l'ensemble de données de test pour tester les performances.

In [None]:
import random
random.seed(11)
sample = random.sample(list(dataset["test"]), 100)
test_examples = [(example["text"], example["label"]) for example in sample]
y_true = [label for _, label in test_examples]

In [None]:
review = test_examples[0][0]
print(review)
print(f"Sentiment is: {'Positive' if y_true[0] == 1 else 'Negative'}")

THE NEXT KARATE KID, in my opinion, is an excellent martial arts flick. I thought that Eric (Chris Conrad) and Julie (Hilary Swank) looked good in their prom attire. To me, Ned (Michael Cavalieri) was a real bully. This was because he got Julie in trouble with Principal Wilkes (Eugene Boles). If you ask me, Colonel Dugan (Michael Ironside) was a pure a******! This was because he was a very harsh man who wouldn't tolerate mistakes. My favorite parts were the prom and the showdown between Julie and the Alpha Elite. In conclusion, I highly recommend this smash hit to all of you who like martial-arts flicks or are fans of Hilary Swank.
Sentiment is: Positive


Nous pouvons utiliser l'API pour demander au modèle de prédire si le sentiment est positif ou négatif.

 Voici un exemple de guide pour l'analyse de sentiment sur des critiques de films de la base de données IMDb :

```
Tâche : Analyse de sentiment sur les critiques de films IMDb

Guide :
"Pouvez-vous analyser le sentiment de la critique de film IMDb suivante ?
Critique : 'Ce film était absolument fantastique, le jeu d'acteur était superbe et l'histoire m'a captivé du début à la fin. Je le recommande vivement !'
Sentiment : Positif"

Question : "Quel est le sentiment de la critique IMDb ci-dessous ?"
Critique : "L'intrigue était déroutante et le jeu d'acteur semblait forcé. Je ne le regarderais pas à nouveau."
Sentiment :
```

Dans cet exemple, vous guidez le modèle pour analyser le sentiment d'une critique de film IMDb. Le guide fournit une critique positive comme exemple et demande au modèle de déterminer le sentiment d'une autre critique qui est plus négative.

En soumettant ce guide à GPT-3 via l'API OpenAI, le modèle devrait générer une réponse prédisant le sentiment de la critique négative fournie, indiquant s'il s'agit d'un sentiment positif, négatif ou neutre.




In [None]:
def get_sentiment(engine, review):
  review = review.replace('\n', "")
  response = openai.Completion.create(
    engine=engine,
    prompt=f"Decide whether a review's sentiment is positive or negative.: \n\nReview: {review} \nSentiment:",
    temperature=0,
    max_tokens=1,
    top_p=1,
    frequency_penalty=0.5,
    presence_penalty=0
  )
  return response
get_sentiment("text-ada-001", review)

<OpenAIObject text_completion id=cmpl-58e4pQYWEClUaziNJm5PYBgpfhsrU at 0x7f638801e710> JSON: {
  "choices": [
    {
      "finish_reason": "length",
      "index": 0,
      "logprobs": null,
      "text": " Positive"
    }
  ],
  "created": 1652742363,
  "id": "cmpl-58e4pQYWEClUaziNJm5PYBgpfhsrU",
  "model": "text-ada-001",
  "object": "text_completion"
}



La function `encode_and_filter_ilegal_labels` est utilisé pour restreindre ou filtrer les sorties possibles générées par GPT-3, en veillant à ce que seules des étiquettes ou catégories spécifiées soient autorisées en tant que réponses. Cela peut être utile lorsque vous souhaitez contrôler la gamme des sorties possibles et les limiter à un ensemble spécifique d'options.


In [None]:
from tqdm import tqdm
from sklearn.metrics import accuracy_score, f1_score, precision_score, recall_score
import json

def get_predictions(engine, dataset):
  y_pred = []
  for review, label in tqdm(dataset):
    y_pred.append(get_sentiment(engine, review)["choices"][0]["text"].strip())
  return y_pred

def encode_and_filter_ilegal_labels(y_pred, y_true):
  y_pred_encoded = []
  for pred in y_pred:
    pred = pred.lower()
    if pred == "positive":
      y_pred_encoded.append(1)
    elif pred == "negative":
      y_pred_encoded.append(0)
    else:
      y_pred_encoded.append(-1)
  y_pred_processed = []
  y_true_processed = []
  for pred, label in zip(y_pred_encoded, y_true):
    if pred == -1:
      continue
    y_pred_processed.append(pred)
    y_true_processed.append(label)
  return y_pred_processed, y_true_processed

def eval_performance(y_pred, y_true):
  print(json.dumps({
      "accuracy": accuracy_score(y_pred, y_true),
      "f1": f1_score(y_pred, y_true),
      "precision": precision_score(y_pred, y_true),
      "recall": recall_score(y_pred, y_true)
  }, indent=2))

In [None]:
y_pred = get_predictions("text-ada-001", test_examples)
y_pred_processed, y_true_processed = encode_and_filter_ilegal_labels(y_pred, y_true)
eval_performance(y_pred_processed, y_true_processed)


100%|██████████| 100/100 [03:51<00:00,  2.32s/it]

{
  "accuracy": 0.8586956521739131,
  "f1": 0.8686868686868686,
  "precision": 0.8958333333333334,
  "recall": 0.8431372549019608
}





Les performances de l'engine 'text-ada-001' utilisant la configuration Zero-shot sont donc plutôt bonnes. Vérifions maintenant si un modèle plus grand aura de meilleures performances.

In [None]:
y_pred = get_predictions("text-davinci-002", test_examples)
y_pred_processed, y_true_processed = encode_and_filter_ilegal_labels(y_pred, y_true)
eval_performance(y_pred_processed, y_true_processed)


100%|██████████| 100/100 [01:39<00:00,  1.00it/s]

{
  "accuracy": 0.9081632653061225,
  "f1": 0.9052631578947369,
  "precision": 0.8775510204081632,
  "recall": 0.9347826086956522
}





Les résultats de la classification "zero shot" à l'aide de GPT3 sont assez impressionnants.Fournissons au modèle deux exemples, l'un positif et l'autre négatif, et procédons plutôt à une classification en deux temps.

In [None]:
def get_sentiment_with_examples(engine, examples, review):
  context_text = ""
  for example_review, label in examples:
    sentiment = "Positive" if label == 1 else "Negative"
    context_text += f"\n Review: {example_review} => Sentiment: {sentiment}"
  prompt=f"Decide whether a review's sentiment is positive or negative.: \n{context_text}\n Review: {review} => Sentiment:"
  review = review.replace('\n', "")
  response = openai.Completion.create(
    engine=engine,
    prompt=prompt,
    temperature=0,
    max_tokens=1,
    top_p=1,
    frequency_penalty=0.5,
    presence_penalty=0
  )
  return response


In [None]:
def get_predictions_with_context(engine, context, dataset):
  y_pred = []
  for review, label in tqdm(dataset):
    y_pred.append(get_sentiment_with_examples(engine, context, review)["choices"][0]["text"].strip())
  return y_pred

In [None]:
positive_examples = [(example["text"], 1) for example in dataset["train"] if example["label"] == 1]
negative_examples = [(example["text"], 0) for example in dataset["train"] if example["label"] == 0]

# Quelques exemples positifs de l'ensemble de données d'entraînement
positive_sample = random.sample(positive_examples, 10)
# Quelques exemples négatifs de l'ensemble de données d'entraînement
negative_sample = random.sample(negative_examples, 10)


In [None]:
y_pred = get_predictions_with_context("text-davinci-002", [positive_sample[0], negative_examples[0]], test_examples)
y_pred_processed, y_true_processed = encode_and_filter_ilegal_labels(y_pred, y_true)
eval_performance(y_pred_processed, y_true_processed)


100%|██████████| 100/100 [00:31<00:00,  3.16it/s]

{
  "accuracy": 0.91,
  "f1": 0.9090909090909091,
  "precision": 0.8823529411764706,
  "recall": 0.9375
}





Testons maintenant si plus de contexte peut améliorer la performance, nous ferons une classification à 6 coups.

In [None]:
random.shuffle(positive_sample)
random.shuffle(negative_sample)
context = positive_sample[:3] + negative_sample[:3]
random.shuffle(context)
y_pred = get_predictions_with_context("text-davinci-002", context, test_examples)
y_pred_processed, y_true_processed = encode_and_filter_ilegal_labels(y_pred, y_true)
eval_performance(y_pred_processed, y_true_processed)


100%|██████████| 100/100 [00:30<00:00,  3.28it/s]

{
  "accuracy": 0.92,
  "f1": 0.92,
  "precision": 0.9019607843137255,
  "recall": 0.9387755102040817
}



