In [29]:
import os
from openai import OpenAI


In [30]:
class Summarizer:

    # ChatGPT model that we will be using everywhere
    openai_model = "gpt-3.5-turbo"


    # Constructor    
    def __init__(self):
        self.apikey = self.get_api_key()


    # Method to get API key
    def get_api_key(self):
        # Specify the file path
        file_path = '.env'

        # Check if the file exists
        if os.path.exists(file_path):
        # Open the file in read mode
           with open(file_path, 'r') as file:
           # Read the content of the file
               content = file.read()

        return content[len('OPENAI_API_KEY=')::] # in .env we have : OPENAI_API_KEY=*******
    


    # Method to summarize a piece of text
    def summarize_text(self, input_text):
        # Instantiate the client
        client = OpenAI(api_key=self.apikey)


        # Make request to chat GPT
        completion = client.chat.completions.create(
            model=self.openai_model,
            messages=[
                {"role": "system", "content": "You are an assistant that is able to read a piece of text and summarize it as described in the prompt."},
                {"role": "user", "content": "Here is the text to be summarized below the newline character.\n {text}".format(text=input_text)}
            ]
        )

        # storing the api response in summary variable
        summary = completion.choices[0].message.content

        # Close the client
        client.close()

        return summary       


    # Method to indentify the topic of a given text
    def topic_identifier(self, input_text):

        # Instantiate the client
        client = OpenAI(api_key=self.apikey)

        # Making the request 
        completion = client.chat.completions.create(
            model=self.openai_model,
            messages=[
                {"role": "system", "content": "You are an assistant that is able to pick the topic of a given text."},
                {"role": "user", "content": "Here is the text that I would like you to identify its topic, below the newline character.\n {text}".format(text=input_text)}
            ]
        )

        # storing the api response in topic variable
        topic = completion.choices[0].message.content

        # Closing the client
        client.close()

        return topic

In [31]:
text='''Un grand modèle de langage (LLM) est un modèle de langage statistique, entraîné sur une grande quantité de données. Il peut être utilisé pour générer et traduire du texte et d'autres contenus, et pour effectuer d'autres tâches de traitement du langage naturel (TLN).
Les LLM sont généralement basés sur des architectures de deep learning, comme le modèle Transformer développé par Google en 2017, et peuvent être entraînés sur des milliards de texte et d'autres contenus.
Les LLM basés sur du texte sont utilisés pour diverses tâches de traitement du langage naturel, comme la génération de texte, la traduction automatique, la synthèse de texte, les systèmes de questions-réponses et la création de chatbots capables de tenir des conversations avec des humains.
Les LLM peuvent également être entraînés sur d'autres types de données, y compris du code, des images, de l'audio, des vidéos, etc. Codey, Imagen et Chirp de Google sont des exemples de modèles qui permettront de lancer de nouvelles applications et de concevoir des solutions pour le les problèmes les plus difficiles du monde.'''

In [36]:
object = Summarizer()
text_topic = object.topic_identifier(text)
print(text_topic)

The topic of the text is "Les grands modèles de langage" (Large Language Models).


In [37]:
text_summary=object.summarize_text(text)
print(text_summary)

Les grands modèles de langage (LLM) sont des modèles de langage statistique utilisés pour générer, traduire et traiter du texte. Ils sont basés sur des architectures de deep learning, comme le modèle Transformer, et peuvent être entraînés sur de grandes quantités de données. Les LLM peuvent être utilisés dans différentes tâches de traitement du langage naturel, comme la génération de texte, la traduction automatique et la création de chatbots. Ils peuvent également être entraînés sur d'autres types de données, tels que le code, les images, l'audio et les vidéos, pour résoudre des problèmes complexes.


In [34]:
len(text)

1090

In [38]:
len(text_summary)

607