In [5]:
import torch
import nltk
nltk.download("punkt")
nltk.download("punkt_tab")
from nltk.tokenize import word_tokenize
from collections import Counter
from torch.utils.data import DataLoader, Dataset

# Exemple 
texte = "Le chat mange une souris. Le chien joue dans le jardin"
tokens = word_tokenize(texte)

print("Tokens :", tokens )

[nltk_data] Downloading package punkt to
[nltk_data]     C:\Users\Mousky\AppData\Roaming\nltk_data...
[nltk_data]   Package punkt is already up-to-date!
[nltk_data] Downloading package punkt_tab to
[nltk_data]     C:\Users\Mousky\AppData\Roaming\nltk_data...
[nltk_data]   Unzipping tokenizers\punkt_tab.zip.


Tokens : ['Le', 'chat', 'mange', 'une', 'souris', '.', 'Le', 'chien', 'joue', 'dans', 'le', 'jardin']


In [6]:
# Construire le vocabulaire
counter = Counter(tokens)
vocab = {word: i for i, (word, _) in enumerate(counter.items())}
print("Vocabulaire :", vocab)

# Convertir les tokens en indices
indices = [vocab[token] for token in tokens]
print("Indices :", indices)

Vocabulaire : {'Le': 0, 'chat': 1, 'mange': 2, 'une': 3, 'souris': 4, '.': 5, 'chien': 6, 'joue': 7, 'dans': 8, 'le': 9, 'jardin': 10}
Indices : [0, 1, 2, 3, 4, 5, 0, 6, 7, 8, 9, 10]


In [8]:
class LanguageDataset(Dataset):
    def __init__(self, indices, context_size=2):
        self.data = []
        for i in range(len(indices) - context_size):
            self.data.append((indices[i:i+context_size], indices[i+context_size]))
   
    def __len__(self):
        return len(self.data)
   
    def __getitem__(self, idx):
        return torch.tensor(self.data[idx][0]), torch.tensor(self.data[idx][1])

# Paramètres
context_size = 2  # Taille du contexte (2 mots précédents)
dataset = LanguageDataset(indices, context_size)
dataloader = DataLoader(dataset, batch_size=2, shuffle=True)

# Exemple de données
for x, y in dataloader:
    print("Entrée (contexte) :", x)
    print("Cible :", y)
    break

Entrée (contexte) : tensor([[4, 5],
        [5, 0]])
Cible : tensor([0, 6])


In [9]:
import torch.nn as nn

class SimpleLM(nn.Module):
    def __init__(self, vocab_size, embed_dim, context_size):
        super(SimpleLM, self).__init__()
        self.embeddings = nn.Embedding(vocab_size, embed_dim)
        self.linear1 = nn.Linear(embed_dim * context_size, 128)
        self.linear2 = nn.Linear(128, vocab_size)
        self.relu = nn.ReLU()
   
    def forward(self, x):
        embeds = self.embeddings(x).view(x.size(0), -1)  # Embedding -> aplatissement
        out = self.linear1(embeds)
        out = self.relu(out)
        out = self.linear2(out)
        return out

# Initialisation du modèle
vocab_size = len(vocab)
embed_dim = 10
model = SimpleLM(vocab_size, embed_dim, context_size)
print(model)

SimpleLM(
  (embeddings): Embedding(11, 10)
  (linear1): Linear(in_features=20, out_features=128, bias=True)
  (linear2): Linear(in_features=128, out_features=11, bias=True)
  (relu): ReLU()
)


In [10]:
def predict_next_word(context):
    with torch.no_grad():
        context_indices = torch.tensor([[vocab[word] for word in context]])
        output = model(context_indices)
        predicted_index = torch.argmax(output, dim=1).item()
        for word, idx in vocab.items():
            if idx == predicted_index:
                return word

# Exemple de prédiction
context = ['le','chien']
predicted_word = predict_next_word(context)
print(f"Contexte : {context}, Mot prédit : {predicted_word}")

Contexte : ['le', 'chien'], Mot prédit : souris


In [5]:
import os
import requests
import streamlit as st
import google.generativeai as genai

# Définir la variable d'environnement
os.environ["GEMINI_API_KEY"] = "AIzaSyCqozHPzc1NRb-Xf4t6DEYTDIutFcOe_bU"

# Configurer l'API Gemini
genai.configure(api_key=os.environ["GEMINI_API_KEY"])

generation_config = {
    "temperature": 1,
    "top_p": 0.95,
    "top_k": 40,
    "max_output_tokens": 8192,
    "response_mime_type": "text/plain",
}

model = genai.GenerativeModel(
    model_name="gemini-2.0-flash-exp",
    generation_config=generation_config,
)

# API de football (exemple d'URL, à adapter selon votre fournisseur d'API)
FOOTBALL_API_KEY = os.getenv("734eef5ca3msh5d81108492b36d8p19753cjs")  # Ajoutez votre clé API
FOOTBALL_API_URL = "https://api-football-v1.p.rapidapi.com/v2/odds/league/865927/bookmaker/5?page=2"  # Exemple

headers = {"Authorization": f"Bearer {FOOTBALL_API_KEY}"}

# Fonction pour récupérer les données des joueurs
def get_player_stats(player_name):
    """Recherche les statistiques d'un joueur via une API de football."""
    response = requests.get(
        f"{FOOTBALL_API_URL}?search={player_name}",
        headers=headers,
    )
    if response.status_code == 200:
        return response.json()  # Retourne les données sous forme JSON
    else:
        return {"error": "Impossible de récupérer les données du joueur."}

# Fonction pour générer une réponse avec Gemini
def generate_response(prompt):
    """Utilise Gemini pour générer des réponses basées sur un prompt."""
    chat_session = model.start_chat(history=[])
    response = chat_session.send_message(prompt)
    return response.text

# Interface Streamlit
st.title("LLM sur les nominés au Ballon d'Or")
st.markdown("Posez vos questions sur les nominés au Ballon d'Or et obtenez des réponses intelligentes !")

# Liste des nominés (vous pouvez enrichir ou lier à une API pour dynamiser cette partie)
nominees = [
    "Lionel Messi",
    "Erling Haaland",
    "Kylian Mbappé",
    "Kevin De Bruyne",
    "Robert Lewandowski",
    "Karim Benzema",
    "Mohamed Salah",
]

# Sélection du joueur
player = st.selectbox("Sélectionnez un joueur :", nominees)

# Entrée de question
question = st.text_input("Posez une question :", placeholder="Exemple : Quelles sont ses statistiques cette saison ?")

# Actions
if st.button("Obtenir une réponse"):
    if player and question:
        # Récupération des données du joueur
        stats = get_player_stats(player)

        # Construction du prompt
        prompt = f"Voici les données disponibles pour {player} : {stats}. Maintenant, réponds à la question : {question}"

        # Génération de réponse avec Gemini
        answer = generate_response(prompt)

        # Affichage de la réponse
        st.markdown(f"**Réponse :** {answer}")
    else:
        st.error("Veuillez sélectionner un joueur et poser une question.")


2024-12-19 12:24:34.253 
  command:

    streamlit run C:\Users\Mousky\anaconda3\Anaconda3\Lib\site-packages\ipykernel_launcher.py [ARGUMENTS]
2024-12-19 12:24:34.255 Session state does not function when running a script without `streamlit run`


In [8]:
streamlit run Untitled.ipynb

SyntaxError: invalid syntax (1021910414.py, line 1)