In [63]:
import pandas as pd
from sklearn.metrics.pairwise import cosine_similarity
from sklearn.preprocessing import StandardScaler
import os

In [64]:
df_skills = pd.read_csv('skills_resultado.csv')

In [65]:
df_skills.columns

Index(['name', 'overall', 'potential', 'value_million_euro', 'position',
       'nationality', 'age', 'height', 'team', 'formation', 'league',
       'wage_million_euro', 'preferred_foot', 'weak_foot_rating',
       'skill_moves', 'attacking_work_rate', 'defensive_work_rate',
       'pace_total', 'shooting_total', 'passing_total', 'dribbling_total',
       'defending_total', 'physicality_total', 'finishing', 'heading_accuracy',
       'dribbling', 'ball_control', 'balance', 'shot_power', 'strength',
       'long_shots', 'aggression', 'positioning', 'vision', 'penalties',
       'mentality', 'goalkeeper_diving', 'goalkeeper_handling',
       'goalkeeper_kicking', 'goalkeeper_positioning', 'goalkeeper_reflexes',
       'passing', 'speed'],
      dtype='object')

AIzaSyA-k4jroM3S22TQ1oM3yufo82l-kwelBJo

In [66]:
import pandas as pd
from sklearn.metrics.pairwise import cosine_similarity
from sklearn.preprocessing import StandardScaler
import google.generativeai as genai
import os


In [67]:
# Configurar la clave API desde variables de entorno
api_key = "AIzaSyA-k4jroM3S22TQ1oM3yufo82l-kwelBJo"
if api_key is None:
    raise ValueError("Falta configurar la clave API. Asegúrate de que GOOGLE_API_KEY esté configurada.")

genai.configure(api_key=api_key)

In [68]:
# Cargar el dataset
def load_dataset(filepath):
    try:
        dataset = pd.read_csv(filepath)
        print(f"Dataset cargado correctamente con {dataset.shape[0]} registros y {dataset.shape[1]} columnas.")
        return dataset
    except Exception as e:
        raise FileNotFoundError(f"No se pudo cargar el dataset. Error: {e}")

In [69]:
# Normalizar datos y calcular similitud
def find_similar_players(dataset, target_player, top_n=5):
    numeric_features = ["pace_total", "shooting_total", "passing_total", "defending_total", "dribbling_total", "physicality_total"]
    
    # Verificar que las columnas necesarias existan en el dataset
    for feature in numeric_features:
        if feature not in dataset.columns:
            raise ValueError(f"La columna '{feature}' no existe en el dataset.")
    
    scaler = StandardScaler()
    dataset_scaled = scaler.fit_transform(dataset[numeric_features])

    # Buscar al jugador objetivo
    try:
        target_index = dataset[dataset["name"] == target_player].index[0]
    except IndexError:
        return f"El jugador '{target_player}' no está en el dataset."

    # Calcular similitudes usando coseno
    similarities = cosine_similarity([dataset_scaled[target_index]], dataset_scaled)[0]
    dataset["Similitud"] = similarities
    similar_players = dataset.sort_values(by="Similitud", ascending=False).head(top_n + 1)

    return similar_players[["name", "position", "Similitud"]].iloc[1:]  # Excluir al propio jugador

In [None]:
# Generar respuesta con Gemini
def ask_gemini_for_recommendation(player_description, similar_players):
    prompt = f"""
Eres un experto en análisis de jugadores de fútbol.

### Descripción del tipo de jugador requerido:
{player_description}

### Lista de jugadores similares encontrados:
{similar_players.to_string(index=False)}

Con base en las estadísticas proporcionadas, selecciona el jugador más adecuado. Explica tu recomendación en términos de las métricas disponibles como posición, 
similitud y habilidades clave. Profundisa en porque es el jugador ideal para remplazar al jugador objetivo.
"""
    try:
        model = genai.GenerativeModel("gemini-pro")
        response = model.generate_content(prompt)
        return response.text.strip()
    except Exception as e:
        return f"Error en la API de Gemini: {str(e)}"

In [71]:
# Main
if __name__ == "__main__":
    # Ruta del dataset (ajusta la ruta si es necesario)
    dataset_path = "skills_resultado.csv"

    try:
        dataset = load_dataset(dataset_path)
    except FileNotFoundError as e:
        print(e)
        exit()

    # Solicitar entradas del usuario
    player_description = input("Describe el tipo de jugador que buscas (ej. rápido y fuerte delantero): ")
    target_player = input("Escribe el nombre de un jugador para buscar similitudes (ej. Erling Haaland): ")

    # Encontrar jugadores similares
    similar_players = find_similar_players(df_skills, target_player)
    if isinstance(similar_players, str):  # Si ocurrió un error
        print(similar_players)
    else:
        print("\nJugadores similares encontrados:")
        print(similar_players)

        # Obtener recomendación de Gemini
        gemini_recommendation = ask_gemini_for_recommendation(player_description, similar_players)
        print("\nRecomendación de Gemini:")
        print(gemini_recommendation)

Dataset cargado correctamente con 18534 registros y 89 columnas.

Jugadores similares encontrados:
                name    position  Similitud
112        Luis Díaz     Forward   0.992710
108  Federico Chiesa     Forward   0.992475
10        Sadio Mané  Midfielder   0.991089
487  Karim Bellarabi  Midfielder   0.990937
232    Wilfried Zaha     Forward   0.990801

Recomendación de Gemini:
**Jugador más adecuado:** Luis Díaz

**Razones:**

* **Posición:** Luis Díaz juega como delantero, la misma posición que el jugador objetivo. Esto asegura que encajará en el sistema táctico del equipo.

* **Similitud:** Luis Díaz tiene la mayor similitud (0,992710) con el jugador objetivo, lo que indica que sus estilos de juego y habilidades son muy similares.

* **Habilidades clave:** Aunque la lista proporcionada no incluye métricas específicas de habilidades, Luis Díaz es conocido por ser un delantero rápido, hábil y con buen ojo para el gol. Estas habilidades se alinean bien con las características t