## Análisis con Pandas y Kaggle (Core)

### **Objetivo**

El objetivo de esta actividad es poner en práctica todos los conocimientos adquiridos sobre Pandas a través del análisis completo de un dataset. Los estudiantes deben aplicar técnicas de carga, exploración, limpieza, transformación, y agregación de datos para extraer insights valiosos. La actividad no incluye visualización de datos, enfocándose únicamente en el análisis y manipulación de datos con Pandas.

### **Instrucciones**

1. Preparación del Entorno
    - Asegúrate de tener instalado Pandas en tu entorno de trabajo.
    - Descarga el archivo dataset.csv desde Kaggle. Elige un dataset que te interese y que no incluya visualización de datos. Algunas sugerencias pueden ser datasets relacionados con ventas, compras, productos, etc.
2. Cargar los Datos
    - Carga el archivo CSV en un DataFrame de Pandas.
    - Muestra las primeras 10 filas del DataFrame para confirmar que los datos se han cargado correctamente.
3. Exploración Inicial de los Datos
    - Muestra las últimas 5 filas del DataFrame.
    - Utiliza el método info() para obtener información general sobre el DataFrame, incluyendo el número de entradas, nombres de las columnas, tipos de datos y memoria utilizada.
    - Genera estadísticas descriptivas del DataFrame utilizando el método describe().
4. Limpieza de Datos
    - Identifica y maneja los datos faltantes utilizando técnicas apropiadas (relleno con valores estadísticos, interpolación, eliminación, etc.).
    - Corrige los tipos de datos si es necesario (por ejemplo, convertir cadenas a fechas).
    - Elimina duplicados si los hay.
5. Transformación de Datos
    - Crea nuevas columnas basadas en operaciones con las columnas existentes (por ejemplo, calcular ingresos a partir de ventas y precios).
    - Normaliza o estandariza columnas si es necesario.
    - Clasifica los datos en categorías relevantes.
6. Análisis de Datos
    - Realiza agrupaciones de datos utilizando groupby para obtener insights específicos (por ejemplo, ventas por producto, ventas por región, etc.).
    - Aplica funciones de agregación como sum, mean, count, min, max, std, y var.
    - Utiliza el método apply para realizar operaciones más complejas y personalizadas.
7. Documentación
    - Documenta claramente cada paso del análisis, explicando qué se hizo y por qué se hizo.
    - Asegúrate de que el código sea legible y esté bien comentado.


### Sobre el Dataset...
El dataset seleccionado recoge estadísticas de los jugadores durante los playoffs de primavera de la **LEC 2024** (League of Legends European Championship). 

Incluye información sobre su rendimiento en cada partida, como el número de asesinatos, muertes, asistencias, el oro que ganaron, cuánto control de visión tuvieron en el mapa, y cuánto daño infligieron a sus oponentes. 

Permite ver qué tan bien jugaron los jugadores y cómo contribuyeron al éxito de su equipo en las partidas, con datos que reflejan su desempeño en diferentes áreas del juego.


Disponible en: https://www.kaggle.com/datasets/smvjkk/league-of-legends-lec-spring-playoffs-2024-stats

### Dataset Contents:

    Player: Name of the player.
    Role: Role of the player (e.g., TOP, JUNGLE, MID, ADC, SUPPORT)
    Team: Name of the player's team
    Opponent Team: Name of the opposing team
    Opponent Player: Name of the opposing player
    Date: Date of the match
    Round: Round of the tournament
    Day: Specific day of the tournament
    Patch: Version of the game patch during the match
    Stage: Stage of the tournament
    No Game: Game number in the series
    all Games: Total number of games in the series
    Format: Format of the match (e.g., Best of 1, Best of 3)
    Game of day: Number of the game that day
    Side: Side of the map the team started on (Blue/Red)
    Time: Duration of the match

### Team Performance Metrics:

    Kills Team: Total kills by the team
    Turrets Team: Total turrets destroyed by the team
    Dragon Team: Total dragons killed by the team
    Baron Team: Total barons killed by the team

### Player Performance Metrics:

    Level: Final level of the player
    Kills: Number of kills by the player
    Deaths: Number of deaths of the player
    Assists: Number of assists by the player
    KDA: Kill/Death/Assist ratio
    CS: Creep Score (minions killed)
    CS in Team's Jungle: Creep Score in the team's jungle
    CS in Enemy Jungle: Creep Score in the enemy's jungle
    CSM: Creep Score per Minute
    Golds: Total gold earned
    GPM: Gold Per Minute
    GOLD%: Percentage of team's total gold earned by the player

### Vision and Warding:

    Vision Score: Total vision score
    Wards placed: Number of wards placed
    Wards destroyed: Number of wards destroyed
    Control Wards Purchased: Number of control wards purchased
    Detector Wards Placed: Number of detector wards placed
    VSPM: Vision Score Per Minute
    WPM: Wards Placed per Minute
    VWPM: Vision Wards Placed per Minute
    WCPM: Wards Cleared per Minute
    VS%: Vision Score percentage

### Damage Metrics:

    Total damage to Champion: Total damage dealt to champions
    Physical Damage: Total physical damage dealt
    Magic Damage: Total magic damage dealt
    True Damage: Total true damage dealt
    DPM: Damage Per Minute
    DMG%: Percentage of team’s total damage dealt by the player

### Combat Metrics:

    K+A Per Minute: Kills and Assists per Minute
    KP%: Kill Participation percentage
    Solo kills: Number of solo kills
    Double kills: Number of double kills
    Triple kills: Number of triple kills
    Quadra kills: Number of quadra kills
    Penta kills: Number of pentakills

### Early Game Metrics:

    GD@15: Gold Difference at 15 minutes
    CSD@15: Creep Score Difference at 15 minutes
    XPD@15: Experience Difference at 15 minutes
    LVLD@15: Level Difference at 15 minutes

### Objective Control:

    Objectives Stolen: Number of objectives stolen
    Damage dealt to turrets: Total damage dealt to turrets
    Damage dealt to buildings: Total damage dealt to buildings

### Healing and Mitigation:

    Total heal: Total healing done
    Total Heals On Teammates: Total healing done on teammates
    Damage self mitigated: Total damage self-mitigated
    Total Damage Shielded On Teammates: Total damage shielded on teammates

### Crowd Control Metrics:

    Time ccing others: Time spent crowd controlling others
    Total Time CC Dealt: Total crowd control time dealt

### Survival and Economy:

    Total damage taken: Total damage taken
    Total Time Spent Dead: Total time spent dead
    Consumables purchased: Number of consumables purchased
    Items Purchased: Number of items purchased
    Shutdown bounty collected: Total shutdown bounty collected
    Shutdown bounty lost: Total shutdown bounty lost


In [11]:
import pandas as pd

# Cargar el archivo CSV en un DataFrame de Pandas
file_path = r'C:\Users\Andy\Documents\CodingDojo\Tareas_Py_for_DS\Data\LEC_SpringPlayoffs_2024.csv'
df = pd.read_csv(file_path, delimiter=';')

# Muestra las primeras 10 filas para confirmar la carga correcta
print("Primeras 10 filas:")
print(df.head(10))

# Información sobre el número de filas y columnas
print("\nNúmero de filas y columnas:")
print(f"Filas: {df.shape[0]}, Columnas: {df.shape[1]}")

# Tipos de datos de cada columna
print("\nTipos de datos por columna:")
print(df.dtypes)

# Cantidad de valores únicos por columna
print("\nCantidad de valores únicos por columna:")
print(df.nunique())

# Exploración inicial de los datos
# Muestra las últimas 5 filas del DataFrame
print("\nÚltimas 5 filas:")
print(df.tail(5))

# Utiliza el método info() para obtener información general
print("\nInformación general del DataFrame:")
print(df.info())

# Genera estadísticas descriptivas del DataFrame utilizando describe()
print("\nEstadísticas descriptivas:")
print(df.describe())

# Limpieza de Datos
# Identificar valores faltantes
print("\nValores faltantes por columna:")
print(df.isnull().sum())

# Rellenar o eliminar datos faltantes
df_cleaned = df.dropna()

# Verificar tipos de datos y corregirlos si es necesario
# Si alguna columna tiene formato incorrecto (como fechas), convertirlas
df_cleaned['Date'] = pd.to_datetime(df_cleaned['Date'], format='%d.%m.%Y')

# Eliminar duplicados si existen
df_cleaned = df_cleaned.drop_duplicates()

# Transformación de Datos
# Crear nuevas columnas (ejemplo: calcula el KDA ratio de cada jugador)
df_cleaned['KDA'] = (df_cleaned['Kills'] + df_cleaned['Assists']) / df_cleaned['Deaths']

# Crear una columna que clasifique el impacto en objetivos como dragones y barones
df_cleaned['Objective_Impact'] = pd.cut(df_cleaned['Dragon Team'] + df_cleaned['Baron Team'], 
    bins=[0, 1, 3, float('inf')], 
    labels=['Bajo', 'Medio', 'Alto'])

# Análisis de Datos
# Agrupar datos para obtener insights (ejemplo: KDA promedio por equipo)
team_kda = df_cleaned.groupby('Team')['KDA'].mean()

# Agregar datos (ejemplo: kills totales, muertes y asistencias por equipo)
team_stats = df_cleaned.groupby('Team').agg({
    'Kills': 'sum',
    'Deaths': 'sum',
    'Assists': 'sum'
})

# Aplicar funciones más complejas con apply (ejemplo: función personalizada para obtener ratio participación en asesinatos o Kill Participation)
df_cleaned['Kill_Participation'] = df_cleaned.apply(lambda row: (row['Kills'] + row['Assists']) / row['Kills Team'] if row['Kills Team'] != 0 else 0, axis=1)


# Comentarios:
# Este código realiza el análisis y la manipulación de datos según las instrucciones proporcionadas. 

# Resultados adicionales
print("\nKDA promedio por equipo:")
print(team_kda)

print("\nEstadísticas totales por equipo (Kills, Deaths, Assists):")
print(team_stats)


Primeras 10 filas:
       Player     Role Team Opponent Team Opponent Player        Date Round  \
0      Photon      TOP  VIT            SK      Irrelevant  30.03.2024     1   
1      Daglas   JUNGLE  VIT            SK            Isma  30.03.2024     1   
2      Vetheo      MID  VIT            SK           Nisqy  30.03.2024     1   
3      Carzzy  ADCARRY  VIT            SK         Exakick  30.03.2024     1   
4   Hylissang  SUPPORT  VIT            SK            Doss  30.03.2024     1   
5  Irrelevant      TOP   SK           VIT          Photon  30.03.2024     1   
6        Isma   JUNGLE   SK           VIT          Daglas  30.03.2024     1   
7       Nisqy      MID   SK           VIT          Vetheo  30.03.2024     1   
8     Exakick  ADCARRY   SK           VIT          Carzzy  30.03.2024     1   
9        Doss  SUPPORT   SK           VIT       Hylissang  30.03.2024     1   

   Day  Patch               Stage  ...  Damage self mitigated  \
0    1  v14.6  Spring_Playoffs_24  ...        