Analyse de données sur le jeu "League of Legends"

Dans ce projet, nous allons explorer et analyser un ensemble de données liées au jeu vidéo populaire "League of Legends". L'objectif principal de cette analyse est de découvrir des informations intéressantes et potentiellement utiles à partir des données de jeu. Plus précisément, nous cherchons à comprendre comment certains facteurs, tels que l'avantage financier et positionnel, l'élimination de monstres spécifiques, et les champions choisis, peuvent influencer l'issue d'un match.

Les données que nous utilisons proviennent de plusieurs fichiers CSV et JSON, qui contiennent des informations détaillées sur une série de matchs, y compris des statistiques à 15 minutes et à la fin du match, ainsi que des informations sur les champions utilisés.

Notre analyse comprendra les étapes suivantes:

    Extraction des informations pertinentes de nos fichiers de données et organisation de ces informations dans des DataFrames pandas pour faciliter la manipulation et l'analyse.

    Création de nouvelles variables basées sur les données existantes, telles que l'avantage financier et positionnel d'une équipe et le nombre de monstres spécifiques tués.

    Analyse des relations entre ces variables et l'issue des matchs, pour déterminer quels facteurs sont les plus fortement associés à la victoire.

    Exportation de nos résultats sous forme de fichiers JSON pour une utilisation et une analyse ultérieures.

A travers ce projet, nous espérons non seulement répondre à nos questions de recherche, mais aussi démontrer la puissance de l'analyse de données dans le contexte des jeux vidéo, un domaine qui est de plus en plus reconnu pour sa richesse en données intéressantes et exploitables.

1. Ouvrir le fichier de « match_15m.csv » et stocker dans un nouveau DataFrame les informations suivantes pour
chaque match :
o blue_advantage_gold : est-ce que l’équipe bleue est en avantage financier (plus d’argent que l’équipe
rouge)
o blue_advantage_buildings : est-ce que l’équipe bleue est en avantage de position (plus de bâtiment
de l’équipe adverse détruit)
o blue_drake : nombre de dragons tués par l’équipe bleue
o red_drake : nombre de dragons tués par l’équipe rouge
o blue_herald : est-ce que l’équipe bleue a tué le Rift Herald
o red_herald : est-ce que l’équipe rouge a tué le Rift Herald
o blue_win : est-ce que l’équipe bleue a gagné
2. Ce DataFrame devra être exporté au format JSON avec le nom « df_ex1.json »

In [15]:
# import pandas as pd

# # Chargement du fichier CSV
# match_data = pd.read_csv('data/match_15m.csv')

# # Création d'un nouveau DataFrame avec les colonnes requises
# df = match_data[['blue_advantage_gold', 'blue_advantage_buildings', 
#                  'blue_drake', 'red_drake', 'blue_herald', 'red_herald', 'blue_win']]

# # Exportation du DataFrame au format JSON
# df.to_json('df_ex1.json')

# print(match_data.columns)



# import pandas as pd

# # Chargement du fichier CSV
# match_data = pd.read_csv('data/match_15m.csv')

# # Création des colonnes requises
# match_data['blue_advantage_gold'] = match_data['blue_gold'] > match_data['red_gold']
# match_data['blue_advantage_buildings'] = match_data['blue_tower'] + match_data['blue_inhibitor'] > match_data['red_tower'] + match_data['red_inhibitor']
# match_data['blue_drake'] = match_data['blue_monster']  # Ajustez ceci si 'blue_monster' contient des monstres autres que les dragons
# match_data['red_drake'] = match_data['red_monster']  # Ajustez ceci si 'red_monster' contient des monstres autres que les dragons
# match_data['blue_herald'] = False  # Ajoutez la logique appropriée pour déterminer si l'équipe bleue a tué le Rift Herald
# match_data['red_herald'] = False  # Ajoutez la logique appropriée pour déterminer si l'équipe rouge a tué le Rift Herald

# # Sélection des colonnes requises
# df = match_data[['blue_advantage_gold', 'blue_advantage_buildings', 
#                  'blue_drake', 'red_drake', 'blue_herald', 'red_herald', 'blue_win']]

# # Exportation du DataFrame au format JSON
# df.to_json('df_ex1.json')

import pandas as pd
import numpy as np

# Charger les données
match_data = pd.read_csv("data/match_15m.csv")

# Convertir les colonnes 'blue_monster' et 'red_monster' en numérique
match_data['blue_monster'] = pd.to_numeric(match_data['blue_monster'], errors='coerce')
match_data['red_monster'] = pd.to_numeric(match_data['red_monster'], errors='coerce')

# Remplacer les valeurs NaN par zéro
match_data['blue_monster'].fillna(0, inplace=True)
match_data['red_monster'].fillna(0, inplace=True)

# Créer les nouvelles colonnes
match_data["blue_advantage_gold"] = match_data["blue_gold"] > match_data["red_gold"]
match_data["blue_advantage_buildings"] = match_data["blue_tower"] + match_data["blue_inhibitor"] > match_data["red_tower"] + match_data["red_inhibitor"]

# Note : Je suppose ici que "blue_monster" et "red_monster" sont des variables indiquant le nombre de dragons et heralds tués par chaque équipe
match_data["blue_drake"] = match_data["blue_monster"]
match_data["red_drake"] = match_data["red_monster"]

# Note : Je suppose ici que "blue_herald" et "red_herald" sont des variables indiquant si l'équipe bleue ou rouge a tué le Rift Herald. Ces variables doivent être converties en booléens.
match_data["blue_herald"] = match_data["blue_monster"] > 0
match_data["red_herald"] = match_data["red_monster"] > 0

# Sélectionner les colonnes pertinentes
relevant_columns = ["blue_advantage_gold", "blue_advantage_buildings", "blue_drake", "red_drake", "blue_herald", "red_herald", "blue_win"]
final_data = match_data[relevant_columns]

# Exporter au format JSON
final_data.to_json("df_ex1.json")




3. A partir de ce fichier, créer un nouveau DataFrame avec l’information suivante :
o Créer une répartition des écarts d’or de l’équipe bleue (advantage_blue_category) comme suit :
▪ Avantage fort : [2500, 5000]
▪ Avantage faible : [500, 2500]
▪ Pas d’avantage : [−500, 500]
▪ Désavantage faible : [−2500, −500]
▪ Désavantage fort : [−5000, −2500]
o Pour chaque écart, avoir une colonne « chance_win » indiquant le pourcentage de parties gagnées
o Pour chaque écart, avoir une colonne « blue_structure » indiquant la moyenne du nombre de
structures détruites dans l’équipe bleue
o Pour chaque écart, avoir une colonne « red_structure » indiquant la moyenne du nombre de
structures détruites dans l’équipe rouge
o Pour chaque écart, avoir une colonne « blue_monster » indiquant la moyenne du nombre de monstres
tués (dragons et herald combinés) pour l’équipe bleue
o Pour chaque écart, avoir une colonne « red_monster » indiquant la moyenne du nombre de monstres
tués (dragons et herald combinés) pour l’équipe rouge
o Ce DataFrame devra être exporté au format JSON avec le nom « df_ex3.json ».

In [16]:
# import pandas as pd

# # Lire le fichier CSV
# match_data = pd.read_csv("data/match_15m.csv")

# # Exercice 1
# match_data["blue_advantage_gold"] = match_data["blue_gold"] > match_data["red_gold"]
# match_data["blue_advantage_buildings"] = (match_data["blue_tower"] + match_data["blue_inhibitor"]) > (match_data["red_tower"] + match_data["red_inhibitor"])
# match_data["blue_drake"] = match_data["blue_monster"].apply(lambda x: "DRAGON" in x)
# match_data["red_drake"] = match_data["red_monster"].apply(lambda x: "DRAGON" in x)
# match_data["blue_herald"] = match_data["blue_monster"].apply(lambda x: "HERALD" in x)
# match_data["red_herald"] = match_data["red_monster"].apply(lambda x: "HERALD" in x)

# # Sélectionner les colonnes pertinentes
# df_ex1 = match_data[['matchId', 'blue_advantage_gold', 'blue_advantage_buildings', 'blue_drake', 'red_drake', 'blue_herald', 'red_herald', 'blue_win']]

# # Exporter au format JSON
# df_ex1.to_json("df_ex1.json", orient='records')

# # Exercice 3
# match_data['gold_diff'] = match_data['blue_gold'] - match_data['red_gold']

# bins = [-5000, -2500, -500, 500, 2500, 5000]
# labels = ['Désavantage fort', 'Désavantage faible', 'Pas d’avantage', 'Avantage faible', 'Avantage fort']
# match_data['advantage_blue_category'] = pd.cut(match_data['gold_diff'], bins=bins, labels=labels)

# grouped_data = match_data.groupby('advantage_blue_category').agg(
#     chance_win=('blue_win', 'mean'),
#     blue_structure=('blue_tower', 'mean'),
#     red_structure=('red_tower', 'mean'),
#     blue_monster=('blue_monster', 'count'),
#     red_monster=('red_monster', 'count')
# )

# grouped_data['chance_win'] *= 100

# grouped_data.to_json("df_ex3.json")




# Calculer l'écart d'or
match_data['gold_diff'] = match_data['blue_gold'] - match_data['red_gold']

# Créer les catégories pour l'écart d'or
bins = [-5000, -2500, -500, 500, 2500, 5000]
labels = ['Désavantage fort', 'Désavantage faible', 'Pas d’avantage', 'Avantage faible', 'Avantage fort']
match_data['advantage_blue_category'] = pd.cut(match_data['gold_diff'], bins=bins, labels=labels)

# Créer un nouveau DataFrame regroupé par 'advantage_blue_category'
grouped_data = match_data.groupby('advantage_blue_category').agg(
    chance_win=('blue_win', 'mean'),
    blue_structure=('blue_tower', 'mean'),
    red_structure=('red_tower', 'mean'),
    blue_monster=('blue_monster', 'mean'),
    red_monster=('red_monster', 'mean')
)

# Convertir 'chance_win' en pourcentage
grouped_data['chance_win'] *= 100

# Exporter au format JSON
grouped_data.to_json("df_ex3.json")

