# Le jeu Palworld et analyse des donn√©es

## Pr√©sentation du jeu Palworld

Palworld est un jeu de survie en monde ouvert d√©velopp√© par Pocket Pair, sorti en janvier 2024. Ce jeu combine des √©l√©ments de survie, de crafting, de collection de cr√©atures et de construction de base. Il se d√©roule dans un monde ouvert peupl√© de cr√©atures appel√©es "Pals" que les joueurs peuvent capturer, √©lever et utiliser pour diverses t√¢ches.

Les aspects cl√©s du jeu incluent:

| Aspect |
| - |
| La capture et la collection de Pals (similaire √† Pok√©mon) |
| L'utilisation des Pals pour combattre |
| L'exploitation des Pals pour des t√¢ches comme la construction, l'agriculture, et le travail en usine |
| La construction et le d√©veloppement d'un campement |
| L'exploration d'un monde ouvert avec diff√©rentes zones et biomes |

Le jeu a connu un immense succ√®s d√®s sa sortie en raison de son concept innovant m√™lant des m√©caniques de jeux populaires comme Pok√©mon et Minecraft, mais avec une approche plus mature et parfois controvers√©e.


## üìÅ Analyse des Fichiers CSV et leur R√¥le dans le Jeu

### Vue d'ensemble des Donn√©es Palworld

Sur la base des descriptions fournies, voici une analyse de chaque fichier de donn√©es et son importance dans le jeu :

### 1.  Palworld_Data--Palu combat attribute table.csv

**Contenu :**
- Statistiques de base (sant√©, attaque, d√©fense, vitesse)
- Types √©l√©mentaires (Feu, Eau, √âlectricit√©, etc.)
- Comp√©tences de combat sp√©cifiques

**R√¥le dans le jeu :** Ces donn√©es d√©terminent l'efficacit√© d'un Pal au combat. Les joueurs utilisent ces informations pour construire des √©quipes √©quilibr√©es et strat√©giques pour les combats contre d'autres Pals ou les boss.

### 2.  Palworld_Data--Palu refresh level.csv

**Contenu :** Informations sur les niveaux auxquels les Pals apparaissent dans diff√©rentes zones du jeu.

**R√¥le dans le jeu :** Cette information est cruciale pour les joueurs qui cherchent √† capturer des Pals sp√©cifiques. Elle permet de savoir o√π trouver certains Pals et √† quel niveau ils appara√Ætront, ce qui affecte leur difficult√© de capture et leurs statistiques initiales.

### 3. Palworld_Data-Palu Job Skills Table.csv

**Contenu :** Comp√©tences de travail que poss√®dent les diff√©rents Pals :
- Minage
- B√ªcheronnage
- Agriculture
- Construction
- Cuisine
- Etc.

**R√¥le dans le jeu :** Ces comp√©tences d√©terminent quelles t√¢ches un Pal peut effectuer dans votre campement. Un Pal avec une comp√©tence de minage √©lev√©e sera efficace pour extraire des minerais, tandis qu'un Pal avec des comp√©tences agricoles sera utile pour cultiver des ressources alimentaires.

### 4.  Palworld_Data-Tower BOSS attribute comparison.csv

**Contenu :** Attributs des boss sp√©ciaux qui apparaissent dans les tours du jeu.

**R√¥le dans le jeu :** Les tours sont des d√©fis endgame o√π les joueurs affrontent des boss puissants. Ces donn√©es aident √† comprendre la puissance relative de ces boss et √† pr√©parer des strat√©gies adapt√©es pour les combattre.

### 5.  Palworld_Data-comparison of ordinary BOSS attributes.csv

**Contenu :** Attributs des boss ordinaires que l'on trouve dans le monde ouvert.

**R√¥le dans le jeu :** Ces boss repr√©sentent des d√©fis importants durant l'exploration et fournissent des r√©compenses pr√©cieuses. Comprendre leurs attributs permet aux joueurs de se pr√©parer ad√©quatement √† ces affrontements.

### 6.  Palworld_Data-hide pallu attributes.csv

**Contenu :** Informations sur des attributs cach√©s des Pals qui ne sont pas imm√©diatement visibles dans le jeu.

**R√¥le dans le jeu :** Ces attributs cach√©s peuvent inclure des taux de croissance sp√©cifiques, des affinit√©s particuli√®res, ou des capacit√©s sp√©ciales qui se d√©bloquent dans certaines conditions. Ces informations sont pr√©cieuses pour les joueurs qui cherchent √† optimiser leurs Pals.

---
## Implications pour l'Analyse

Cette structure de donn√©es nous permettra d'analyser :
- **Optimisation des √©quipes de combat** via les attributs de combat
- **Gestion efficace des ressources** via les comp√©tences de travail
- **Strat√©gies de capture** via les zones d'apparition et probabilit√©s
- **Progression du jeu** via les niveaux et raret√©s des Pals

## Import des biblioth√®ques Python de l'√©tude

In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import mariadb
from sqlalchemy import create_engine
import plotly.express as px
import plotly.graph_objects as go
import os
from pathlib import Path

## Chargement des donn√©es brutes

In [4]:
# D√©finition du chemin vers les fichiers fournis
data_path = "../data/"

# V√©rification de l'existence du repertoire , if not utiliser le repertoire courrant
if not os.path.exists(data_path):
    data_path = "./"

# Affichage des fichiers dispo pour la v√©rif
files = [f for f in os.listdir(data_path) if f.endswith('.csv')] # ici on liste tous les fichiers ou dossiers + on it√®re chaque √©l√©ment + Filtre pour garder que les fichier .csv
print("Fichiers dispo:")
for file in files: 
    print(f"-{file}")

# Chargement des donn√©es brutes & gestion d'erreurs gr√¢ce √† pd.read_csv en d√©finissant le chemin vers les fichiers.csv 
try:
    combat_attribute = pd.read_csv(f'{data_path}Palworld_Data--Palu combat attribute table.csv')
    refresh_area = pd.read_csv(f'{data_path}Palworld_Data--Palu refresh level.csv')
    ordinary_boss = pd.read_csv(f'{data_path}Palworld_Data-comparison of ordinary BOSS attributes.csv')
    tower_boss = pd.read_csv(f'{data_path}Palworld_Data-Tower BOSS attribute comparison.csv') 
    job_skill = pd.read_csv(f'{data_path}Palworld_Data-Palu Job Skills Table.csv')
    hidden_attribute = pd.read_csv(f'{data_path}Palworld_Data-hide pallu attributes.csv')
    print("\nDonn√©es brutes charg√©es")
except FileNotFoundError as e : 
  print(f"Erreur: {e}. V√©rifier les noms des fichiers et le chemin.")

Fichiers dispo:
-Palworld_Data--Palu combat attribute table.csv
-Palworld_Data--Palu refresh level.csv
-Palworld_Data-comparison of ordinary BOSS attributes.csv
-Palworld_Data-hide pallu attributes.csv
-Palworld_Data-Palu Job Skills Table.csv
-Palworld_Data-Tower BOSS attribute comparison.csv

Donn√©es brutes charg√©es


## Analyse exploratoires des donn√©es 

In [6]:
# Informations de base du DataFrame
def explore_dataframe(df, name):
    print(f"\n===== Exploration de {name} =====")
    print(f"Dimensions: {df.shape[0]} lignes, {df.shape[1]} colonnes")
    
    # Aper√ßu des premi√®res lignes pour comprendre la structure
    print("\nAper√ßu des premi√®res lignes:")
    display(df.head(3))
    
    # Types de donn√©es pour identifier colonnes num√©riques vs cat√©gorielles
    print("\nTypes de donn√©es:")
    display(df.dtypes)
    
    # Statistiques descriptives compl√®tes (moyenne, m√©diane, quartiles, etc.)
    print("\nStatistiques descriptives:")
    display(df.describe(include='all').T)
    
    # D√©tection et √©valuations des valeurs manquantes
    print("\nValeurs manquantes:")
    missing = df.isnull().sum()
    missing_percent = (df.isnull().sum() / len(df)) * 100
    missing_data = pd.concat([missing, missing_percent], axis=1, keys=['Total', 'Pourcentage'])
    display(missing_data[missing_data['Total'] > 0])
    if missing_data['Total'].sum() == 0:
        print("Aucune valeur manquante d√©tect√©e")
    
    # D√©tection des lignes doublons
    duplicates = df.duplicated().sum()
    print(f"\nNombre de lignes dupliqu√©es: {duplicates}")
    
    # Analyse des colonnes cat√©gorielles "objets"
    print("\nAnalyse des colonnes cat√©gorielles:")
    categorical_cols = df.select_dtypes(include=['object']).columns
    
    if len(categorical_cols) > 0:
        for col in categorical_cols:  # Possibilit√© de limiter le nombre de colonnes
            unique_values = df[col].unique()
            n_unique = len(unique_values)
            
            print(f"\n{col}:")
            print(f"  - {n_unique} valeurs uniques")
            
            # Affichage intelligent selon le nombre de valeurs uniques
            if n_unique <= 10:
                # Si peu de valeurs, les afficher toutes
                print(f"  - Valeurs: {unique_values}")
            elif n_unique <= 20:
                # Si mod√©r√©, afficher les plus fr√©quentes
                value_counts = df[col].value_counts().head(10)
                print(f"  - Top 10 des valeurs les plus fr√©quentes:")
                for val, count in value_counts.items():
                    print(f"    ‚Ä¢ {val}: {count} occurrences")
            else:
                # Si beaucoup de valeurs, donner juste les statistiques
                value_counts = df[col].value_counts()
                print(f"  - Top 5 des valeurs les plus fr√©quentes:")
                for val, count in value_counts.head(5).items():
                    print(f"    ‚Ä¢ {val}: {count} occurrences")
                print(f"  - Valeur la moins fr√©quente: {value_counts.tail(1).index[0]} ({value_counts.tail(1).values[0]} occurrence(s))")
    else:
        print("Aucune colonne cat√©gorielle d√©tect√©e")
    
    # S√©parateur pour la lisibilit√©
    print("\n" + "="*70)

# Dictionnaire des datasets
datasets = {
   'Combat Attributes': combat_attribute,        
   'Job Skills': job_skill,                     
   'Hidden Attributes': hidden_attribute,        
   'Refresh Areas': refresh_area,               
   'Ordinary Boss Attributes': ordinary_boss,    
   'Tower Boss Attributes': tower_boss          
}


In [7]:
print(datasets)

{'Combat Attributes':     Table of Contents Palu Job Skill Table Skill Learning Level Tower BOSS Attributes Comparison with Normal BOSS Attributes Comparison of Partner Skill Values Individual Value Calculator  \
0                                                   ID                                                                                                                                        
1                                                    1                                                                                                                                        
2                                                    2                                                                                                                                        
3                                                    3                                                                                                                                        
4                      