# Analyse et recommandations pour Palworld
Ce notebook analyse les caractéristiques des Pals et propose des axes d'amélioration pour optimiser l'expérience de jeu, en s'appuyant sur la problématique suivante :

### Problématique
_"Étudier les caractéristiques et comportements des créatures pour développer une expérience de jeu plus attrayante, optimisant stratégie de combat et gestion du campement._"

---

## Chargement des données nettoyées

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

combat_df = pd.read_csv('Cleaned_Combat_Attribute_Table.csv')
job_df = pd.read_csv('Cleaned_Job_Skills_Table.csv')
hidden_df = pd.read_csv('hidden_pallu_attributes_cleaned.csv')
refresh_df = pd.read_csv('Cleaned_Pal_Refresh_Levels.csv')
tower_df = pd.read_csv('Cleaned_Tower_BOSS_Attributes.csv')
ordinary_df = pd.read_csv('pals_with_inferred_boss_stats.csv')


## Analyse exploratoire des Pals

In [None]:
fig, axs = plt.subplots(3, 2, figsize=(12, 10))
sns.histplot(combat_df['volume_size'], ax=axs[0,0])
axs[0,0].set_title('Distribution des tailles des Pals')
sns.histplot(combat_df['element_type'], ax=axs[0,1])
axs[0,1].set_title('Distribution des catégories')
sns.histplot(combat_df['hp'], ax=axs[1,0])
axs[1,0].set_title('Distribution des points de vie')
sns.histplot(job_df['rarity'], ax=axs[1,1])
axs[1,1].set_title('Distribution de la rareté')
sns.histplot(hidden_df['foodamount'], ax=axs[2,0])
axs[2,0].set_title('Distribution de la consommation alimentaire')
plt.tight_layout()
plt.show()

In [None]:
job_df['nb_skills'] = (job_df.select_dtypes(include='number').drop(columns=['handling_speed', 'rarity'], errors='ignore') > 0).sum(axis=1)
top_workers = job_df.sort_values('nb_skills', ascending=False).head(10)
top_workers[['english_name', 'nb_skills', 'handling_speed']]

In [None]:
# Pals produisant des ressources au ranch
prod_pals = hidden_df[hidden_df['pasture'] > 0]
prod_pals[['tribe', 'pasture']]

In [None]:
# Pals nocturnes
nocturnes = hidden_df[hidden_df['nocturnal'] == 1]
print(f"Nombre de Pals nocturnes : {len(nocturnes)}")
nocturnes[['tribe', 'rarity', 'foodamount']]

In [None]:
# Probabilité de capture
top_catch = hidden_df.sort_values('capture_probability', ascending=False).head(10)
top_catch[['tribe', 'capture_probability']]

## Axes d'amélioration proposés basés sur les données

### 1. Équilibrage des Pals selon rareté et puissance
- Les Pals très polyvalents ont une rareté élevée, ce qui peut limiter l'accessibilité.
- Proposer plus de Pals communs avec des compétences spécialisées pour diversifier les stratégies.


In [None]:
combat_df['total_combat'] = combat_df[['hp', 'melee_attack', 'remote_attack', 'defense']].sum(axis=1)
top_rare = pd.merge(job_df[['english_name', 'nb_skills']], combat_df[['name', 'total_combat', 'rarity']], left_on='english_name', right_on='name')
top_rare_sorted = top_rare.sort_values('rarity', ascending=False).head(10)
top_rare_sorted[['english_name', 'nb_skills', 'total_combat', 'rarity']]

### 2. Visibilité et gestion des compétences et ressources
- Une meilleure interface en jeu pour afficher clairement compétences et ressources faciliterait la gestion du campement.
- Notre analyse identifie les Pals clés pour chaque compétence et ressource.


### 3. Interaction jour/nuit
- Les Pals nocturnes sont peu nombreux mais avec des caractéristiques distinctes.
- Ajouter des quêtes ou bonus spécifiques à la nuit enrichirait le gameplay.


### 4. Optimisation de la capture
- La probabilité de capture est variable et peut être exploitée stratégiquement.
- Proposer des outils en jeu pour influencer cette probabilité augmenterait la profondeur du jeu.


### 5. Diversification des zones d’apparition
- La concentration des Pals dans certaines zones limite l’exploration.
- Rééquilibrer la faune par biome encouragerait une exploration plus riche.


In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
plt.figure(figsize=(12,6))
sns.countplot(y=refresh_df['refresh_area'], order=refresh_df['refresh_area'].value_counts().index)
plt.title("Répartition des Pals par zone d'apparition")
plt.show()

### 6. Balance des Boss
- Les Boss les plus puissants peuvent créer des goulots d'étranglement.
- Introduire des Boss intermédiaires et des variantes renforcerait la dynamique des combats.


In [None]:
tower_df['total_power'] = tower_df[['hp', 'melee_attack', 'remote_attack', 'defense', 'support']].sum(axis=1)
ordinary_df['total_power'] = ordinary_df[[col for col in ['hp', 'melee_attack', 'remote_attack', 'defense', 'support'] if col in ordinary_df.columns]].sum(axis=1)
top_tower = tower_df.sort_values('total_power', ascending=False).head(5)[['name', 'total_power']]
top_ordinary = ordinary_df.sort_values('total_power', ascending=False).head(5)[['name', 'total_power']]
top_tower, top_ordinary

## Synthèse et recommandations
- Introduire des Pals plus accessibles avec compétences clés.
- Intégrer en jeu des outils de suivi des compétences et ressources.
- Renforcer les mécaniques jour/nuit avec contenu dédié.
- Enrichir la capture avec mécaniques d’influence de probabilité.
- Rééquilibrer les zones pour encourager l’exploration.
- Diversifier la difficulté et types de Boss.

Ce notebook peut servir de base pour guider des itérations futures sur le design de Palworld.

In [25]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Chargement des données
combat_df = pd.read_csv(r"C:\Users\lisac\Documents\cleaned dataset\Cleaned_Combat_Attribute_Table.csv")
job_df = pd.read_csv(r"C:\Users\lisac\Documents\cleaned dataset\Cleaned_Job_Skills_Table.csv")
hidden_df = pd.read_csv(r"C:\Users\lisac\Documents\cleaned dataset\hidden_pallu_attributes_cleaned.csv")
refresh_df = pd.read_csv(r"C:\Users\lisac\Documents\cleaned dataset\Cleaned_Pal_Refresh_Levels.csv")
tower_df = pd.read_csv(r"C:\Users\lisac\Documents\cleaned dataset\Cleaned_Tower_BOSS_Attributes.csv")
ordinary_df = pd.read_csv(r"C:\Users\lisac\Documents\cleaned dataset\pals_with_inferred_boss_stats.csv")

# Fusion de la rareté dans job_df depuis combat_df
job_df = job_df.merge(combat_df[['name', 'rarity']], left_on='english_name', right_on='name', how='left')

# 1. Distribution des tailles et catégories
fig, axs = plt.subplots(1, 2, figsize=(12, 5))
sns.histplot(combat_df['volume_size'], ax=axs[0])
axs[0].set_title('Distribution des tailles des Pals')

elements = pd.concat([combat_df['element_1'].dropna(), combat_df['element_2'].dropna()])
sns.histplot(elements, ax=axs[1])
axs[1].set_title('Distribution des catégories des Pals')

plt.tight_layout()
fig.savefig('distribution_taille_categorie.png')
plt.close(fig)

# 2. Distribution PV et rareté
fig, axs = plt.subplots(1, 2, figsize=(12, 5))
sns.histplot(combat_df['hp'], ax=axs[0])
axs[0].set_title('Distribution des points de vie')
sns.histplot(job_df['rarity'], ax=axs[1])
axs[1].set_title('Distribution de la rareté')
plt.tight_layout()
fig.savefig('distribution_pv_rarete.png')
plt.close(fig)

# 3. Compétences et production
job_df['nb_skills'] = (job_df.select_dtypes(include='number').drop(columns=['handling_speed', 'rarity'], errors='ignore') > 0).sum(axis=1)
top_workers = job_df.sort_values('nb_skills', ascending=False).head(10)
plt.figure(figsize=(8, 5))
sns.barplot(x='nb_skills', y='english_name', data=top_workers, orient='h')
plt.title('Top 10 Pals par nombre de compétences')
plt.tight_layout()
plt.savefig('top_competences.png')
plt.close()

plt.figure(figsize=(8, 5))
prod_pals = hidden_df[hidden_df['pasture'] > 0]
sns.barplot(x='pasture', y='tribe', data=prod_pals.sort_values('pasture', ascending=False))
plt.title('Pals produisant des ressources (pasture)')
plt.tight_layout()
plt.savefig('production_ranch.png')
plt.close()

# 4. Pals nocturnes
nocturnes = hidden_df[hidden_df['nocturnal'] == 1]
plt.figure(figsize=(8, 5))
sns.countplot(y='tribe', data=nocturnes, order=nocturnes['tribe'].value_counts().index)
plt.title('Pals nocturnes par type')
plt.tight_layout()
plt.savefig('pals_nocturnes.png')
plt.close()

# 5. Capture probability top 10
top_catch = hidden_df.sort_values('capture_probability', ascending=False).head(10)
plt.figure(figsize=(8, 5))
sns.barplot(x='capture_probability', y='tribe', data=top_catch)
plt.title('Top 10 Pals par probabilité de capture')
plt.tight_layout()
plt.savefig('top_capture_probability.png')
plt.close()

# 6. Corrélation attributs combat
plt.figure(figsize=(8, 6))
corr = combat_df[['hp', 'melee_attack', 'remote_attack', 'defense']].corr()
sns.heatmap(corr, annot=True)
plt.title('Corrélation des attributs de combat')
plt.tight_layout()
plt.savefig('correlation_attributs.png')
plt.close()

# 7. Taille vs puissance
plt.figure(figsize=(8, 5))
combat_df['total_combat'] = combat_df[['hp', 'melee_attack', 'remote_attack', 'defense']].sum(axis=1)
sns.scatterplot(x='volume_size', y='total_combat', data=combat_df)
plt.title('Taille vs puissance de combat')
plt.tight_layout()
plt.savefig('taille_vs_puissance.png')
plt.close()

# 8. Répartition zones d'apparition
plt.figure(figsize=(10, 8))
sns.countplot(y=refresh_df['refresh_area'], order=refresh_df['refresh_area'].value_counts().index)
plt.title("Répartition des Pals par zone d'apparition")
plt.tight_layout()
plt.savefig('repartition_zones.png')
plt.close()

# 9. Puissance Boss Tower
tower_df['total_power'] = tower_df[['hp', 'melee_attack', 'remote_attack', 'defense', 'support']].sum(axis=1)
top_tower = tower_df.sort_values('total_power', ascending=False).head(5)
plt.figure(figsize=(8, 5))
sns.barplot(x='total_power', y='name', data=top_tower)
plt.title('Top 5 Tower Boss par puissance')
plt.tight_layout()
plt.savefig('top_tower_boss.png')
plt.close()

# 10. Puissance Boss Ordinary
cols = [col for col in ['hp', 'melee_attack', 'remote_attack', 'defense', 'support'] if col in ordinary_df.columns]
ordinary_df['total_power'] = ordinary_df[cols].sum(axis=1)
top_ordinary = ordinary_df.sort_values('total_power', ascending=False).head(5)
plt.figure(figsize=(8, 5))
sns.barplot(x='total_power', y='name', data=top_ordinary)
plt.title('Top 5 Ordinary Boss par puissance')
plt.tight_layout()
plt.savefig('top_ordinary_boss.png')
plt.close()

print("Export des graphiques terminé !")




Export des graphiques terminé !


In [27]:
import os
print(os.getcwd())



C:\Users\lisac\Downloads
