# Analyse des Accidents Aériens

## Introduction
Ce carnet présente une analyse des données relatives aux accidents aériens. L'objectif est d'identifier les types d'avions les plus impliqués dans les accidents et d'évaluer les tendances au fil du temps. À partir de ces résultats, nous formulerons des recommandations pour améliorer la sécurité aérienne.

In [None]:
## Chargement des Données
Nous allons d'abord charger les données à partir d'un fichier CSV.

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
# Chargement des fichiers CSV

df1 = pd.read_csv('C:\\Users\\Saint Germain Emode\\Downloads\\AviationData.csv', encoding='ISO-8859-1', low_memory=False)
df2 = pd.read_csv('C:\\Users\\Saint Germain Emode\\Downloads\\USState_Codes.csv', encoding='ISO-8859-1', low_memory=False)

In [None]:
# Afficher les premières lignes du DataFrame
print(df1.dtypes)
print(df2.dtypes)

 ## Identifier les Valeurs Manquantes

In [None]:
# Afficher le nombre de valeurs manquantes par colonne
print(df1.isnull().sum())
print(df2.isnull().sum())

In [None]:
# Afficher les statistiques descriptives
print(df1.describe())
print(df2.describe())

## Vérifier les Valeurs Aberrantes

In [None]:
# Statistiques descriptives pour le premier DataFrame
print("\nStatistiques descriptives de AviationData:")
print(df1.describe(include='all'))

# Statistiques descriptives pour le deuxième DataFrame
print("\nStatistiques descriptives de USState_Codes:")
print(df2.describe(include='all'))

## Supprimer les Valeurs Manquantes
## Normaliser les Valeurs

In [None]:
# Chargement des fichiers CSV
df1 = pd.read_csv('C:\\Users\\Saint Germain Emode\\Downloads\\AviationData.csv', encoding='ISO-8859-1', low_memory=False)

# Remplacer les valeurs NaN par 'Inconnu'
df1['Injury.Severity'].fillna('Inconnu', inplace=True)

# Normaliser les valeurs en remplaçant 'Fatal(x)' par 'Fatal'
df1['Injury.Severity'] = df1['Injury.Severity'].str.replace(r'Fatal\(\d+\)', 'Fatal', regex=True)

# Tracer l'histogramme de la sévérité des blessures
plt.figure(figsize=(10, 6))
sns.countplot(data=df1, x='Injury.Severity', order=df1['Injury.Severity'].value_counts().index)
plt.title('Distribution de la Sévérité des Blessures')
plt.xlabel('Sévérité des Blessures')
plt.ylabel('Nombre d\'Accidents')
plt.xticks(rotation=45)
plt.show()

In [None]:
# Supprimer les doublons
df1.drop_duplicates(inplace=True)

In [None]:
# Agrégation des données
aggregated_data = df1.groupby('Aircraft.Category')['Injury.Severity'].value_counts().unstack(fill_value=0)

# Afficher les données agrégées
print(aggregated_data)
print(aggregated_data)

## Analyser les Données

- Calculer les Statistiques de Base
- Identifier les Tendances
- Formuler des Recommandations

In [None]:
# Statistiques descriptives

statistics = df1.describe(include='all')  
print("Statistiques descriptives :")
print(statistics

In [None]:
# 2. Identifier les tendances

accidents_by_aircraft = df1['Aircraft.Type'].value_counts()
print("\nAccidents par type d'avion :")
print(accidents_by_aircraft)

In [None]:
# Visualiser les accidents par type d'avion

plt.figure(figsize=(12, 6))
accidents_by_aircraft.plot(kind='bar')
plt.title('Nombre d\'Accidents par Type d\'Avion')
plt.xlabel('Type d\'Avion')
plt.ylabel('Nombre d\'Accidents')
plt.xticks(rotation=45)
plt.show()

In [None]:
# Les recommandations

recommendations = [
    "Renforcer les réglementations de sécurité pour les types d'avions les plus impliqués dans des accidents.",
    "Mettre en place des programmes de formation spécifiques pour les pilotes des types d'avions à haut risque.",
    "Investir dans des technologies de sécurité avancées pour les modèles d'avions qui enregistrent un nombre élevé d'accidents."

In [None]:
# Visualiser les accidents au Fil des Ans

df1['Event.Date'] = pd.to_datetime(df1['Event.Date'])  
 accidents_over_time = df1.groupby(df1['Event.Date'].dt.year)['Aircraft.Category'].count()  

 plt.figure(figsize=(12, 6))
 plt.plot(accidents_over_time.index, accidents_over_time.values, marker='o')
 plt.title('Tendances des Accidents au Fil des Ans')
 plt.xlabel('Année')
 plt.ylabel('Nombre d\'Accidents')
 plt.grid()
 plt.show()