In [None]:

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

# Chemins des fichiers de données
file_path_1 = "/home/ubuntu/.cache/kagglehub/datasets/gokulrajkmv/unemployment-in-india/versions/5/Unemployment in India.csv"
file_path_2 = "/home/ubuntu/.cache/kagglehub/datasets/gokulrajkmv/unemployment-in-india/versions/5/Unemployment_Rate_upto_11_2020.csv"

# Charger les données
try:
    df_india = pd.read_csv(file_path_1)
    df_rate = pd.read_csv(file_path_2)
    print("Données chargées avec succès.")
except FileNotFoundError:
    print("Erreur: Assurez-vous que les fichiers CSV sont au bon endroit.")
    exit()

# Nettoyage et exploration initiale des données pour df_india
print("""\n--- Exploration de Unemployment in India.csv ---\n""")
print("Informations sur le DataFrame:")
df_india.info()
print("""\nPremières lignes du DataFrame:""")
print(df_india.head())
print("""\nStatistiques descriptives:""")
print(df_india.describe())

# Nettoyage des noms de colonnes (supprimer les espaces et caractères spéciaux)
df_india.columns = df_india.columns.str.strip().str.replace(" ", "_").str.replace("(", "").str.replace(")", "").str.replace("%", "percent")
print("""\nNoms de colonnes nettoyés pour df_india:""")
print(df_india.columns)

# Convertir la colonne \'Date\' en datetime
df_india["Date"] = pd.to_datetime(df_india["Date"], dayfirst=True)

# Nettoyage et exploration initiale des données pour df_rate
print("""\n--- Exploration de Unemployment_Rate_upto_11_2020.csv ---\n""")
print("Informations sur le DataFrame:")
df_rate.info()
print("""\nPremières lignes du DataFrame:""")
print(df_rate.head())
print("""\nStatistiques descriptives:""")
print(df_rate.describe())

# Nettoyage des noms de colonnes (supprimer les espaces et caractères spéciaux)
df_rate.columns = df_rate.columns.str.strip().str.replace(" ", "_").str.replace("(", "").str.replace(")", "").str.replace("%", "percent")
print("""\nNoms de colonnes nettoyés pour df_rate:""")
print(df_rate.columns)

# Convertir la colonne \'Date\' en datetime
df_rate["Date"] = pd.to_datetime(df_rate["Date"], dayfirst=True)

# Vérifier les valeurs manquantes
print("""\nValeurs manquantes dans df_india:""")
print(df_india.isnull().sum())
print("""\nValeurs manquantes dans df_rate:""")
print(df_rate.isnull().sum())

# Visualisation de base (exemple)
plt.figure(figsize=(12, 6))
sns.lineplot(data=df_rate, x="Date", y="Estimated_Unemployment_Rate_percent")
plt.title("Taux de chômage estimé en Inde au fil du temps")
plt.xlabel("Date")
plt.ylabel("Taux de chômage estimé (%)")
plt.grid(True)
plt.tight_layout()
plt.savefig("unemployment_rate_time_series.png")
print("""\nGraphique du taux de chômage enregistré dans unemployment_rate_time_series.png""")




# Analyse de l\\\'impact du Covid-19

# Filtrer les données pour la période Covid-19 (par exemple, de mars 2020 à novembre 2020)
df_covid = df_rate[(df_rate["Date"] >= "2020-03-01") & (df_rate["Date"] <= "2020-11-30")]

plt.figure(figsize=(14, 7))
sns.lineplot(data=df_covid, x="Date", y="Estimated_Unemployment_Rate_percent", hue="Region")
plt.title("Taux de chômage estimé en Inde pendant la période Covid-19 par région")
plt.xlabel("Date")
plt.ylabel("Taux de chômage estimé (%)")
plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left')
plt.grid(True)
plt.tight_layout()
plt.savefig("unemployment_covid_impact_by_region.png")
print("""\nGraphique de l\\\'impact du Covid-19 sur le chômage par région enregistré dans unemployment_covid_impact_by_region.png""")

# Visualisation de l\\\'impact du Covid-19 sur l\\\'emploi
plt.figure(figsize=(14, 7))
sns.lineplot(data=df_covid, x="Date", y="Estimated_Employed", hue="Region")
plt.title("Nombre d\\\'employés estimé en Inde pendant la période Covid-19 par région")
plt.xlabel("Date")
plt.ylabel("Nombre d\\\'employés estimé")
plt.legend(bbox_to_anchor=(1.05, 1), loc='upper left')
plt.grid(True)
plt.tight_layout()
plt.savefig("employment_covid_impact_by_region.png")
print("""\nGraphique de l\\\'impact du Covid-19 sur l\\\'emploi par région enregistré dans employment_covid_impact_by_region.png""")

# Identification des tendances saisonnières et patterns

# Agréger les données par mois pour identifier les tendances saisonnières
df_rate["Month"] = df_rate["Date"].dt.month
df_monthly_avg = df_rate.groupby("Month")["Estimated_Unemployment_Rate_percent"].mean().reset_index()

plt.figure(figsize=(10, 6))
sns.lineplot(data=df_monthly_avg, x="Month", y="Estimated_Unemployment_Rate_percent")
plt.title("Tendance saisonnière du taux de chômage en Inde")
plt.xlabel("Mois")
plt.ylabel("Taux de chômage estimé moyen (%)")
plt.xticks(range(1, 13), ["Jan", "Fev", "Mar", "Avr", "Mai", "Juin", "Juil", "Août", "Sep", "Oct", "Nov", "Dec"])
plt.grid(True)
plt.tight_layout()
plt.savefig("unemployment_seasonal_trend.png")
print("""\nGraphique de la tendance saisonnière du chômage enregistré dans unemployment_seasonal_trend.png""")

# Analyse des patterns par région
plt.figure(figsize=(16, 8))
sns.barplot(data=df_rate, x="Region", y="Estimated_Unemployment_Rate_percent", palette="viridis")
plt.title("Taux de chômage moyen par région en Inde")
plt.xlabel("Région")
plt.ylabel("Taux de chômage estimé moyen (%)")
plt.xticks(rotation=90)
plt.grid(axis='y')
plt.tight_layout()
plt.savefig("unemployment_by_region.png")
print("""\nGraphique du taux de chômage par région enregistré dans unemployment_by_region.png""")




# Insights et Recommandations Politiques

"""## Insights Clés

L\\\'analyse du taux de chômage en Inde révèle plusieurs points clés:

*   **Impact du Covid-19**: La pandémie de Covid-19 a eu un impact significatif sur le taux de chômage en Inde, avec une augmentation notable pendant les mois de confinement. Les visualisations montrent une hausse marquée du chômage et une baisse de l\\\'emploi estimé, en particulier dans certaines régions.

*   **Tendances Régionales**: Le taux de chômage varie considérablement d\\\'une région à l\\\'autre. Certaines régions affichent des taux de chômage constamment plus élevés, ce qui suggère des disparités économiques et structurelles sous-jacentes.

*   **Tendances Saisonnières**: Il existe des tendances saisonnières claires dans le taux de chômage, avec des fluctuations prévisibles au cours de l\\\'année. Ces variations peuvent être liées aux cycles agricoles, aux festivals ou à d\\\'autres facteurs socio-économiques saisonniers.

*   **Participation au Marché du Travail**: L\\\'analyse de la participation au marché du travail est cruciale pour comprendre la dynamique de l\\\'emploi. Une faible participation peut masquer un chômage réel plus élevé ou indiquer des problèmes structurels dans l\\\'intégration de la main-d\\\'œuvre.

## Recommandations Politiques

Sur la base de ces insights, plusieurs recommandations politiques peuvent être formulées pour atténuer le chômage et favoriser une croissance économique inclusive:

1.  **Soutien aux Secteurs Vulnérables**: Mettre en place des programmes de soutien ciblés pour les secteurs et les régions les plus touchés par les chocs économiques (comme la pandémie). Cela pourrait inclure des subventions salariales, des prêts à faible taux d\\\'intérêt pour les petites et moyennes entreprises (PME), et des mesures d\\\'allégement fiscal.

2.  **Développement des Compétences et Formation Professionnelle**: Investir dans des programmes de développement des compétences et de formation professionnelle adaptés aux besoins du marché du travail. Cela aiderait les travailleurs à acquérir de nouvelles compétences ou à améliorer celles existantes, facilitant ainsi leur réintégration ou leur progression dans l\\\'emploi.

3.  **Promotion de l\\\'Entrepreneuriat et des PME**: Encourager l\\\'entrepreneuriat et soutenir la croissance des PME, qui sont de grands créateurs d\\\'emplois. Cela peut se faire par des incitations fiscales, un accès facilité au financement, et des programmes de mentorat.

4.  **Amélioration des Infrastructures Rurales**: Étant donné l\\\'importance du secteur agricole et les tendances saisonnières, l\\\'amélioration des infrastructures rurales (irrigation, transport, stockage) peut stabiliser les revenus agricoles et créer des opportunités d\\\'emploi non agricoles dans les zones rurales.

5.  **Collecte et Analyse de Données Améliorées**: Continuer à collecter des données détaillées et granulaires sur le chômage et l\\\'emploi, y compris des données désagrégées par sexe, âge, niveau d\\\'éducation et secteur d\\\'activité. Une meilleure compréhension des dynamiques du marché du travail permettra des interventions politiques plus efficaces.

6.  **Politiques de Protection Sociale**: Renforcer les filets de sécurité sociale pour les chômeurs, tels que les allocations de chômage ou les programmes de travail garanti, afin de fournir un soutien financier pendant les périodes de transition et de réduire la vulnérabilité économique.

Ces recommandations visent à créer un environnement plus résilient et équitable pour le marché du travail indien, en s\\\'attaquant aux causes profondes du chômage et en préparant la main-d\\\'œuvre aux défis futurs.

"""


