In [None]:
# Importer la bibliothèque pandas
import pandas as pd

# Chemin vers le fichier CSV
file_path = 'Life Expectancy at Birth.csv'

# Charger les données à partir du fichier CSV
# data = pd.read_csv(file_path)
data = pd.read_csv(file_path, sep=';', on_bad_lines='warn')

# Transformer les colonnes d'années en une seule colonne "Year" avec les valeurs correspondantes
# Identifier les colonnes d'années contenant "Life Expectancy at Birth"
# data_long = data.melt(
#     id_vars=["Country", "Continent"],
#     var_name="Year",
#     value_name="Life_Exp_va"
# )

data_long = data.melt(
    id_vars=[data.columns[1], data.columns[2]],  # Utiliser data.columns pour obtenir les noms exacts des colonnes
    var_name="Year",                    # Nouvelle colonne pour les années
    value_name="Life_Exp_va"            # Nouvelle colonne pour les valeurs
)

# Nettoyer la colonne "Year" pour extraire uniquement les années
data_long["Year"] = data_long["Year"].str.extract(r'(\d{4})')  # Extraire les années (format YYYY)

# Supprimer les lignes avec des valeurs manquantes dans "Year" ou "Life_Exp_va"
data_long = data_long.dropna(subset=["Year", "Life_Exp_va"])

# Convertir "Year" en entier
data_long["Year"] = data_long["Year"].astype(int)

# Filtrer uniquement les pays africains
african_countries = data_long[data_long["Continent"] == "Africa"]

# Trier les données par pays et par année
african_countries = african_countries.sort_values(by=["Country", "Year"])

# Afficher les données pays par pays
for country, group in african_countries.groupby("Country"):
    print(f"Country: {country}\n")  # Afficher le nom du pays
    for _, row in group.iterrows():
        print(f"Year: {int(row['Year'])}, Life_Exp_va: {row['Life_Exp_va']}")  # Afficher année et espérance de vie
    print("\n---\n")  # Séparateur entre les pays

Country: Algeria

Year: 1990, Life_Exp_va: 67.416
Year: 1991, Life_Exp_va: 67.6875
Year: 1992, Life_Exp_va: 67.7571
Year: 1993, Life_Exp_va: 67.7195
Year: 1994, Life_Exp_va: 67.3614
Year: 1995, Life_Exp_va: 67.4544
Year: 1996, Life_Exp_va: 68.7493
Year: 1997, Life_Exp_va: 69.1706
Year: 1998, Life_Exp_va: 69.4506
Year: 1999, Life_Exp_va: 70.0316
Year: 2000, Life_Exp_va: 70.4779
Year: 2001, Life_Exp_va: 70.8233
Year: 2002, Life_Exp_va: 71.2296
Year: 2003, Life_Exp_va: 71.2868
Year: 2004, Life_Exp_va: 71.7617
Year: 2005, Life_Exp_va: 72.0612
Year: 2006, Life_Exp_va: 72.3336
Year: 2007, Life_Exp_va: 72.6019
Year: 2008, Life_Exp_va: 72.9405
Year: 2009, Life_Exp_va: 73.6196
Year: 2010, Life_Exp_va: 73.8081
Year: 2011, Life_Exp_va: 74.1234
Year: 2012, Life_Exp_va: 74.2024
Year: 2013, Life_Exp_va: 74.6153
Year: 2014, Life_Exp_va: 75.11
Year: 2015, Life_Exp_va: 75.622
Year: 2016, Life_Exp_va: 75.7318
Year: 2017, Life_Exp_va: 75.7428
Year: 2018, Life_Exp_va: 76.0656
Year: 2019, Life_Exp_va: 76.4

In [None]:
# Importer la bibliothèque pandas
import pandas as pd

# Chemin vers le fichier CSV
file_path = 'Life Expectancy at Birth.csv'

# Charger les données à partir du fichier CSV
data = pd.read_csv(file_path, sep=';', on_bad_lines='warn')

# Transformer les colonnes d'années en une seule colonne "Year" avec les valeurs correspondantes
data_long = data.melt(
    id_vars=[data.columns[1], data.columns[2]],  # Utiliser data.columns pour obtenir les noms exacts des colonnes
    var_name="Year",                    # Nouvelle colonne pour les années
    value_name="Life_Exp_va"            # Nouvelle colonne pour les valeurs
)

# Nettoyer la colonne "Year" pour extraire uniquement les années
data_long["Year"] = data_long["Year"].str.extract(r'(\d{4})')  # Extraire les années (format YYYY)

# Supprimer les lignes avec des valeurs manquantes dans "Year" ou "Life_Exp_va"
data_long = data_long.dropna(subset=["Year", "Life_Exp_va"])

# Convertir "Year" en entier
data_long["Year"] = data_long["Year"].astype(int)

# Filtrer uniquement les pays africains
african_countries = data_long[data_long[data.columns[2]] == "Africa"]

# Trier les données par pays et par année
african_countries = african_countries.sort_values(by=[data.columns[1], "Year"]).reset_index(drop=True)

# Afficher le DataFrame final
african_countries.head(20)

Unnamed: 0,Country,Continent,Year,Life_Exp_va
0,Algeria,Africa,1990,67.416
1,Algeria,Africa,1991,67.6875
2,Algeria,Africa,1992,67.7571
3,Algeria,Africa,1993,67.7195
4,Algeria,Africa,1994,67.3614
5,Algeria,Africa,1995,67.4544
6,Algeria,Africa,1996,68.7493
7,Algeria,Africa,1997,69.1706
8,Algeria,Africa,1998,69.4506
9,Algeria,Africa,1999,70.0316


In [1]:
import os
import zipfile
import random
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers, models
from sklearn.model_selection import train_test_split
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# Définition des paramètres
data_dir = "./GTSRB"
train_dir = os.path.join(data_dir, "Train")
test_dir = os.path.join(data_dir, "Test")
img_height, img_width = 64, 64  # Taille des images
batch_size = 32
num_classes = 43  # Nombre de classes de panneaux de signalisation

# Étape 1 : Extraction des données
zip_file = "archive.zip"
if not os.path.exists(data_dir):
    with zipfile.ZipFile(zip_file, 'r') as zip_ref:
        zip_ref.extractall(data_dir)

# Vérification de l'extraction
def check_data_directory(directory):
    if os.path.exists(directory):
        print(f"Extraction réussie. Contenu de {directory} :", os.listdir(directory))
    else:
        print(f"Échec de l'extraction : {directory} introuvable.")

check_data_directory(data_dir)
check_data_directory(train_dir)
check_data_directory(test_dir)

# Étape 2 : Prétraitement des données
train_datagen = ImageDataGenerator(
    rescale=1./255,
    validation_split=0.2,  # 20% des données pour la validation
    rotation_range=15,
    width_shift_range=0.1,
    height_shift_range=0.1,
    shear_range=0.1,
    zoom_range=0.2,
    horizontal_flip=False,
    fill_mode='nearest'
)

test_datagen = ImageDataGenerator(rescale=1./255)

train_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=(img_height, img_width),
    batch_size=batch_size,
    class_mode='categorical',
    subset='training'
)

validation_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=(img_height, img_width),
    batch_size=batch_size,
    class_mode='categorical',
    subset='validation'
)

test_generator = test_datagen.flow_from_directory(
    test_dir,
    target_size=(img_height, img_width),
    batch_size=batch_size,
    class_mode='categorical',
    shuffle=False
)

# Étape 3 : Définition du modèle CNN
def build_model():
    model = models.Sequential([
        layers.Conv2D(32, (3, 3), activation='relu', input_shape=(img_height, img_width, 3)),
        layers.MaxPooling2D((2, 2)),
        layers.Conv2D(64, (3, 3), activation='relu'),
        layers.MaxPooling2D((2, 2)),
        layers.Conv2D(128, (3, 3), activation='relu'),
        layers.MaxPooling2D((2, 2)),
        layers.Flatten(),
        layers.Dense(128, activation='relu'),
        layers.Dropout(0.5),
        layers.Dense(num_classes, activation='softmax')
    ])
    model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])
    return model

model = build_model()

# Étape 4 : Entraînement du modèle
history = model.fit(
    train_generator,
    validation_data=validation_generator,
    epochs=10,
    verbose=1
)

# Étape 5 : Évaluation et prédictions
loss, accuracy = model.evaluate(test_generator)
print(f"Test Accuracy: {accuracy * 100:.2f}%")

# Étape 6 : Utilisation d'un modèle pré-entraîné
base_model = keras.applications.MobileNetV2(input_shape=(img_height, img_width, 3), include_top=False, weights='imagenet')
base_model.trainable = False

pretrained_model = models.Sequential([
    base_model,
    layers.GlobalAveragePooling2D(),
    layers.Dense(num_classes, activation='softmax')
])

pretrained_model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['accuracy'])

# Entraînement du modèle pré-entraîné
pretrained_history = pretrained_model.fit(
    train_generator,
    validation_data=validation_generator,
    epochs=10,
    verbose=1
)

# Évaluation du modèle pré-entraîné
pretrained_loss, pretrained_accuracy = pretrained_model.evaluate(test_generator)
print(f"Test Accuracy (Pretrained Model): {pretrained_accuracy * 100:.2f}%")

FileNotFoundError: [Errno 2] No such file or directory: 'archive.zip'