In [16]:
                                          ################################################
                                          #    MINI-PROJET  Data Processing - Data Viz   #
                                          ################################################

In [17]:
# ===============================
# Importer les packages nécessaires
# ===============================

In [18]:
import pandas as pd
import requests, zipfile, io
import os

In [19]:
# =====================================
# 1 & 2- Télécharger et extraire BF.zip
# =====================================

In [20]:
# URL du fichier GeoNames pour le Burkina Faso
url = "https://download.geonames.org/export/dump/BF.zip"

# Télécharger le fichier
r = requests.get(url)
z = zipfile.ZipFile(io.BytesIO(r.content))

# Extraire dans un dossier
z.extractall("data") 
print("Fichiers extraits :", z.namelist())

Fichiers extraits : ['readme.txt', 'BF.txt']


In [21]:
# ===============================
# 3- Prétraitement du fichier BF.txt
# ===============================

In [22]:
df = pd.read_csv(
    "data/BF.txt",
    sep='\t',
    header=None,
    dtype=str
)

df = df[[0, 1, 4, 5]]
df.columns = ['ID', 'location_name', 'lat', 'long']
df['lat'] = df['lat'].astype(float)
df['long'] = df['long'].astype(float)

# Sauvegarde du CSV
df.to_csv("data/burkina_location.csv", index=False)
print("CSV burkina_location.csv créé avec succès !")

CSV burkina_location.csv créé avec succès !


In [23]:
# ===============================
# 4- Extractions et filtres
# ===============================


In [24]:
# 4.1 Lieux contenant "gounghin"
gounghin_df = df[df['location_name'].str.contains('gounghin', case=False)]
gounghin_df.to_csv("gounghin.csv", index=False)
print("Fichier gounghin.csv créé avec succès !")

# 4.2 Lieux dont la première lettre est A à P
a_to_p_df = df[df['location_name'].str[0].str.upper().between('A', 'P')]
a_to_p_df.to_csv("A_to_P.csv", index=False)
print("Fichier A_to_P.csv créé avec succès !")

# 4.3 Latitude et longitude minimales
min_lat = df['lat'].min()
min_lat_names = df[df['lat'] == min_lat]['location_name'].values
print("Latitude minimale :", min_lat)
print("Lieux correspondants :", min_lat_names)

min_long = df['long'].min()
min_long_names = df[df['long'] == min_long]['location_name'].values
print("Longitude minimale :", min_long)
print("Lieux correspondants :", min_long_names)

# 4.4 Coordonnées lat >= 11 et long <= 0.5
subset_df = df[(df['lat'] >= 11) & (df['long'] <= 0.5)]
subset_df.to_csv("Coord_lat11_long0.5.csv", index=False)
print(f"Nombre de lieux correspondant aux critères : {subset_df.shape[0]}")


Fichier gounghin.csv créé avec succès !
Fichier A_to_P.csv créé avec succès !
Latitude minimale : 5.21609
Lieux correspondants : ['Komoé']
Longitude minimale : -5.65968
Lieux correspondants : ['Banifing']
Nombre de lieux correspondant aux critères : 9466


In [25]:
# ======================================================
# 5- Création du fichier Excel avec toutes les feuilles
# =====================================================

In [26]:
# Installation de packages : 
!pip install XlsxWriter openpyxl


[notice] A new release of pip is available: 25.0.1 -> 25.2
[notice] To update, run: python.exe -m pip install --upgrade pip




In [27]:
with pd.ExcelWriter("mini_projet.xlsx", engine='xlsxwriter') as writer:
    gounghin_df.to_excel(writer, sheet_name='gounghin', index=False)
    a_to_p_df.to_excel(writer, sheet_name='A_to_P', index=False)

print("Fichier Excel 'mini_projet.xlsx' créé avec succès avec toutes les feuilles !")

Fichier Excel 'mini_projet.xlsx' créé avec succès avec toutes les feuilles !
