#### Mini Projet COMPAORE Delwendé Jonathan

#### Lien du repertoire github correspondant: 

#### 1. Export de la base de données qui recense les informations sur le Burkina Faso (https://download.geonames.org/export/dump/). code iso BF

#### 2. Téléchargement du fichier zip correspondant (BF.zip)

#### 3. Opérations de prétraitement et les filtres nécessaires au fichier afin de ne conserver que les colonnes correspondantes

In [44]:
#bibliothèques nécessaires
#pip install pandas
#pip install XlsxWriter

import pandas as pd

# Lecture du fichier
bf_path = "BF/BF.txt"
df = pd.read_csv(bf_path, sep="\t", header=None, encoding="utf-8")

* 3.1: Sélection des colonnes Identifiants, Noms de lieux, latitudes, longitudes

In [45]:
df_filtered = df.iloc[:, [0, 1, 4, 5]]

* 3.2 Renommage avec des noms de colonne

In [46]:
df_filtered.columns = ["ID", "location_name", "lat", "long"]

* 3.3 Sauvegarde des données dans un fichier CSV, nommé burkina_location.csv

In [47]:
df_filtered.to_csv("burkina_location.csv", index=False, encoding="utf-8")
print("'burkina_location.csv' créé avec succès !")

'burkina_location.csv' créé avec succès !


### 4 - Opérations sur le fichier CSV burkina_location.csv.

In [48]:
#Lecture du fichier CSV principal
df = pd.read_csv("burkina_location.csv", encoding="utf-8")

* 4.1 Extraction des données contenant "gounghin"

In [49]:
gounghin_df = df[df["location_name"].str.contains("gounghin", case=False, na=False)]
gounghin_df.to_csv("gounghin.csv", index=False, encoding="utf-8")
print("gounghin.csv créé :", gounghin_df.shape[0], "lignes")

gounghin.csv créé : 10 lignes


* 4.2 Extraction des lieux dont la première lettre est entre 'A' et 'P'

In [53]:
subset_AP = df[df["location_name"].str[0].str.upper().between("A", "P")]
print("Sous-partie A à P :", subset_AP.shape[0], "lignes")

Sous-partie A à P : 8306 lignes


* 4.3 Identification respectives des latitude et longitude minimale et des noms associés

In [54]:
lat_min = df["lat"].min()
lon_min = df["long"].min()

lieux_lat_min = df[df["lat"] == lat_min]["location_name"].tolist()
lieux_lon_min = df[df["long"] == lon_min]["location_name"].tolist()

print(f"Latitude minimale : {lat_min} - Lieux : {lieux_lat_min}")
print(f"Longitude minimale : {lon_min} - Lieux : {lieux_lon_min}")

Latitude minimale : 5.21609 - Lieux : ['Komoé']
Longitude minimale : -5.65968 - Lieux : ['Banifing']


* 4.4 Lieux dont lat >= 11 et lon <= 0.5

In [55]:
zone_df = df[(df["lat"] >= 11) & (df["long"] <= 0.5)]
print("Lieux dans la zone demandée :", zone_df.shape[0], "lignes")
print(zone_df)

Lieux dans la zone demandée : 9466 lignes
             ID location_name       lat     long
5       2353158      Zyonguen  12.36667 -0.45000
6       2353159     Zyiliwèlè  12.38333 -2.73333
7       2353160        Zyanko  12.78333 -0.41667
8       2353161         Zouta  13.14908 -1.28197
9       2353162     Zourtenga  12.95741 -1.28745
...         ...           ...       ...      ...
11953  13494828     Tounougou  11.21462 -0.06965
11954  13494829         Karmé  11.66346  0.08201
11955  13494830     Damdamkom  11.14989  0.43655
11956  13494831       Dazenré  11.43801  0.21293
11957  13494832   Pogoyoaguen  11.44725  0.21074

[9466 rows x 4 columns]


### 5 Création du fichier Excel avec deux feuilles à partir des extractions de l'étape 4

In [56]:
excel_path = "mini_projet.xlsx"
with pd.ExcelWriter(excel_path, engine="xlsxwriter") as writer:
    gounghin_df.to_excel(writer, sheet_name="gounghin", index=False)
    subset_AP.to_excel(writer, sheet_name="A_to_P", index=False)

print(f"Fichier Excel '{excel_path}' créé avec succès !")
print("Feuilles : 'gounghin' et 'A_to_P'")

Fichier Excel 'mini_projet.xlsx' créé avec succès !
Feuilles : 'gounghin' et 'A_to_P'
