In [2]:
# Mini Projet - Data Extraction Burkina Faso
import pandas as pd
import zipfile
import requests


In [3]:
# Telechargement du fichier BF.zip
url = "https://download.geonames.org/export/dump/BF.zip"

zip_path = "BF.zip"

print("Téléchargement des données")
response = requests.get(url)
with open(zip_path, "wb") as f:
    f.write(response.content)
print("Téléchargement terminé")

Téléchargement des données
Téléchargement terminé


In [4]:
# Extraction du fichier
print("Extraction du fichier")
with zipfile.ZipFile(zip_path, 'r') as z:
    z.extractall("data")
print("Extraction terminée")

Extraction du fichier
Extraction terminée


In [11]:
# Lecture des donnees
cols = [
    "geonameid", "name", "asciiname", "alternatenames",
    "latitude", "longitude", "feature class", "feature code",
    "country code", "cc2", "admin1 code", "admin2 code",
    "admin3 code", "admin4 code", "population", "elevation",
    "dem", "timezone", "modification date"
]
df = pd.read_csv("data/BF.txt", sep="\t", header=None, names=cols)

# Extraction des colonnes utiles et renommage
df = df[["geonameid", "name", "latitude", "longitude"]]
df.columns = ["ID", "location_name", "lat", "long"]
print(df)

             ID       location_name       lat     long
0       2282318              Pouéné   9.72908 -2.78660
1       2285251  Léraba Occidentale  10.28333 -5.11667
2       2287216           Kéléouoro   9.80748 -4.05023
3       2294066         White Volta   8.70194 -0.99056
4       2298457        Issana Bouga  10.91667 -1.18333
...         ...                 ...       ...      ...
11953  13494828           Tounougou  11.21462 -0.06965
11954  13494829               Karmé  11.66346  0.08201
11955  13494830           Damdamkom  11.14989  0.43655
11956  13494831             Dazenré  11.43801  0.21293
11957  13494832         Pogoyoaguen  11.44725  0.21074

[11958 rows x 4 columns]


In [6]:
# Sauvegardons le fichier burkina_location.csv
df.to_csv("burkina_location.csv", index=False)
print(" burkina_location.csv créé")

 burkina_location.csv créé


In [7]:
# Extraction des lieux contenant 'gounghin'
gounghin_df = df[df["location_name"].str.contains("gounghin", case=False)]
gounghin_df.to_csv("gounghin.csv", index=False)
print("gounghin.csv créé")

gounghin.csv créé


In [8]:
# Extraction des lieux dont les noms commencent entre A et P
A_to_P_df = df[df["location_name"].str[0].str.upper().between("A", "P")]
A_to_P_df.to_csv("A_to_P.csv", index=False)

In [9]:
# Latitude et longituge minimale

# Latitude minimale
lat_min = A_to_P_df["lat"].min()
lat_min_places = A_to_P_df[A_to_P_df["lat"] == lat_min]

# Longitude minimale
long_min = A_to_P_df["long"].min()
long_min_places = A_to_P_df[A_to_P_df["long"] == long_min]

print("\n Latitude minimale :")
print(lat_min_places)

print("\n Longitude minimale :")
print(long_min_places)




 Latitude minimale :
           ID location_name      lat     long
6017  2359210         Komoé  5.21609 -3.71793

 Longitude minimale :
           ID location_name       lat     long
4220  2357400      Banifing  12.01147 -5.65968


In [10]:
# les Coordonnées qui respectent ces conditions (lat >= 11 et long <= 0.5)
coord_filter = df[(df["lat"] >= 11) & (df["long"] <= 0.5)]
print("\n Lieux avec lat >= 11 et long <= 0.5 :")
print(coord_filter)

# Création du fichier Excel
with pd.ExcelWriter("mini_projet.xlsx") as writer:
    gounghin_df.to_excel(writer, sheet_name="gounghin", index=False)
    A_to_P_df.to_excel(writer, sheet_name="A_to_P", index=False)

print("\n mini_projet.xlsx créé avec les deux feuilles")




 Lieux avec lat >= 11 et long <= 0.5 :
             ID location_name       lat     long
5       2353158      Zyonguen  12.36667 -0.45000
6       2353159     Zyiliwèlè  12.38333 -2.73333
7       2353160        Zyanko  12.78333 -0.41667
8       2353161         Zouta  13.14908 -1.28197
9       2353162     Zourtenga  12.95741 -1.28745
...         ...           ...       ...      ...
11953  13494828     Tounougou  11.21462 -0.06965
11954  13494829         Karmé  11.66346  0.08201
11955  13494830     Damdamkom  11.14989  0.43655
11956  13494831       Dazenré  11.43801  0.21293
11957  13494832   Pogoyoaguen  11.44725  0.21074

[9466 rows x 4 columns]

 mini_projet.xlsx créé avec les deux feuilles
