In [2]:
import pandas as pd

# Définissons les noms de colonnes selon la description
col_names = [
    "geonameid", "nom", "asciiname", "alternatenames", "latitude", "longitude",
    "classe_entites", "code_fonctionnalite", "code_pays", "cc2",
    "code_admin1", "code_admin2", "code_admin3", "code_admin4",
    "population", "altitude", "dem", "fuseau_horaire", "date_modification"
]

# Chargeons le fichier .txt
df = pd.read_csv(r"C:\mini_projet_data_analysis\BF.txt",
                 sep="\t",
                 header=None,
                 names=col_names,
                 engine="python")

# Extraction uniquement des colonnes souhaitées
df_extract = df[["geonameid", "nom", "latitude", "longitude"]]

# Renommons les colonnes
df_extract = df_extract.rename(columns={
    "geonameid": "ID",
    "nom": "location_name",
    "latitude": "lat",
    "longitude": "long"
})

# Sauvegardons dans un CSV
df_extract.to_csv(r"C:\mini_projet_data_analysis\burkina_location.csv", index=False)

print("Extraction et renommage terminés !")

Extraction et renommage terminés !


In [4]:

# Chargeons le fichier déjà généré
df = pd.read_csv(r"C:\mini_projet_data_analysis\burkina_location.csv")

# Filtrons les lignes où "location_name" contient "gounghin" 
df_gounghin = df[df["location_name"].str.contains("gounghin", case=False, na=False)]

# Sauvegardons dans un nouveau CSV
df_gounghin.to_csv(r"C:\mini_projet_data_analysis\gounghin.csv", index=False)

print("Fichier gounghin.csv généré avec", len(df_gounghin), "lignes.")

Fichier gounghin.csv généré avec 10 lignes.


In [7]:

# Chargeons le fichier
df = pd.read_csv(r"C:\mini_projet_data_analysis\burkina_location.csv")

# Extraction des lignes dont la première lettre du nom est entre 'A' et 'P'
df_AP = df[df["location_name"].str[0].str.upper().between('A', 'P')]

# Trions par ordre alphabétique du nom de lieu
df_AP = df_AP.sort_values(by="location_name", ascending=True)

print("\nSous-partie de la base de données (fichier burkina_location.csv),")
print("dont les noms commencent par une lettre entre 'A' et 'P', triés par ordre alphabétique :")
print(df_AP)

# Identifions latitude et longitude minimales et leurs lieux correspondants
lat_min = df_AP["lat"].min()
lat_min_name = df_AP.loc[df_AP["lat"] == lat_min, "location_name"].tolist()

lon_min = df_AP["long"].min()
lon_min_name = df_AP.loc[df_AP["long"] == lon_min, "location_name"].tolist()

print("\nLatitude et longitude minimales et leurs lieux correspondants")
print(f"Latitude minimale : {lat_min} → {lat_min_name}")
print(f"Longitude minimale : {lon_min} → {lon_min_name}")

# Lieux dont (lat >= 11) et (lon <= 0.5)
df_zone = df[(df["lat"] >= 11) & (df["long"] <= 0.5)]

print("\nLieux dans la zone lat >= 11 et lon <= 0.5 :")
print(df_zone)


Sous-partie de la base de données (fichier burkina_location.csv),
dont les noms commencent par une lettre entre 'A' et 'P', triés par ordre alphabétique :
             ID location_name       lat     long
10648   6913771        Abanda  15.06808 -0.59805
10031   2363251        Abanga  13.32429  0.31151
11093  11980339        Abassi  12.27728 -1.13662
10601   6874881         Abaye  13.44080 -3.90190
10028   2363248          Abra  13.75724 -1.47784
...         ...           ...       ...      ...
10111   2570015       Pézinga  12.05298 -1.47002
3478    2356655            Pê  11.30000 -3.53333
3279    2356453            Pô  12.30000 -2.61667
3280    2356454            Pô  11.16972 -1.14500
10394   6296406    Pô Airport  11.17854 -1.14498

[8306 rows x 4 columns]

Latitude et longitude minimales et leurs lieux correspondants
Latitude minimale : 5.21609 → ['Komoé']
Longitude minimale : -5.65968 → ['Banifing']

Lieux dans la zone lat >= 11 et lon <= 0.5 :
             ID location_name       l

In [8]:

# 5 – Création du fichier Excel avec deux feuilles
excel_path = r"C:\mini_projet_data_analysis\mini_projet.xlsx"

with pd.ExcelWriter(excel_path, engine='openpyxl') as writer:
    df_gounghin.to_excel(writer, sheet_name='gounghin', index=False)
    df_AP.to_excel(writer, sheet_name='A_to_P', index=False)

print(f"Fichier Excel créé avec succès : {excel_path}")

Fichier Excel créé avec succès : C:\mini_projet_data_analysis\mini_projet.xlsx
