In [1]:
#Lecture du fichier xlsx
import pandas as pd
df_berce = pd.read_excel('./data/berce_du_caucase.xlsx')

#On garde uniquement les colonnes latitudes, longitude, altitude et date
df_berce = df_berce[['decimalLatitude', 'decimalLongitude', 'elevation', 'year']]

#On renomme les colonnes
df_berce.columns = ['latitude', 'longitude', 'elevation', 'year']

In [2]:
def data_infos(dataframe):
    #Infos sur les données
    print("Informations sur les données :")
    print(dataframe.describe())
    print()

    #Compte des valeurs manquantes dans chaque colonne
    print("Nombre de valeurs manquantes dans chaque colonne :")
    print(dataframe.isnull().sum())

data_infos(df_berce)

Informations sur les données :
           latitude     longitude     elevation          year
count  26611.000000  26611.000000  26520.000000  26611.000000
mean      46.922634      8.874740    933.140534   2013.522190
std        0.393800      0.919174    429.296405      5.874152
min       45.841650      5.998320    160.000000   1899.000000
25%       46.694550      8.484920    525.500000   2010.000000
50%       46.842020      8.911090    891.000000   2014.000000
75%       47.313270      9.671630   1311.750000   2018.000000
max       47.762260     10.462660   2662.000000   2024.000000

Nombre de valeurs manquantes dans chaque colonne :
latitude      0
longitude     0
elevation    91
year          0
dtype: int64


In [3]:
#Remove des lignes avec des valeurs manquantes
df_berce = df_berce.dropna()

#Remove des lignes en dessous de l'année 2000
df_berce = df_berce[df_berce.year >= 2000]

In [4]:
data_infos(df_berce)

Informations sur les données :
           latitude     longitude     elevation          year
count  26130.000000  26130.000000  26130.000000  26130.000000
mean      46.919113      8.889818    938.546325   2013.816762
std        0.392547      0.912334    429.181194      5.124186
min       45.841650      5.998320    160.000000   2000.000000
25%       46.691370      8.488336    528.500000   2010.000000
50%       46.841070      8.921310    896.000000   2014.000000
75%       47.308005      9.673700   1320.000000   2018.000000
max       47.762260     10.462660   2662.000000   2024.000000

Nombre de valeurs manquantes dans chaque colonne :
latitude     0
longitude    0
elevation    0
year         0
dtype: int64


In [5]:
import pandas as pd
import folium
from folium.plugins import HeatMap
from ipywidgets import interact, IntSlider, Output

# Créer un widget Output pour afficher la carte
output = Output()

# Fonction pour mettre à jour la carte en fonction de l'année sélectionnée
def update_map(selected_year):
    # Effacer la carte
    m = folium.Map(location=[46.8182, 8.2275], zoom_start=8)

    # Filtrer les données en fonction de l'année sélectionnée
    filtered_data = df_berce[df_berce['year'] == selected_year]

    # Préparer les données pour la heatmap
    heat_data = [[row['latitude'], row['longitude']] for index, row in filtered_data.iterrows()]

    # Créer une heatmap
    HeatMap(data=heat_data, radius=20, blur=30, max_zoom=1).add_to(m)

    # Afficher la carte mise à jour
    with output:
        output.clear_output(wait=True)
        display(m)

# Créer un slider pour la sélection des années
year_slider = IntSlider(min=df_berce['year'].min(), max=df_berce['year'].max(), step=1, value=df_berce['year'].min())
interact(update_map, selected_year=year_slider)

# Afficher la carte initiale avec la première année
update_map(df_berce['year'].min())  # Afficher les points de la première année au départ
output


interactive(children=(IntSlider(value=2000, description='selected_year', max=2024, min=2000), Output()), _dom_…

Output()