In [42]:
import requests
import pandas as pd
import geopandas as gpd
from shapely.geometry import Point
import folium

## 1. Récupérations des données à partir de GBIF

In [43]:
def get_lion_data():
    # Définir les paramètres de la requête
    params = {
        'q': 'Panthera leo',  # Rechercher les données sur Panthera leo (lion)
        #'hasCoordinate': 'true',  # Exclure les enregistrements sans coordonnées géographiques
        'limit': 10000  # Limiter le nombre de résultats à 10000
    }
    
    # Faire une requête à l'API GBIF
    response = requests.get('https://api.gbif.org/v1/occurrence/search', params=params)
    
    # Vérifier si la requête a réussi
    if response.status_code == 200:
        # Extraire les données JSON
        data = response.json()
        return data['results']
    else:
        print("Erreur lors de la récupération des données:", response.status_code)
        return None

## 2. Nettoyer les données en éliminant les enregistrements incomplets :

In [44]:
def clean_lion_data(data):
    # Convertir les données en DataFrame pandas
    df = pd.DataFrame(data)
    
    # Supprimer les enregistrements avec des valeurs manquantes dans les colonnes de géolocalisation
    df = df.dropna(subset=['decimalLatitude', 'decimalLongitude'])
    
    return df

## 3. Sauvegarder les données nettoyées dans un fichier CSV :

In [45]:
def save_to_csv(data, filename='lion_data.csv'):
    # Sauvegarder les données nettoyées dans un fichier CSV
    data.to_csv(filename, index=False)
    
# Récupérer les données sur les lions
lion_data = get_lion_data()

# Nettoyer les données
cleaned_lion_data = clean_lion_data(lion_data)

# Sauvegarder les données nettoyées dans un fichier CSV
save_to_csv(cleaned_lion_data, filename='lion_data.csv')

## 4. Orchestration pour maintenir la base de données ou le fichier CSV à jour

### Ici pour supprimer les doublons 

In [46]:
def update_database_or_csv(data):
    # Vérifier si le fichier CSV existe déjà
    try:
        existing_data = pd.read_csv('lion_data.csv')
        # Concaténer les données existantes avec les nouvelles données
        updated_data = pd.concat([existing_data, data], ignore_index=True)
        # Supprimer les éventuels doublons en utilisant les colonnes 'decimalLatitude' et 'decimalLongitude'
        updated_data.drop_duplicates(subset=['decimalLatitude', 'decimalLongitude'], inplace=True)
        # Sauvegarder les données mises à jour dans le même fichier CSV
        save_to_csv(updated_data, filename='lion_data1.csv')
        print("Données mises à jour avec succès.")
    except FileNotFoundError:
        # Si le fichier CSV n'existe pas, simplement sauvegarder les nouvelles données dans un nouveau fichier
        save_to_csv(data, filename='lion_data1.csv')
        print("Nouveau fichier CSV créé avec succès.")

# Maintenant, vous pouvez appeler cette fonction après avoir nettoyé les nouvelles données et avant de créer la carte :
# Récupérer les données sur les lions
lion_data = get_lion_data()

# Nettoyer les données
cleaned_lion_data = clean_lion_data(lion_data)

# Mettre à jour la base de données ou le fichier CSV
update_database_or_csv(cleaned_lion_data)



Données mises à jour avec succès.


### Ici pour concaténer deux fichiers 

In [47]:
def update_database_or_csv(new_data):
    # Charger le fichier CSV existant s'il existe
    try:
        existing_data = pd.read_csv('lion_data.csv')
    except FileNotFoundError:
        existing_data = pd.DataFrame()  # Créer un DataFrame vide s'il n'existe pas de fichier CSV
    
    # Concaténer les nouveaux données avec les données existantes
    updated_data = pd.concat([existing_data, new_data], ignore_index=True)
    
    # Enregistrer le DataFrame mis à jour dans un nouveau fichier CSV
    updated_data.to_csv('lion_data_updated.csv', index=False)
# Récupérer les données sur les lions
lion_data = get_lion_data()

# Nettoyer les données
cleaned_lion_data = clean_lion_data(lion_data)

# Mettre à jour la base de données ou le fichier CSV
update_database_or_csv(cleaned_lion_data)




## 5. Créations de la carte

In [48]:
data = pd.read_csv("lion_data.csv")

In [50]:
def create_distribution_map(data):
    # Créer une carte Folium centrée sur une position de départ
    lion_map = folium.Map(location=[0, 0], zoom_start=2)

    # Ajouter un marqueur pour chaque enregistrement de lion
    for index, row in data.iterrows():
        # Récupérer les coordonnées du point et le nom du pays
        lat, lon = row['decimalLatitude'], row['decimalLongitude']
        country = row['country']
        
        # Créer un marqueur avec le nom du pays comme étiquette
        folium.Marker([lat, lon], popup=country, icon=folium.Icon(color='red')).add_to(lion_map)
    
    # Afficher la carte
    lion_map.save('lion_distribution_map.html')



# Créer une carte illustrant la répartition des lions sur Terre avec Folium
create_distribution_map(cleaned_lion_data)
