# PROJET IA MOTEUR DE RECHERCHE  GEOSEARCH (GEOSPATIALE)

Le projet GeoSearch est une initiative visant à développer un moteur de recherche intelligent spécialisé dans les sciences géospatiales. Dans le cadre de ce projet, j'utiliserai une Intelligence Artificielle Générative pour générer des réponses aux requêtes des utilisateurs, en utilisant une base de connaissances scientifiques enrichie. 

![GeoSearch Diagram](./IM3.png)


In [None]:
# Installation des packages necessaire à notre projet 

%pip install langchain
%pip install langchain-community
%pip install openai
%pip install pypdf  
%pip install chromadb  
%pip install tiktoken  
%pip install beautifulsoup4 
%pip install yt_dlp  
%pip install pydub 

Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.


## Collecte de donnée dans le cadre de l'application de notre projet ( Data collection sources )

Construire un prototype fonctionnel de GeoSearch en utilisant des outils open source et gratuits.

### Collecte et Pretraitement des  Données Documentaires sur le sol , la géologie , le cadastre , etude circulation  et les Infrastructures dans les Villes Sélectionnées

Extraction des PDF et Normalisation de ces documents en JSON, incluant les champs importants

In [6]:
import os
import requests
from bs4 import BeautifulSoup
import fitz  # PyMuPDF pour l'extraction de texte
import json

# Répertoires pour sauvegarder les PDF et les fichiers normalisés
PDF_DIR = "pdf_data"
NORMALIZED_DIR = "normalized_data"
os.makedirs(PDF_DIR, exist_ok=True)
os.makedirs(NORMALIZED_DIR, exist_ok=True)

# Liste des recherches pour chaque ville
cities_keywords = [
    # Abidjan
    "Abidjan études de sol géologie PDF",
    "Abidjan rapport infrastructure PDF",
    "Abidjan document cadastral PDF",
    "Abidjan étude circulation PDF",
    "Abidjan plans réseaux souterrains PDF",
    # Bamako
    "Bamako études de sol géologie PDF",
    "Bamako rapport infrastructure PDF",
    "Bamako document cadastral PDF",
    "Bamako étude circulation PDF",
    "Bamako plans réseaux souterrains PDF",
    # Libreville
    "Libreville études de sol géologie PDF",
    "Libreville rapport infrastructure PDF",
    "Libreville document cadastral PDF",
    "Libreville étude circulation PDF",
    "Libreville plans réseaux souterrains PDF",
    # Cotonou
    "Cotonou études de sol géologie PDF",
    "Cotonou rapport infrastructure PDF",
    "Cotonou document cadastral PDF",
    "Cotonou étude circulation PDF",
    "Cotonou plans réseaux souterrains PDF",
    # Paris
    "Paris études de sol géologie PDF",
    "Paris rapport infrastructure PDF",
    "Paris document cadastral PDF",
    "Paris étude circulation PDF",
    "Paris plans réseaux souterrains PDF",
    # New York
    "New York soil studies geology PDF",
    "New York infrastructure report PDF",
    "New York cadastral document PDF",
    "New York traffic study PDF",
    "New York underground network plans PDF",
    # Tokyo
    "Tokyo soil studies geology PDF",
    "Tokyo infrastructure report PDF",
    "Tokyo cadastral document PDF",
    "Tokyo traffic study PDF",
    "Tokyo underground network plans PDF",
]


# Fonction pour télécharger un fichier PDF
def download_pdf(url, city_name, count):
    try:
        response = requests.get(url, stream=True)
        if response.status_code == 200 and "application/pdf" in response.headers.get("Content-Type", ""):
            filename = os.path.join(PDF_DIR, f"{city_name}_doc_{count}.pdf")
            with open(filename, "wb") as f:
                for chunk in response.iter_content(1024):
                    f.write(chunk)
            print(f"PDF téléchargé : {filename}")
            return filename
        else:
            print(f"Pas un PDF valide ou erreur HTTP : {url}")
            return None
    except Exception as e:
        print(f"Erreur lors du téléchargement de {url} : {e}")
        return None

# Fonction pour extraire le contenu textuel des PDF
def extract_text_from_pdf(pdf_path):
    try:
        doc = fitz.open(pdf_path)
        content = ""
        for page in doc:
            content += page.get_text()
        doc.close()
        return content.strip()
    except Exception as e:
        print(f"Erreur lors de l'extraction du texte de {pdf_path} : {e}")
        return None

# Fonction pour normaliser les données et les sauvegarder en JSON
def normalize_and_save_pdf(pdf_path, city_name):
    try:
        content = extract_text_from_pdf(pdf_path)
        if content:
            # Créer un dictionnaire structuré
            normalized_data = {
                "city": city_name,
                "file_name": os.path.basename(pdf_path),
                "content": content,
            }
            # Sauvegarder en JSON
            json_path = os.path.join(NORMALIZED_DIR, os.path.basename(pdf_path).replace(".pdf", ".json"))
            with open(json_path, "w", encoding="utf-8") as json_file:
                json.dump(normalized_data, json_file, ensure_ascii=False, indent=4)
            print(f"Données normalisées sauvegardées : {json_path}")
    except Exception as e:
        print(f"Erreur lors de la normalisation de {pdf_path} : {e}")

# Fonction pour rechercher et télécharger des PDF
def search_and_download_pdfs(cities_keywords, max_results=3):
    base_url = "https://html.duckduckgo.com/html/"
    headers = {"User-Agent": "Mozilla/5.0"}

    for query in cities_keywords:
        city_name = query.split()[0]  # Utiliser le premier mot (nom de la ville) pour nommer les fichiers
        print(f"Recherche de PDF pour : {query}")
        try:
            data = {"q": query, "t": "h_", "ia": "web"}
            response = requests.post(base_url, data=data, headers=headers)
            response.raise_for_status()

            soup = BeautifulSoup(response.text, "html.parser")
            links_found = 0
            downloaded_links = set()

            # Parcourir les liens pour trouver des PDF
            for link in soup.find_all("a", href=True):
                href = link["href"]
                if ".pdf" in href.lower() and links_found < max_results:
                    pdf_url = href if href.startswith("http") else f"https://{href}"

                    if pdf_url not in downloaded_links:
                        pdf_path = download_pdf(pdf_url, city_name, links_found + 1)
                        if pdf_path:
                            normalize_and_save_pdf(pdf_path, city_name)
                        downloaded_links.add(pdf_url)
                        links_found += 1

            if links_found == 0:
                print(f"Aucun PDF trouvé pour {city_name}.")
        except Exception as e:
            print(f"Erreur lors de la recherche pour {query} : {e}")

# Lancer la recherche, le téléchargement et la normalisation
search_and_download_pdfs(cities_keywords)


Recherche de PDF pour : Abidjan études de sol géologie PDF
PDF téléchargé : pdf_data\Abidjan_doc_1.pdf
Données normalisées sauvegardées : normalized_data\Abidjan_doc_1.json
PDF téléchargé : pdf_data\Abidjan_doc_2.pdf
Données normalisées sauvegardées : normalized_data\Abidjan_doc_2.json
PDF téléchargé : pdf_data\Abidjan_doc_3.pdf
Données normalisées sauvegardées : normalized_data\Abidjan_doc_3.json
Recherche de PDF pour : Abidjan rapport infrastructure PDF
PDF téléchargé : pdf_data\Abidjan_doc_1.pdf
Données normalisées sauvegardées : normalized_data\Abidjan_doc_1.json
PDF téléchargé : pdf_data\Abidjan_doc_2.pdf
Données normalisées sauvegardées : normalized_data\Abidjan_doc_2.json
PDF téléchargé : pdf_data\Abidjan_doc_3.pdf
Données normalisées sauvegardées : normalized_data\Abidjan_doc_3.json
Recherche de PDF pour : Abidjan document cadastral PDF
PDF téléchargé : pdf_data\Abidjan_doc_1.pdf
PDF téléchargé : pdf_data\Abidjan_doc_2.pdf
Données normalisées sauvegardées : normalized_data\Abid

 validation et le nettoyage des données normalisées

In [7]:
import os
import json

# Chemin vers le répertoire des données normalisées
NORMALIZED_DIR = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\normalized_data"
LOG_FILE = os.path.join(NORMALIZED_DIR, "invalid_pdfs.log")

# Fonction pour valider les données normalisées
def validate_normalized_data(json_path, keywords):
    """
    Valide si le contenu d'un document normalisé est pertinent.
    
    :param json_path: Chemin vers le fichier JSON normalisé.
    :param keywords: Liste de mots-clés pour vérifier la pertinence.
    :return: True si le document est valide, sinon False.
    """
    try:
        with open(json_path, "r", encoding="utf-8") as f:
            data = json.load(f)
        
        content = data.get("content", "").strip()
        
        # Vérifier si le contenu est vide
        if not content:
            print(f"Document vide détecté : {json_path}")
            return False
        
        # Vérifier la pertinence avec les mots-clés
        for keyword in keywords:
            if keyword.lower() in content.lower():
                return True
        
        print(f"Document non pertinent : {json_path}")
        return False
    
    except Exception as e:
        print(f"Erreur lors de la validation du fichier {json_path} : {e}")
        return False

# Fonction pour nettoyer les données normalisées
def clean_normalized_data(normalized_dir, keywords):
    """
    Parcourt les fichiers normalisés et supprime les documents invalides.
    
    :param normalized_dir: Répertoire contenant les fichiers JSON normalisés.
    :param keywords: Liste de mots-clés pour la validation.
    """
    for json_file in os.listdir(normalized_dir):
        json_path = os.path.join(normalized_dir, json_file)
        if not validate_normalized_data(json_path, keywords):
            os.remove(json_path)
            print(f"Fichier supprimé : {json_path}")

# Fonction pour enregistrer les fichiers PDF invalides
def log_invalid_pdfs(normalized_dir, log_file):
    """
    Enregistre les chemins des fichiers PDF invalides dans un fichier de log.
    
    :param normalized_dir: Répertoire contenant les fichiers JSON normalisés.
    :param log_file: Chemin vers le fichier de log.
    """
    invalid_files = []
    
    for json_file in os.listdir(normalized_dir):
        json_path = os.path.join(normalized_dir, json_file)
        try:
            with open(json_path, "r", encoding="utf-8") as f:
                data = json.load(f)
                content = data.get("content", "").strip()
                if not content:
                    invalid_files.append(data.get("file_name"))
        except Exception as e:
            print(f"Erreur lors de la lecture du fichier {json_path} : {e}")
    
    # Sauvegarder les fichiers invalides dans un log
    with open(log_file, "w", encoding="utf-8") as f:
        for invalid_file in invalid_files:
            f.write(invalid_file + "\n")
    
    print(f"Liste des fichiers invalides enregistrée dans {log_file}")

# Liste des mots-clés pour valider la pertinence
keywords = ["géologie", "infrastructure", "cadastral", "circulation", "réseaux"]

# Lancer le nettoyage et la validation
print("Validation et nettoyage des fichiers normalisés...")
clean_normalized_data(NORMALIZED_DIR, keywords)

# Enregistrer les fichiers invalides
print("Enregistrement des fichiers PDF invalides...")
log_invalid_pdfs(NORMALIZED_DIR, LOG_FILE)

print("Processus terminé.")


Validation et nettoyage des fichiers normalisés...
Document non pertinent : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\normalized_data\New_doc_1.json
Fichier supprimé : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\normalized_data\New_doc_1.json
Enregistrement des fichiers PDF invalides...
Liste des fichiers invalides enregistrée dans C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\normalized_data\invalid_pdfs.log
Processus terminé.


####  Fractionnement des JSON

In [8]:
import os
import json

# Répertoires
NORMALIZED_DIR = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\normalized_data"
FRACTIONED_DIR = os.path.join(NORMALIZED_DIR, "fractioned_data")
os.makedirs(FRACTIONED_DIR, exist_ok=True)

# Fonction pour fractionner le contenu textuel
def split_content_into_segments(content, max_length=500):
    """
    Fractionne le contenu textuel en segments de taille limitée.
    
    :param content: Texte complet à fractionner.
    :param max_length: Nombre maximal de caractères par segment.
    :return: Liste de segments.
    """
    segments = []
    words = content.split()
    segment = []

    for word in words:
        if len(" ".join(segment + [word])) <= max_length:
            segment.append(word)
        else:
            segments.append(" ".join(segment))
            segment = [word]

    if segment:
        segments.append(" ".join(segment))
    
    return segments

# Fonction pour fractionner un fichier JSON
def fractionate_json(json_path, output_dir, max_length=500):
    """
    Fractionne le contenu d'un JSON en segments et les sauvegarde individuellement.
    
    :param json_path: Chemin vers le fichier JSON normalisé.
    :param output_dir: Répertoire pour sauvegarder les segments fractionnés.
    :param max_length: Longueur maximale d'un segment.
    """
    try:
        with open(json_path, "r", encoding="utf-8") as f:
            data = json.load(f)

        content = data.get("content", "").strip()
        if not content:
            print(f"Contenu vide dans : {json_path}")
            return

        # Fractionner le contenu
        segments = split_content_into_segments(content, max_length)

        for i, segment in enumerate(segments):
            segment_data = {
                "city": data.get("city"),
                "file_name": data.get("file_name"),
                "segment_id": i + 1,
                "segment_content": segment,
                "document_type": data.get("document_type", "unknown"),
            }

            # Sauvegarder chaque segment dans un fichier JSON séparé
            segment_file = os.path.join(
                output_dir, f"{os.path.basename(json_path).replace('.json', '')}_segment_{i + 1}.json"
            )
            with open(segment_file, "w", encoding="utf-8") as segment_f:
                json.dump(segment_data, segment_f, ensure_ascii=False, indent=4)

        print(f"Fractionnement terminé pour : {json_path}")

    except Exception as e:
        print(f"Erreur lors du fractionnement de {json_path} : {e}")

# Fonction pour parcourir tous les fichiers JSON et les fractionner
def process_all_json_files(normalized_dir, fractioned_dir, max_length=500):
    """
    Parcourt tous les fichiers JSON normalisés et les fractionne.
    
    :param normalized_dir: Répertoire contenant les fichiers JSON normalisés.
    :param fractioned_dir: Répertoire pour sauvegarder les segments fractionnés.
    :param max_length: Longueur maximale d'un segment.
    """
    for json_file in os.listdir(normalized_dir):
        json_path = os.path.join(normalized_dir, json_file)
        if json_file.endswith(".json"):
            fractionate_json(json_path, fractioned_dir, max_length)

# Exécution du fractionnement
print("Fractionnement des fichiers JSON...")
process_all_json_files(NORMALIZED_DIR, FRACTIONED_DIR)
print("Processus terminé.")


Fractionnement des fichiers JSON...
Fractionnement terminé pour : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\normalized_data\Abidjan_doc_1.json
Fractionnement terminé pour : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\normalized_data\Abidjan_doc_2.json
Fractionnement terminé pour : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\normalized_data\Abidjan_doc_3.json
Fractionnement terminé pour : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\normalized_data\Bamako_doc_1.json
Fractionnement terminé pour : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\normalized_data\Bamako_doc_2.json
Fractionnement terminé pour : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\normalized_data\Bamako_doc_3.json
Fractionnement terminé pour : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Coll

### Collecte et Traitement des images satellitaires acquises sur SentilHub

In [None]:
# Importation des library pour la collecte et traitement des données 
%pip install requests shapely
%pip install wheel
%pip install pipwin
%pipwin install GDAL==3.6.0
%pip install shapely==2.0.1 --no-build-isolation
%pipwin install rasterio==1.3.0


Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.
Note: you may need to restart the kernel to use updated packages.


Traceback (most recent call last):
  File "<frozen runpy>", line 198, in _run_module_as_main
  File "<frozen runpy>", line 88, in _run_code
  File "c:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\LLM\Scripts\pipwin.exe\__main__.py", line 4, in <module>
  File "c:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\LLM\Lib\site-packages\pipwin\command.py", line 28, in <module>
    from . import pipwin, __version__
  File "c:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\LLM\Lib\site-packages\pipwin\pipwin.py", line 13, in <module>
    import js2py
  File "c:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\LLM\Lib\site-packages\js2py\__init__.py", line 72, in <module>
    from .base import PyJsException
  File "c:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\LLM\Lib\site-packages\js2py\base.py", line 2965, in <module>
    @Js
     ^^
  File "c:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\LLM\Lib\site-packages

Collecting shapely==2.0.1Note: you may need to restart the kernel to use updated packages.

  Using cached shapely-2.0.1.tar.gz (275 kB)
  Preparing metadata (pyproject.toml): started
  Preparing metadata (pyproject.toml): finished with status 'error'


  error: subprocess-exited-with-error
  
  × Preparing metadata (pyproject.toml) did not run successfully.
  │ exit code: 1
  ╰─> [3 lines of output]
      Could not find geos-config executable. Either append the path to geos-config to PATH or manually provide the include_dirs, library_dirs, libraries and other link args for compiling against a GEOS version >=3.5.
      ERROR: Cython is required to build shapely from source.
      [end of output]
  
  note: This error originates from a subprocess, and is likely not a problem with pip.
error: metadata-generation-failed

× Encountered error while generating package metadata.
╰─> See above for output.

note: This is an issue with the package mentioned above, not pip.
hint: See above for details.
Traceback (most recent call last):
  File "<frozen runpy>", line 198, in _run_module_as_main
  File "<frozen runpy>", line 88, in _run_code
  File "c:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\LLM\Scripts\pipwin.exe\__main__.py",

 #### Collecte de donnée géospatiale ( image sentinel ) sur la plateforme SentinelHub 

In [10]:
import requests
import json
from datetime import datetime, timedelta
from shapely.geometry import mapping, box
import os

# Informations pour l'accès à l'API Sentinel Hub
CLIENT_ID = 'c576337e-156f-4bfb-bec1-da8c343c7a00'
CLIENT_SECRET = 'hJ1yQ9PI07MJw4R9fVpooFvpwkL59U6x'

def get_sentinel_token():
    """
    Obtient un jeton d'authentification pour l'API Sentinel Hub.
    """
    url = "https://services.sentinel-hub.com/oauth/token"
    headers = {'Content-Type': 'application/x-www-form-urlencoded'}
    data = {
        'grant_type': 'client_credentials',
        'client_id': CLIENT_ID,
        'client_secret': CLIENT_SECRET
    }
    response = requests.post(url, headers=headers, data=data)
    response.raise_for_status()  # Gérer les erreurs d'authentification
    return response.json().get("access_token")

def fetch_satellite_image(city_name, latitude, longitude, date='2023-10-01', resolution=10, bbox_size=0.05):
    """
    Télécharge une image satellite pour une position géographique donnée
    et crée un fichier JSON contenant les métadonnées de l'image.
    """
    # Création de la bbox autour du point central (ville)
    bbox = box(
        longitude - bbox_size, latitude - bbox_size,
        longitude + bbox_size, latitude + bbox_size
    )

    # Ajouter l'evalscript pour l'imagerie RGB
    evalscript = """
    // Evalscript pour une image RGB
    // Sélectionne les canaux R, G, B pour l'affichage des couleurs naturelles
    function setup() {
        return {
            input: ["B04", "B03", "B02"],
            output: { bands: 3 }
        };
    }
    function evaluatePixel(sample) {
        return [sample.B04, sample.B03, sample.B02];
    }
    """

    # Préparer la demande à l'API Sentinel Hub
    url = "https://services.sentinel-hub.com/api/v1/process"
    token = get_sentinel_token()
    headers = {
        "Authorization": f"Bearer {token}",
        "Content-Type": "application/json"
    }
    payload = {
        "input": {
            "bounds": {"geometry": mapping(bbox)},
            "data": [
                {
                    "type": "S2L2A",
                    "dataFilter": {
                        "timeRange": {
                            "from": f"{date}T00:00:00Z",
                            "to": f"{date}T23:59:59Z"
                        }
                    }
                }
            ]
        },
        "output": {
            "width": int(1000 / resolution),
            "height": int(1000 / resolution),
            "responses": [
                {"identifier": "default", "format": {"type": "image/jpeg"}}
            ]
        },
        "evalscript": evalscript  # Ajouter l'evalscript ici
    }

    # Envoyer la demande et gérer les erreurs éventuelles
    response = requests.post(url, headers=headers, json=payload)
    if response.status_code == 200:
        # Créer le répertoire pour la ville
        directory = f"images/{city_name}"
        os.makedirs(directory, exist_ok=True)

        # Sauvegarder l'image
        image_filename = f"{directory}/{city_name}_{date}.jpg"
        with open(image_filename, "wb") as file:
            file.write(response.content)
        print(f"Image satellite téléchargée pour {city_name} : {image_filename}")

        # Créer et sauvegarder les métadonnées dans un fichier JSON
        metadata = {
            "city": city_name,
            "date": date,
            "latitude": latitude,
            "longitude": longitude,
            "resolution": resolution,
            "bbox": {
                "min_lat": latitude - bbox_size,
                "min_lon": longitude - bbox_size,
                "max_lat": latitude + bbox_size,
                "max_lon": longitude + bbox_size
            },
            "image_path": image_filename
        }
        metadata_filename = f"{directory}/{city_name}_{date}.json"
        with open(metadata_filename, "w", encoding="utf-8") as metadata_file:
            json.dump(metadata, metadata_file, ensure_ascii=False, indent=4)
        print(f"Métadonnées sauvegardées pour {city_name} : {metadata_filename}")

    else:
        print(f"Erreur pour {city_name} à la date {date}: {response.text}")

def collect_images_for_cities(cities, dates):
    """
    Télécharge des images satellite pour une liste de villes et de dates données.
    """
    for city in cities:
        for date in dates:
            fetch_satellite_image(city["name"], city["latitude"], city["longitude"], date=date)

# Liste des villes demandées
cities = [
    {"name": "Abidjan", "latitude": 5.347, "longitude": -4.0244},
    {"name": "Cotonou", "latitude": 6.3703, "longitude": 2.3912},
    {"name": "Bamako", "latitude": 12.6392, "longitude": -8.0029},
    {"name": "Libreville", "latitude": 0.4162, "longitude": 9.4673},
    {"name": "Paris", "latitude": 48.8566, "longitude": 2.3522},
    {"name": "New York", "latitude": 40.7128, "longitude": -74.0060},
    {"name": "Tokyo", "latitude": 35.6895, "longitude": 139.6917}
]

# Liste de dates pour la collecte d'images
start_date = datetime(2023, 10, 1)
end_date = datetime(2023, 10, 10)
dates = [(start_date + timedelta(days=i)).strftime("%Y-%m-%d") for i in range((end_date - start_date).days + 1)]

# Collecte des images
collect_images_for_cities(cities, dates)


Image satellite téléchargée pour Abidjan : images/Abidjan/Abidjan_2023-10-01.jpg
Métadonnées sauvegardées pour Abidjan : images/Abidjan/Abidjan_2023-10-01.json
Image satellite téléchargée pour Abidjan : images/Abidjan/Abidjan_2023-10-02.jpg
Métadonnées sauvegardées pour Abidjan : images/Abidjan/Abidjan_2023-10-02.json
Image satellite téléchargée pour Abidjan : images/Abidjan/Abidjan_2023-10-03.jpg
Métadonnées sauvegardées pour Abidjan : images/Abidjan/Abidjan_2023-10-03.json
Image satellite téléchargée pour Abidjan : images/Abidjan/Abidjan_2023-10-04.jpg
Métadonnées sauvegardées pour Abidjan : images/Abidjan/Abidjan_2023-10-04.json
Image satellite téléchargée pour Abidjan : images/Abidjan/Abidjan_2023-10-05.jpg
Métadonnées sauvegardées pour Abidjan : images/Abidjan/Abidjan_2023-10-05.json
Image satellite téléchargée pour Abidjan : images/Abidjan/Abidjan_2023-10-06.jpg
Métadonnées sauvegardées pour Abidjan : images/Abidjan/Abidjan_2023-10-06.json
Image satellite téléchargée pour Abidjan

### Collecte de la donnée  sur OPenstreetMap (OSM) pour plusieurs villes à partir d'un API open acces 

In [19]:
import requests
import json
import os
from geojson import FeatureCollection, Feature, Point, LineString
from shapely.geometry import Point as ShapelyPoint

def overpass_to_geojson(overpass_data):
    """
    Convertit les données Overpass API en GeoJSON valide avec une colonne 'geom'.
    """
    features = []
    
    # Créer un dictionnaire pour accéder rapidement aux nodes par ID
    nodes = {element["id"]: element for element in overpass_data.get("elements", []) if element["type"] == "node"}

    for element in overpass_data.get("elements", []):
        if element["type"] == "node":
            # Ajouter des points avec une colonne 'geom' contenant la géométrie
            geom = ShapelyPoint(element["lon"], element["lat"])
            feature = Feature(
                geometry=Point((element["lon"], element["lat"])),
                properties={**element.get("tags", {}), "geom": geom.wkt}  # Ajout du WKT dans les propriétés
            )
            features.append(feature)
        elif element["type"] == "way":
            # Construire des lignes en utilisant les nœuds associés
            coordinates = [(nodes[node_id]["lon"], nodes[node_id]["lat"]) for node_id in element.get("nodes", []) if node_id in nodes]
            feature = Feature(
                geometry=LineString(coordinates),
                properties=element.get("tags", {})
            )
            features.append(feature)

    return FeatureCollection(features)


def download_osm_data(bbox, output_path, query_type, metadata_output, city_name):
    """
    Télécharge les données OpenStreetMap pour une zone géographique donnée (bbox) via Overpass API
    et génère un fichier GeoJSON valide avec métadonnées et une colonne 'geom'.
    """
    overpass_url = "http://overpass-api.de/api/interpreter"

    overpass_query = f"""
    [out:json];
    (
      node["{query_type}"]({bbox[0]},{bbox[1]},{bbox[2]},{bbox[3]});
      way["{query_type}"]({bbox[0]},{bbox[1]},{bbox[2]},{bbox[3]});
      relation["{query_type}"]({bbox[0]},{bbox[1]},{bbox[2]},{bbox[3]});
    );
    out body;
    >;
    out skel qt;
    """

    try:
        print(f"Envoi de la requête à Overpass API pour le type '{query_type}' et la zone {bbox}")
        response = requests.get(overpass_url, params={"data": overpass_query})

        if response.status_code == 200:
            data = response.json()

            # Conversion des données Overpass en GeoJSON
            geojson_data = overpass_to_geojson(data)

            # Sauvegarde des données en GeoJSON
            with open(output_path, "w", encoding="utf-8") as f:
                json.dump(geojson_data, f, ensure_ascii=False, indent=2)
            print(f"Données téléchargées et sauvegardées dans : {output_path}")

            # Création des métadonnées
            metadata = {
                "city": city_name,
                "type": query_type,
                "bbox": {
                    "min_lat": bbox[0],
                    "min_lon": bbox[1],
                    "max_lat": bbox[2],
                    "max_lon": bbox[3]
                },
                "file_path": output_path
            }

            # Sauvegarde des métadonnées
            with open(metadata_output, "w", encoding="utf-8") as meta_file:
                json.dump(metadata, meta_file, ensure_ascii=False, indent=2)
            print(f"Métadonnées sauvegardées dans : {metadata_output}")

        else:
            print(f"Erreur : statut {response.status_code}. Requête échouée pour la zone {bbox}")

    except Exception as e:
        print(f"Une erreur est survenue lors de la requête Overpass : {e}")


# Liste des villes avec leurs coordonnées bbox
cities = [
    {"name": "Abidjan", "bbox": [5.3000, -4.0500, 5.4000, -4.0000]},
    {"name": "Cotonou", "bbox": [6.3400, 2.3600, 6.3800, 2.4000]},
    {"name": "Bamako", "bbox": [12.6000, -8.0500, 12.6500, -7.9500]},
    {"name": "Libreville", "bbox": [0.3700, 9.4000, 0.4600, 9.5000]},
    {"name": "Paris", "bbox": [48.8156, 2.2242, 48.9021, 2.4699]},
    {"name": "New York", "bbox": [40.7000, -74.0200, 40.7800, -73.9300]},
    {"name": "Tokyo", "bbox": [35.6800, 139.7500, 35.7000, 139.7700]},
]

# Types de données OSM à télécharger
query_types = ["highway", "building", "amenity"]

# Dossier de sortie
output_folder = "osm_data"
os.makedirs(output_folder, exist_ok=True)

# Télécharger les données pour chaque ville et chaque type
for city in cities:
    for query_type in query_types:
        output_file = os.path.join(output_folder, f"{city['name']}_{query_type}.geojson")
        metadata_file = os.path.join(output_folder, f"{city['name']}_{query_type}_metadata.json")
        download_osm_data(city["bbox"], output_file, query_type=query_type, metadata_output=metadata_file, city_name=city["name"])


Envoi de la requête à Overpass API pour le type 'highway' et la zone [5.3, -4.05, 5.4, -4.0]
Données téléchargées et sauvegardées dans : osm_data\Abidjan_highway.geojson
Métadonnées sauvegardées dans : osm_data\Abidjan_highway_metadata.json
Envoi de la requête à Overpass API pour le type 'building' et la zone [5.3, -4.05, 5.4, -4.0]
Données téléchargées et sauvegardées dans : osm_data\Abidjan_building.geojson
Métadonnées sauvegardées dans : osm_data\Abidjan_building_metadata.json
Envoi de la requête à Overpass API pour le type 'amenity' et la zone [5.3, -4.05, 5.4, -4.0]
Données téléchargées et sauvegardées dans : osm_data\Abidjan_amenity.geojson
Métadonnées sauvegardées dans : osm_data\Abidjan_amenity_metadata.json
Envoi de la requête à Overpass API pour le type 'highway' et la zone [6.34, 2.36, 6.38, 2.4]
Données téléchargées et sauvegardées dans : osm_data\Cotonou_highway.geojson
Métadonnées sauvegardées dans : osm_data\Cotonou_highway_metadata.json
Envoi de la requête à Overpass AP

In [6]:
import requests
import json
import os
from geojson import FeatureCollection, Feature, Point, LineString, Polygon

def overpass_to_geojson(overpass_data):
    """
    Convertit les données Overpass API en GeoJSON valide.
    """
    features = []
    
    # Créer un dictionnaire pour accéder rapidement aux nodes par ID
    nodes = {element["id"]: element for element in overpass_data.get("elements", []) if element["type"] == "node"}

    for element in overpass_data.get("elements", []):
        if element["type"] == "node":
            # Ajouter des points
            features.append(
                Feature(
                    geometry=Point((element["lon"], element["lat"])),
                    properties=element.get("tags", {})
                )
            )
        elif element["type"] == "way":
            # Construire des lignes en utilisant les nœuds associés
            coordinates = [(nodes[node_id]["lon"], nodes[node_id]["lat"]) for node_id in element.get("nodes", []) if node_id in nodes]
            features.append(
                Feature(
                    geometry=LineString(coordinates),
                    properties=element.get("tags", {})
                )
            )
        elif element["type"] == "relation":
            # Les relations nécessitent une gestion spécifique pour construire des polygones ou autres
            # Ici, on peut les ignorer ou gérer les cas les plus fréquents
            pass

    return FeatureCollection(features)


def download_osm_data(bbox, output_path, query_type, metadata_output, city_name):
    """
    Télécharge les données OpenStreetMap pour une zone géographique donnée (bbox) via Overpass API
    et génère un fichier GeoJSON valide avec métadonnées.
    """
    overpass_url = "http://overpass-api.de/api/interpreter"

    overpass_query = f"""
    [out:json];
    (
      node["{query_type}"]({bbox[0]},{bbox[1]},{bbox[2]},{bbox[3]});
      way["{query_type}"]({bbox[0]},{bbox[1]},{bbox[2]},{bbox[3]});
      relation["{query_type}"]({bbox[0]},{bbox[1]},{bbox[2]},{bbox[3]});
    );
    out body;
    >;
    out skel qt;
    """

    try:
        print(f"Envoi de la requête à Overpass API pour le type '{query_type}' et la zone {bbox}")
        response = requests.get(overpass_url, params={"data": overpass_query})

        if response.status_code == 200:
            data = response.json()

            # Conversion des données Overpass en GeoJSON
            geojson_data = overpass_to_geojson(data)

            # Sauvegarde des données en GeoJSON
            with open(output_path, "w", encoding="utf-8") as f:
                json.dump(geojson_data, f, ensure_ascii=False, indent=2)
            print(f"Données téléchargées et sauvegardées dans : {output_path}")

            # Création des métadonnées
            metadata = {
                "city": city_name,
                "type": query_type,
                "bbox": {
                    "min_lat": bbox[0],
                    "min_lon": bbox[1],
                    "max_lat": bbox[2],
                    "max_lon": bbox[3]
                },
                "file_path": output_path
            }

            # Sauvegarde des métadonnées
            with open(metadata_output, "w", encoding="utf-8") as meta_file:
                json.dump(metadata, meta_file, ensure_ascii=False, indent=2)
            print(f"Métadonnées sauvegardées dans : {metadata_output}")

        else:
            print(f"Erreur : statut {response.status_code}. Requête échouée pour la zone {bbox}")

    except Exception as e:
        print(f"Une erreur est survenue lors de la requête Overpass : {e}")


# Liste des villes avec leurs coordonnées bbox
cities = [
    {"name": "Abidjan", "bbox": [5.3000, -4.0500, 5.4000, -4.0000]},
    {"name": "Cotonou", "bbox": [6.3400, 2.3600, 6.3800, 2.4000]},
    {"name": "Bamako", "bbox": [12.6000, -8.0500, 12.6500, -7.9500]},
    {"name": "Libreville", "bbox": [0.3700, 9.4000, 0.4600, 9.5000]},
    {"name": "Paris", "bbox": [48.8156, 2.2242, 48.9021, 2.4699]},
    {"name": "New York", "bbox": [40.7000, -74.0200, 40.7800, -73.9300]},
    {"name": "Tokyo", "bbox": [35.6800, 139.7500, 35.7000, 139.7700]},
]

# Types de données OSM à télécharger
query_types = ["highway", "building", "amenity"]

# Dossier de sortie
output_folder = "osm_data"
os.makedirs(output_folder, exist_ok=True)

# Télécharger les données pour chaque ville et chaque type
for city in cities:
    for query_type in query_types:
        output_file = os.path.join(output_folder, f"{city['name']}_{query_type}.geojson")
        metadata_file = os.path.join(output_folder, f"{city['name']}_{query_type}_metadata.json")
        download_osm_data(city["bbox"], output_file, query_type=query_type, metadata_output=metadata_file, city_name=city["name"])


Envoi de la requête à Overpass API pour le type 'highway' et la zone [5.3, -4.05, 5.4, -4.0]
Données téléchargées et sauvegardées dans : osm_data\Abidjan_highway.geojson
Métadonnées sauvegardées dans : osm_data\Abidjan_highway_metadata.json
Envoi de la requête à Overpass API pour le type 'building' et la zone [5.3, -4.05, 5.4, -4.0]
Données téléchargées et sauvegardées dans : osm_data\Abidjan_building.geojson
Métadonnées sauvegardées dans : osm_data\Abidjan_building_metadata.json
Envoi de la requête à Overpass API pour le type 'amenity' et la zone [5.3, -4.05, 5.4, -4.0]
Données téléchargées et sauvegardées dans : osm_data\Abidjan_amenity.geojson
Métadonnées sauvegardées dans : osm_data\Abidjan_amenity_metadata.json
Envoi de la requête à Overpass API pour le type 'highway' et la zone [6.34, 2.36, 6.38, 2.4]
Données téléchargées et sauvegardées dans : osm_data\Cotonou_highway.geojson
Métadonnées sauvegardées dans : osm_data\Cotonou_highway_metadata.json
Envoi de la requête à Overpass AP

### Collection de données educatives et documentaires vidéos avec un  API Open Access 

In [18]:
from youtubesearchpython import VideosSearch
import csv
import os
from datetime import datetime
import json

# Répertoire pour sauvegarder les résultats
RESULTS_DIR = "youtube_videos"
os.makedirs(RESULTS_DIR, exist_ok=True)

# Liste des recherches pour chaque ville
search_queries = [
    "Abidjan géomatique extraction de données",
    "Abidjan études de sol géologie",
    "Cotonou rapport cartographique",
    "Bamako études géologiques",
    "Libreville géomatique rapports cartographiques",
    "Paris géomatique études de sol",
    "New York géospatial data analysis",
    "Tokyo geomatics data extraction"
]

# Fonction pour rechercher des vidéos
def search_videos(query, max_results=5):
    """
    Recherche des vidéos sur YouTube via l'API Python.
    """
    videos_search = VideosSearch(query, limit=max_results)
    results = videos_search.result()["result"]
    videos = []
    for video in results:
        videos.append({
            "title": video["title"],
            "url": video["link"],
            "description": video["descriptionSnippet"][0]["text"] if video.get("descriptionSnippet") else "No description",
            "city": query.split()[0],  # Ajouter la ville depuis la requête
            "extraction_date": datetime.now().strftime('%Y-%m-%d')  # Date d'extraction
        })
    return videos

# Enregistrer les résultats dans un fichier CSV
def save_videos_to_csv(videos, city_name):
    """
    Sauvegarde des résultats dans un fichier CSV.
    """
    csv_file = os.path.join(RESULTS_DIR, f"{city_name}_videos.csv")
    with open(csv_file, mode="w", encoding="utf-8", newline="") as file:
        writer = csv.DictWriter(file, fieldnames=["title", "url", "description", "city", "extraction_date"])
        writer.writeheader()
        writer.writerows(videos)
    print(f"Résultats sauvegardés dans : {csv_file}")

# Enregistrer les résultats dans un fichier JSON
def save_videos_to_json(videos, city_name):
    """
    Sauvegarde des résultats dans un fichier JSON.
    """
    json_file = os.path.join(RESULTS_DIR, f"{city_name}_videos.json")
    with open(json_file, mode="w", encoding="utf-8") as file:
        json.dump(videos, file, ensure_ascii=False, indent=2)
    print(f"Résultats sauvegardés dans : {json_file}")

# Recherche et sauvegarde des vidéos
def search_and_save_videos(search_queries, max_results=5):
    """
    Recherche et sauvegarde des vidéos pour chaque requête.
    """
    for query in search_queries:
        city_name = query.split()[0]  # Utiliser le premier mot comme nom de la ville
        print(f"Recherche de vidéos pour : {query}")
        videos = search_videos(query, max_results=max_results)
        if videos:
            save_videos_to_csv(videos, city_name)
            save_videos_to_json(videos, city_name)
        else:
            print(f"Aucune vidéo trouvée pour : {query}")

# Lancer la recherche
search_and_save_videos(search_queries)


Recherche de vidéos pour : Abidjan géomatique extraction de données
Résultats sauvegardés dans : youtube_videos\Abidjan_videos.csv
Résultats sauvegardés dans : youtube_videos\Abidjan_videos.json
Recherche de vidéos pour : Abidjan études de sol géologie
Résultats sauvegardés dans : youtube_videos\Abidjan_videos.csv
Résultats sauvegardés dans : youtube_videos\Abidjan_videos.json
Recherche de vidéos pour : Cotonou rapport cartographique
Résultats sauvegardés dans : youtube_videos\Cotonou_videos.csv
Résultats sauvegardés dans : youtube_videos\Cotonou_videos.json
Recherche de vidéos pour : Bamako études géologiques
Résultats sauvegardés dans : youtube_videos\Bamako_videos.csv
Résultats sauvegardés dans : youtube_videos\Bamako_videos.json
Recherche de vidéos pour : Libreville géomatique rapports cartographiques
Résultats sauvegardés dans : youtube_videos\Libreville_videos.csv
Résultats sauvegardés dans : youtube_videos\Libreville_videos.json
Recherche de vidéos pour : Paris géomatique études

Charger et Fusionner les CSV et JSON

In [36]:
import os
import pandas as pd
import json

# Répertoire contenant les fichiers CSV et JSON
DATA_DIR = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\youtube_videos"

# Liste des fichiers CSV et JSON
csv_files = [f for f in os.listdir(DATA_DIR) if f.endswith(".csv")]
json_files = [f for f in os.listdir(DATA_DIR) if f.endswith(".json")]

# Fusionner les CSV avec les métadonnées JSON
all_data = []

for csv_file in csv_files:
    # Charger le CSV
    csv_path = os.path.join(DATA_DIR, csv_file)
    videos_df = pd.read_csv(csv_path)

    # Associer les JSON correspondants
    for _, row in videos_df.iterrows():
        city = row.get("city", "")
        json_path = os.path.join(DATA_DIR, f"{city}.json")
        metadata = {}

        if os.path.exists(json_path):
            with open(json_path, "r", encoding="utf-8") as f:
                metadata = json.load(f)
        
        # Fusionner les données
        all_data.append({
            "title": row.get("title", ""),
            "description": row.get("description", ""),
            "url": row.get("url", ""),
            "city": row.get("city", ""),
            "type": "video",
            "metadata": metadata
        })

# Convertir en DataFrame pour un traitement facile
merged_df = pd.DataFrame(all_data)

# Aperçu des données fusionnées
print(merged_df.head())

# Sauvegarder le DataFrame fusionné dans un fichier CSV local
output_file = os.path.join(DATA_DIR, "merged_videos_data.csv")
merged_df.to_csv(output_file, index=False, encoding='utf-8')
print(f"Fichier fusionné sauvegardé dans : {output_file}")



                                               title  \
0  Les études géotechniques nécessaires avant tou...   
1  Ecole Internationale des Ponts et Chaussées d'...   
2  LA TERRE C'EST POUR LES PAUVRES, ARCHITECTURE ...   
3  Institut Universitaire d'Abidjan,L'université ...   
4  ABIDJAN : Les travaux de construction de 3 nou...   

                                         description  \
0  ... de sol on veut ériger cette fondation d'où...   
1   L'École Internationale des Ponts et Chaussées d'   
2  j'espère que vous avez aimé la vidéo !!! Nous ...   
3                                     No description   
4  Si vous êtes intéressé par un partenariat avec...   

                                           url     city   type metadata  
0  https://www.youtube.com/watch?v=KJxl3UOv-h4  Abidjan  video       {}  
1  https://www.youtube.com/watch?v=bQnHde84SqY  Abidjan  video       {}  
2  https://www.youtube.com/watch?v=6VHgMPIb2-c  Abidjan  video       {}  
3  https://www.youtube.com/wat

## Stockage ( storage) des données acquises Données  (textes normalisés , IMG , Données géospatiales OSM ,Vidéos éducatives et documentaires )

#### Base centrale pour les métadonnées :
  * une base commune  Elasticsearch pour stocker les métadonnées de tous les types de données.
	Cette base  va liée les différentes sources de données (académiques, géospatiales, vidéos).


In [1]:
%pip install elasticsearch

Note: you may need to restart the kernel to use updated packages.


In [43]:
from elasticsearch import Elasticsearch
from requests.exceptions import SSLError
import os
import json
import logging
import shutil

# Configurer les logs
logging.basicConfig(level=logging.INFO, format="%(asctime)s - %(levelname)s - %(message)s")

# Paramètres Elasticsearch
ES_HOST = "https://localhost:9200"
ES_USERNAME = "elastic"
ES_PASSWORD = "4fHbHMK5UaiGY3tzqeTJ"  # Remplacez par vos identifiants
INDEX_NAME = "geosearch_metadata"

# Répertoires des métadonnées
DIRECTORIES = {
    "meta_doc_PDF": r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\meta_doc_PDF",
    "Json_OSM": r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\Json_OSM",
    "Json_IMG": r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\Json_IMG",
    "Json_videos": r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\Json_videos",
}

# Répertoire de sauvegarde local
BACKUP_DIR = r"C:\Users\ec\OneDrive\Bureau\Geosearch_Backup"

# Vérifiez et créez le répertoire de sauvegarde s'il n'existe pas
if not os.path.exists(BACKUP_DIR):
    os.makedirs(BACKUP_DIR)

# Connexion sécurisée à Elasticsearch
try:
    es = Elasticsearch(
        [ES_HOST],
        basic_auth=(ES_USERNAME, ES_PASSWORD),
        verify_certs=False,  # À éviter en production, ajoutez un certificat si possible
    )
    if es.ping():
        logging.info("Connexion à Elasticsearch réussie.")
    else:
        logging.error("Échec de la connexion à Elasticsearch. Vérifiez les paramètres.")
        exit()
except SSLError as ssl_error:
    logging.error(f"Erreur SSL : {ssl_error}")
    exit()
except Exception as e:
    logging.error(f"Erreur de connexion à Elasticsearch : {e}")
    exit()

# Création de l'index avec mapping
try:
    if not es.indices.exists(index=INDEX_NAME):
        es.indices.create(index=INDEX_NAME, body={
            "mappings": {
                "properties": {
                    "category": {"type": "keyword"},
                    "file_path": {"type": "text"},
                    "metadata": {"type": "object"},
                    "location": {"type": "geo_point"}  # Optionnel pour les données géospatiales
                }
            }
        })
        logging.info(f"Index '{INDEX_NAME}' créé avec succès.")
    else:
        logging.info(f"L'index '{INDEX_NAME}' existe déjà.")
except Exception as e:
    logging.error(f"Erreur lors de la création de l'index '{INDEX_NAME}': {e}")
    exit()

# Fonction pour charger, indexer les fichiers JSON, et sauvegarder localement
def load_metadata(directory, category):
    if not os.path.exists(directory):
        logging.warning(f"Le répertoire {directory} n'existe pas. Ignoré.")
        return
    for file in os.listdir(directory):
        if file.endswith('.json'):
            file_path = os.path.join(directory, file)
            try:
                with open(file_path, 'r', encoding='utf-8') as f:
                    data = json.load(f)
                    # Préparation des données pour Elasticsearch
                    doc = {
                        "category": category,
                        "file_path": file_path,
                        "metadata": data
                    }
                    # Ajout de champs géospatiaux si disponibles
                    if "latitude" in data and "longitude" in data:
                        doc["location"] = {"lat": data["latitude"], "lon": data["longitude"]}

                    # Indexation dans Elasticsearch
                    es.index(index=INDEX_NAME, body=doc)
                    logging.info(f"Fichier indexé : {file}")

                    # Sauvegarder une copie locale dans le répertoire BACKUP_DIR
                    category_backup_dir = os.path.join(BACKUP_DIR, category)
                    if not os.path.exists(category_backup_dir):
                        os.makedirs(category_backup_dir)
                    shutil.copy(file_path, category_backup_dir)
                    logging.info(f"Fichier sauvegardé localement : {file_path}")
            except json.JSONDecodeError:
                logging.error(f"Erreur JSON dans le fichier : {file}")
            except Exception as e:
                logging.error(f"Erreur lors du traitement du fichier {file}: {e}")

# Indexer les fichiers dans chaque répertoire
for category, directory in DIRECTORIES.items():
    logging.info(f"Indexation des fichiers dans le répertoire : {directory}")
    load_metadata(directory, category)

logging.info("Indexation des métadonnées terminée.")


2024-12-03 02:41:21,597 - INFO - HEAD https://localhost:9200/ [status:200 duration:0.384s]
2024-12-03 02:41:21,599 - INFO - Connexion à Elasticsearch réussie.
2024-12-03 02:41:21,636 - INFO - HEAD https://localhost:9200/geosearch_metadata [status:200 duration:0.036s]
2024-12-03 02:41:21,636 - INFO - L'index 'geosearch_metadata' existe déjà.
2024-12-03 02:41:21,641 - INFO - Indexation des fichiers dans le répertoire : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\meta_doc_PDF
2024-12-03 02:41:21,643 - INFO - Indexation des fichiers dans le répertoire : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\Json_OSM
2024-12-03 02:41:21,645 - INFO - Indexation des fichiers dans le répertoire : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\Json_IMG
2024-12-03 02:41:21,647 - INFO - Indexation des fichiers dans le répertoire : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _D

In [35]:
# Vérifiez si l'index existe
if es.indices.exists(index=INDEX_NAME):
    print(f"L'index '{INDEX_NAME}' existe.")
else:
    print(f"L'index '{INDEX_NAME}' n'existe pas.")


2024-11-29 00:39:54,280 - INFO - HEAD https://localhost:9200/geosearch_metadata [status:200 duration:0.004s]


L'index 'geosearch_metadata' existe.


In [36]:
response = es.search(index=INDEX_NAME, body={"query": {"match_all": {}}})
print("Documents indexés :")
for hit in response["hits"]["hits"]:
    print(hit["_source"])  # Affiche les données indexées


2024-11-29 00:40:09,538 - INFO - POST https://localhost:9200/geosearch_metadata/_search [status:200 duration:9.904s]


Documents indexés :
{'category': 'meta_doc_PDF', 'file_path': 'C:\\Users\\ec\\OneDrive\\Bureau\\Generative_IA\\Projet_Generative_IA\\Collecte _Donnée\\meta_doc_PDF\\Abidjan_doc_1_metadata.json', 'metadata': {'title': '', 'author': 'HP', 'creation_date': "D:20220905171359+00'00'", 'modification_date': "D:20220905171359+00'00'", 'subject': '', 'keywords': ''}}
{'category': 'meta_doc_PDF', 'file_path': 'C:\\Users\\ec\\OneDrive\\Bureau\\Generative_IA\\Projet_Generative_IA\\Collecte _Donnée\\meta_doc_PDF\\Abidjan_doc_2_metadata.json', 'metadata': {'title': 'World Bank Document', 'author': 'World Bank Group', 'creation_date': "D:20190318032621-04'00'", 'modification_date': 'D:20190318072648', 'subject': '', 'keywords': ''}}
{'category': 'meta_doc_PDF', 'file_path': 'C:\\Users\\ec\\OneDrive\\Bureau\\Generative_IA\\Projet_Generative_IA\\Collecte _Donnée\\meta_doc_PDF\\Abidjan_doc_3_metadata.json', 'metadata': {'title': '', 'author': '清水研', 'creation_date': "D:20190312105944+09'00'", 'modificat

 Construction des vecteurs à partir des données textuelles (PDF fractionnés )

Configuration de Hugging Face avec le Token mise à notre disposition 

In [9]:
from huggingface_hub import login

# Connectez-vous à Hugging Face avec votre token
login(token="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")
print("Connexion à Hugging Face réussie.")


Connexion à Hugging Face réussie.


Les segments PDF  doivent être transformés en vecteurs en utilisant un modèle pré-entraîné ( sentence-transformers)

In [45]:
from sentence_transformers import SentenceTransformer
import os
import json
import numpy as np

# Charger le modèle Sentence-BERT
model = SentenceTransformer('sentence-transformers/all-MiniLM-L6-v2')

# Répertoire contenant les fichiers PDF fractionnés
FRACTIONED_DIR = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Avant\Frac_pdf"

# Répertoire pour sauvegarder les vecteurs et métadonnées
OUTPUT_DIR = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files"
os.makedirs(OUTPUT_DIR, exist_ok=True)

# Listes pour stocker les vecteurs et métadonnées
vectors = []
metadata = []

# Parcourir les fichiers PDF fractionnés et encoder les segments
for pdf_file in os.listdir(FRACTIONED_DIR):
    if pdf_file.endswith('.txt'):  # Les segments fractionnés devraient être en .txt (text)
        file_path = os.path.join(FRACTIONED_DIR, pdf_file)
        
        # Lire le contenu textuel du segment
        with open(file_path, 'r', encoding='utf-8') as f:
            segment_content = f.read().strip()
            if segment_content:
                # Encoder le texte en vecteur
                vector = model.encode(segment_content)
                vectors.append(vector)

                # Ajouter les métadonnées
                pdf_metadata = {
                    "file_name": pdf_file,
                    "segment_content": segment_content,
                    "vector": vector.tolist()  # Inclure le vecteur encodé
                }
                metadata.append(pdf_metadata)

                # Sauvegarder chaque fichier encodé dans un fichier JSON séparé
                output_file = os.path.join(OUTPUT_DIR, f"{os.path.splitext(pdf_file)[0]}_encoded.json")
                with open(output_file, "w", encoding="utf-8") as out_f:
                    json.dump(pdf_metadata, out_f, ensure_ascii=False, indent=4)

# Convertir les vecteurs en matrice NumPy
vectors_np = np.array(vectors, dtype='float32')

# Afficher le nombre de vecteurs encodés
print(f"Nombre de vecteurs encodés : {len(vectors_np)}")

# Sauvegarder les vecteurs dans un fichier NumPy
vectors_file = os.path.join(OUTPUT_DIR, "vectors.npy")
np.save(vectors_file, vectors_np)

# Sauvegarder les métadonnées dans un fichier JSON
metadata_file = os.path.join(OUTPUT_DIR, "metadata.json")
with open(metadata_file, "w", encoding="utf-8") as f:
    json.dump(metadata, f, ensure_ascii=False, indent=4)

print(f"Vecteurs sauvegardés dans : {vectors_file}")
print(f"Métadonnées sauvegardées dans : {metadata_file}")


2024-12-03 02:43:29,935 - INFO - Use pytorch device_name: cpu
2024-12-03 02:43:29,935 - INFO - Load pretrained SentenceTransformer: sentence-transformers/all-MiniLM-L6-v2


Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Batches:   0%|          | 0/1 [00:00<?, ?it/s]

Nombre de vecteurs encodés : 19
Vecteurs sauvegardés dans : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files\vectors.npy
Métadonnées sauvegardées dans : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files\metadata.json


#### Stockage des vecteurs dans FAISS (Utiliser FAISS pour stocker et rechercher des vecteurs similaires)

In [49]:
import hashlib

def calculate_hash(file_path):
    sha256 = hashlib.sha256()
    with open(file_path, "rb") as f:
        while chunk := f.read(8192):
            sha256.update(chunk)
    return sha256.hexdigest()

FAISS_INDEX_PATH = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files\faiss_index.bin"
current_hash = calculate_hash(FAISS_INDEX_PATH)
print(f"Hachage recalculé : {current_hash}")


Hachage recalculé : 61d2256ac9c8fd8d28d384af47e9c087193beca94f3e3a420b92dde593ca27d2


In [48]:
import faiss
import numpy as np
import os

# Chemin vers les vecteurs et le fichier de sortie
VECTORS_FILE = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files\vectors.npy"
FAISS_INDEX_PATH = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files\faiss_index.bin"

# Charger les vecteurs
vectors_np = np.load(VECTORS_FILE)

# Initialiser l'index FAISS
dimension = vectors_np.shape[1]
index = faiss.IndexFlatL2(dimension)
index.add(vectors_np)

# Sauvegarder l'index
faiss.write_index(index, FAISS_INDEX_PATH)
print(f"Nouvel index FAISS sauvegardé dans : {FAISS_INDEX_PATH}")


Nouvel index FAISS sauvegardé dans : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files\faiss_index.bin


In [50]:
import faiss
import os
import numpy as np
import json

# Chemin du fichier de vecteurs et répertoire de sortie
VECTORS_FILE = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files\vectors.npy"
OUTPUT_DIR = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files"

# Vérifiez que le fichier de vecteurs existe
if not os.path.exists(VECTORS_FILE):
    raise FileNotFoundError(f"Le fichier vecteurs {VECTORS_FILE} est introuvable.")
vectors_np = np.load(VECTORS_FILE)
print(f"Vecteurs chargés : {vectors_np.shape}")

# Vérifiez et créez le répertoire de sortie si nécessaire
if not os.path.exists(OUTPUT_DIR):
    os.makedirs(OUTPUT_DIR)
    print(f"Répertoire créé : {OUTPUT_DIR}")

# Initialiser un index FAISS basé sur la distance euclidienne (L2)
dimension = vectors_np.shape[1]  # Taille des vecteurs (par exemple, 384 pour MiniLM)
index = faiss.IndexFlatL2(dimension)

# Ajouter les vecteurs à l'index FAISS
index.add(vectors_np)
print(f"{index.ntotal} vecteurs ajoutés à l'index FAISS.")

# Sauvegarder l'index FAISS dans le répertoire de sortie
faiss_index_file = os.path.join(OUTPUT_DIR, "faiss_index.bin")
try:
    faiss.write_index(index, faiss_index_file)
    print(f"Index FAISS sauvegardé dans : {faiss_index_file}")
except Exception as e:
    print(f"Erreur lors de la sauvegarde de l'index FAISS : {e}")

# Sauvegarder les métadonnées (optionnel)
metadata_file = os.path.join(OUTPUT_DIR, "metadata.json")
if os.path.exists(metadata_file):
    with open(metadata_file, "r", encoding="utf-8") as f:
        metadata = json.load(f)
    metadata_faiss_file = os.path.join(OUTPUT_DIR, "metadata_faiss.json")
    with open(metadata_faiss_file, "w", encoding="utf-8") as f:
        json.dump(metadata, f, ensure_ascii=False, indent=4)
    print(f"Métadonnées sauvegardées dans : {metadata_faiss_file}")
else:
    print("Aucune métadonnée trouvée pour être sauvegardée avec FAISS.")


Vecteurs chargés : (19, 384)
19 vecteurs ajoutés à l'index FAISS.
Index FAISS sauvegardé dans : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files\faiss_index.bin
Métadonnées sauvegardées dans : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files\metadata_faiss.json


 Chargement et Connexion aux Bases de Données ( FAISS , Elasticsearch)

In [68]:
import os

FAISS_DIR = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Encoded_Files"
vectors_file = os.path.join(FAISS_DIR, "vectors.npy")
faiss_index_file = os.path.join(FAISS_DIR, "faiss_index.bin")
metadata_file = os.path.join(FAISS_DIR, "metadata_faiss.json")

print(f"Fichier vecteurs existe : {os.path.exists(vectors_file)}")
print(f"Fichier index FAISS existe : {os.path.exists(faiss_index_file)}")
print(f"Fichier métadonnées existe : {os.path.exists(metadata_file)}")


Fichier vecteurs existe : True
Fichier index FAISS existe : True
Fichier métadonnées existe : True


In [80]:
from sentence_transformers import SentenceTransformer
from elasticsearch import Elasticsearch
import faiss
import numpy as np
import os
import json

# Répertoires
ELASTICSEARCH_DIR = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte _Donnée\Elastic_search_BD"
FAISS_DIR = r"C:\FAISS"

# Configurer Elasticsearch
ES_HOST = "https://localhost:9200"
ES_USERNAME = "elastic"
ES_PASSWORD = "4fHbHMK5UaiGY3tzqeTJ"  # Remplacez par vos identifiants
INDEX_NAME = "geosearch_metadata"

# Connexion sécurisée à Elasticsearch
es = Elasticsearch(
    [ES_HOST],
    basic_auth=(ES_USERNAME, ES_PASSWORD),
    verify_certs=False
)

# Vérifier la connexion
if es.ping():
    print("Connexion à Elasticsearch réussie.")
else:
    raise ConnectionError("Impossible de se connecter à Elasticsearch.")

# Charger l'index FAISS
vectors_file = os.path.join(FAISS_DIR, "vectors.npy")
faiss_index_file = os.path.join(FAISS_DIR, "faiss_index.bin")
metadata_file = os.path.join(FAISS_DIR, "metadata_faiss.json")

if not (os.path.exists(vectors_file) and os.path.exists(faiss_index_file) and os.path.exists(metadata_file)):
    raise FileNotFoundError("Un ou plusieurs fichiers nécessaires à FAISS sont introuvables.")

vectors = np.load(vectors_file)
index = faiss.read_index(faiss_index_file)

with open(metadata_file, "r", encoding="utf-8") as f:
    metadata = json.load(f)

print("Index FAISS chargé avec succès.")


2024-12-03 11:12:48,204 - INFO - HEAD https://localhost:9200/ [status:200 duration:0.151s]


Connexion à Elasticsearch réussie.
Index FAISS chargé avec succès.


 Recherche et Récupération des Informations :

 * Effectuez une recherche dans Elasticsearch pour récupérer les métadonnées liées à des mots-clés.
 * Effectuez une recherche dans l’espace vectoriel pour trouver les PDF encodés pertinents.

In [84]:
def search_in_elasticsearch(query, index=INDEX_NAME, size=10):
    """
    Recherche dans Elasticsearch en utilisant une requête textuelle.
    """
    body = {
        "query": {
            "multi_match": {
                "query": query,
                "fields": ["metadata.*", "category", "file_path"]
            }
        }
    }
    response = es.search(index=index, body=body, size=size)
    hits = response['hits']['hits']
    return [hit['_source'] for hit in hits]


def search_in_faiss(query, model, top_k=5):
    """
    Recherche vectorielle dans FAISS.
    """
    query_vector = model.encode(query).astype("float32")
    distances, indices = index.search(np.array([query_vector]), top_k)
    results = []
    for dist, idx in zip(distances[0], indices[0]):
        if idx != -1:
            results.append({
                "distance": dist,
                "metadata": metadata[idx]
            })
    return results


Phase Retrieval -generateur- Reponse generée

In [85]:
vectorstore = FAISS(
    embedding_function=hf_embeddings,  # Passer l'objet embeddings, pas la fonction
    index=faiss_index,
    docstore=docstore,
    index_to_docstore_id=index_to_docstore_id
)


In [1]:
from langchain.chains import RetrievalQA
from langchain.vectorstores import FAISS
from langchain.docstore.in_memory import InMemoryDocstore
from langchain.embeddings import HuggingFaceEmbeddings
from langchain.schema import Document
from transformers import pipeline, AutoTokenizer, AutoModelForSeq2SeqLM
from huggingface_hub import login
import faiss
import numpy as np
from elasticsearch import Elasticsearch

# Connexion à Hugging Face
login(token="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")
print("Connexion à Hugging Face réussie.")

# Étape 1 : Configurer Elasticsearch
ES_HOST = "https://localhost:9200"
ES_USERNAME = "elastic"
ES_PASSWORD = "4fHbHMK5UaiGY3tzqeTJ"
INDEX_NAME = "geosearch_metadata"

es_client = Elasticsearch(
    [ES_HOST],
    basic_auth=(ES_USERNAME, ES_PASSWORD),
    verify_certs=False
)

# Charger les embeddings Hugging Face
hf_embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/paraphrase-MiniLM-L6-v2")

# Charger l'index FAISS
FAISS_INDEX_PATH = r"C:\FAISS\faiss_index.bin"
faiss_index = faiss.read_index(FAISS_INDEX_PATH)

# Recréer l'index FAISS pour synchroniser avec les documents
documents = [
    Document(page_content="Texte du document 1", metadata={"source": "doc1.pdf"}),
    Document(page_content="Texte du document 2", metadata={"source": "doc2.pdf"})
]
valid_vectors = [faiss_index.reconstruct(i) for i in range(len(documents))]
new_faiss_index = faiss.IndexFlatL2(faiss_index.d)
new_faiss_index.add(np.array(valid_vectors))
faiss_index = new_faiss_index

# Synchroniser docstore et mappage
docstore = InMemoryDocstore({str(i): documents[i] for i in range(len(documents))})
index_to_docstore_id = {i: str(i) for i in range(len(documents))}

vectorstore = FAISS(
    embedding_function=hf_embeddings,  # Passer l'objet HuggingFaceEmbeddings
    index=faiss_index,
    docstore=docstore,
    index_to_docstore_id=index_to_docstore_id
)

# Classe ElasticsearchRetriever
class ElasticsearchRetriever:
    def __init__(self, client, index_name):
        self.client = client
        self.index_name = index_name

    def retrieve(self, query, top_k=5):
        response = self.client.search(
            index=self.index_name,
            body={
                "query": {"match": {"metadata": query}},
                "size": top_k
            }
        )
        documents = []
        for hit in response["hits"]["hits"]:
            doc = Document(
                page_content=hit["_source"].get("metadata", ""),
                metadata={"source": hit["_source"].get("file_path", "Inconnu")}
            )
            documents.append(doc)
        return documents

elasticsearch_retriever = ElasticsearchRetriever(es_client, INDEX_NAME)

# Charger un modèle Hugging Face pour la génération
MODEL_NAME = "google/flan-t5-base"
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
model = AutoModelForSeq2SeqLM.from_pretrained(MODEL_NAME)
generation_pipeline = pipeline("text2text-generation", model=model, tokenizer=tokenizer)

# Chaîne combinée Elasticsearch + FAISS
def combined_retrieval(query, top_k=5):
    faiss_docs = vectorstore.similarity_search(query, k=top_k)
    es_docs = elasticsearch_retriever.retrieve(query, top_k=top_k)
    combined_docs = {"faiss": faiss_docs, "elasticsearch": es_docs}
    return combined_docs

# Répondre à une requête
query = "Impact du changement climatique sur les zones côtières"
retrieved_docs = combined_retrieval(query)

# Générer une réponse
faiss_content = "\n".join([doc.page_content for doc in retrieved_docs["faiss"]])
if faiss_content.strip():
    generation_input = f"Répondez à la requête suivante en utilisant les documents : {faiss_content}"
    response = generation_pipeline(generation_input, max_length=200)[0]["generated_text"]
else:
    response = "Aucun contenu trouvé dans les documents FAISS pour répondre à cette requête."

# Afficher les résultats
print("Réponse générée :", response)
print("\nRésultats FAISS :")
for doc in retrieved_docs["faiss"]:
    print(f"- Contenu : {doc.page_content}")
    print(f"  Source : {doc.metadata.get('source', 'Inconnu')}")
print("\nRésultats Elasticsearch :")
for doc in retrieved_docs["elasticsearch"]:
    print(f"- Contenu : {doc.page_content}")
    print(f"  Source : {doc.metadata.get('source', 'Inconnu')}")


Connexion à Hugging Face réussie.


  _transport = transport_class(
  hf_embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/paraphrase-MiniLM-L6-v2")


Réponse générée : Repondez à la demande suivante : Texte du document 2 Texte du document 1

Résultats FAISS :
- Contenu : Texte du document 2
  Source : doc2.pdf
- Contenu : Texte du document 1
  Source : doc1.pdf

Résultats Elasticsearch :


#### Bases spécialisées pour les données volumineuses

Création de la base de données et activation de PostGIS IMG et OSM

Base de donnée OSM

In [3]:
import psycopg2
from psycopg2 import sql

# Connexion à PostgreSQL
conn = psycopg2.connect(
    dbname="postgres",
    user="postgres",
    password="Malika2000",  
    host="localhost",
    port="5432"
)
conn.autocommit = True
cursor = conn.cursor()

# Création de la base de données pour GeoSearch
try:
    cursor.execute("CREATE DATABASE geosearch_data;")
    print("Base de données 'geosearch_data' créée avec succès.")
except psycopg2.errors.DuplicateDatabase:
    print("La base de données 'geosearch_data' existe déjà.")

cursor.close()
conn.close()

# Connexion à la nouvelle base pour activer PostGIS
conn = psycopg2.connect(
    dbname="geosearch_data",
    user="postgres",
    password="Malika2000",
    host="localhost",
    port="5432"
)
cursor = conn.cursor()

# Activation des extensions PostGIS
try:
    cursor.execute("CREATE EXTENSION IF NOT EXISTS postgis;")
    cursor.execute("CREATE EXTENSION IF NOT EXISTS postgis_topology;")
    print("Extensions PostGIS activées avec succès.")
except Exception as e:
    print(f"Erreur : {e}")

conn.commit()
cursor.close()
conn.close()


La base de données 'geosearch_data' existe déjà.
Extensions PostGIS activées avec succès.


Chargement des données géospatiales dans PostGIS
- Chargement des fichiers GeoJSON OpenStreetMap

In [None]:
import os
import subprocess

# Paramètres de connexion à la base de données PostgreSQL/PostGIS
DB_NAME = "geosearch_data"
DB_USER = "postgres"
DB_PASSWORD = "Malika2000"
BASE_DIR = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte_Donnee\osm_data"

# Fonction pour charger les GeoJSON dans PostGIS
def import_geojson_to_postgis(directory):
    for root, dirs, files in os.walk(directory):  # Parcours récursif des sous-dossiers
        for file in files:
            if file.endswith(".geojson"):  # Filtrer uniquement les fichiers GeoJSON
                # Récupérer le nom de la ville depuis le dossier parent
                city_name = os.path.basename(root)
                # Nom de la table dans PostGIS basé sur le nom de la ville et du fichier
                table_name = f"{city_name}_{os.path.splitext(file)[0]}"
                file_path = os.path.join(root, file)
                # Commande ogr2ogr pour importer dans PostGIS
                command = [
                    "ogr2ogr",
                    "-f", "PostgreSQL",
                    f"PG:dbname={DB_NAME} user={DB_USER} password={DB_PASSWORD}",
                    file_path,
                    "-nln", table_name,  # Spécifier le nom de la table
                    "-overwrite"  # Écraser la table si elle existe déjà
                ]
                try:
                    # Exécuter la commande
                    subprocess.run(command, check=True)
                    print(f"Importation réussie : {file} dans la table {table_name}")
                except subprocess.CalledProcessError as e:
                    print(f"Erreur lors de l'importation de {file} : {e}")
                except Exception as e:
                    print(f"Erreur inattendue pour {file} : {e}")

# Appeler la fonction pour charger les fichiers GeoJSON
import_geojson_to_postgis(BASE_DIR)


Importation réussie : Abidjan_amenity.geojson dans la table Abidjan_Abidjan_amenity
Importation réussie : Abidjan_building.geojson dans la table Abidjan_Abidjan_building
Importation réussie : Abidjan_highway.geojson dans la table Abidjan_Abidjan_highway
Importation réussie : Bamako_amenity.geojson dans la table Bamako_Bamako_amenity
Importation réussie : Bamako_building.geojson dans la table Bamako_Bamako_building
Importation réussie : Bamako_highway.geojson dans la table Bamako_Bamako_highway
Importation réussie : Cotonou_amenity.geojson dans la table Cotonou_Cotonou_amenity
Importation réussie : Cotonou_building.geojson dans la table Cotonou_Cotonou_building
Importation réussie : Cotonou_highway.geojson dans la table Cotonou_Cotonou_highway
Importation réussie : Libreville_amenity.geojson dans la table Libreville_Libreville_amenity
Importation réussie : Libreville_building.geojson dans la table Libreville_Libreville_building
Importation réussie : Libreville_highway.geojson dans la ta

In [10]:
import folium
import psycopg2
import os

# Paramètres PostgreSQL/PostGIS
DB_NAME = "geosearch_data_finale"
DB_USER = "postgres"
DB_PASSWORD = "Malika2000"
DB_HOST = "localhost"
DB_PORT = "5432"

# Chemin de base pour les cartes
BASE_DIR = r"D:\GeoSearch_Data"

# Fonction pour récupérer les données depuis PostGIS
def fetch_data_from_postgis(city, layer):
    table_name = f"{city}_{city}_{layer}"
    query = f"""
        SELECT ST_AsGeoJSON(wkb_geometry) AS geojson
        FROM {table_name}
        WHERE wkb_geometry IS NOT NULL
        LIMIT 5000;
    """
    try:
        conn = psycopg2.connect(
            dbname=DB_NAME, user=DB_USER, password=DB_PASSWORD, host=DB_HOST, port=DB_PORT
        )
        cursor = conn.cursor()
        cursor.execute(query)
        results = cursor.fetchall()
        cursor.close()
        conn.close()
        return results
    except Exception as e:
        print(f"Erreur lors de la récupération des données pour {table_name} : {e}")
        return []

# Fonction pour ajouter une légende HTML
def add_legend(map_object):
    legend_html = '''
     <div style="position: fixed; 
                 bottom: 50px; left: 50px; width: 250px; height: 150px; 
                 background-color: white; z-index:9999; font-size:14px;
                 border:2px solid grey; padding: 10px;">
         <b>Légende :</b><br>
         <i style="background: blue; width: 10px; height: 10px; display: inline-block;"></i> Routes (highway)<br>
         <i style="background: red; width: 10px; height: 10px; display: inline-block;"></i> Bâtiments (building)<br>
         <i style="background: green; width: 10px; height: 10px; display: inline-block;"></i> Équipements (amenity)<br>
     </div>
     '''
    map_object.get_root().html.add_child(folium.Element(legend_html))

# Fonction pour créer une carte et ajouter les données OSM
def create_map_with_osm_data(city, base_dir):
    try:
        # Coordonnées par défaut pour centrer la carte
        city_locations = {
            "abidjan": [5.316667, -4.033333],
            "bamako": [12.639232, -8.002889],
            "cotonou": [6.370293, 2.391236],
            "libreville": [0.416198, 9.467268],
            "paris": [48.8566, 2.3522],
            "tokyo": [35.6895, 139.6917],
        }
        city_location = city_locations.get(city.lower(), [0, 0])

        # Créer une carte Folium
        m = folium.Map(location=city_location, zoom_start=12)

        # Ajouter les données OSM pour chaque type
        for layer, color in zip(["highway", "building", "amenity"], ["blue", "red", "green"]):
            data = fetch_data_from_postgis(city, layer)
            if data:
                feature_group = folium.FeatureGroup(name=f"{layer.capitalize()} ({city})")
                for row in data:
                    geojson = row[0]  # GeoJSON
                    folium.GeoJson(
                        geojson,
                        style_function=lambda x, color=color: {'color': color, 'weight': 2},
                    ).add_to(feature_group)
                feature_group.add_to(m)

        # Ajouter la légende
        add_legend(m)

        # Ajouter le contrôle des couches
        folium.LayerControl().add_to(m)

        # Sauvegarder la carte
        output_path = os.path.join(base_dir, city, f"{city}_map.html")
        if not os.path.exists(os.path.dirname(output_path)):
            os.makedirs(os.path.dirname(output_path))
        m.save(output_path)
        print(f"Carte générée et sauvegardée : {output_path}")
    except Exception as e:
        print(f"Erreur lors de la création de la carte pour {city} : {e}")

# Générer les cartes pour toutes les villes
def generate_maps_for_all_cities(base_dir):
    cities = ["abidjan", "bamako", "cotonou", "libreville", "paris", "tokyo"]
    for city in cities:
        print(f"Création de la carte pour {city}...")
        create_map_with_osm_data(city, base_dir)

# Exécuter la génération des cartes
generate_maps_for_all_cities(BASE_DIR)


Création de la carte pour abidjan...
Carte générée et sauvegardée : D:\GeoSearch_Data\abidjan\abidjan_map.html
Création de la carte pour bamako...
Carte générée et sauvegardée : D:\GeoSearch_Data\bamako\bamako_map.html
Création de la carte pour cotonou...
Carte générée et sauvegardée : D:\GeoSearch_Data\cotonou\cotonou_map.html
Création de la carte pour libreville...
Carte générée et sauvegardée : D:\GeoSearch_Data\libreville\libreville_map.html
Création de la carte pour paris...
Carte générée et sauvegardée : D:\GeoSearch_Data\paris\paris_map.html
Création de la carte pour tokyo...
Carte générée et sauvegardée : D:\GeoSearch_Data\tokyo\tokyo_map.html


In [6]:
import folium
import psycopg2
import os

# Paramètres PostgreSQL/PostGIS
DB_NAME = "geosearch_data_finale"
DB_USER = "postgres"
DB_PASSWORD = "Malika2000"
DB_HOST = "localhost"
DB_PORT = "5432"

# Chemin de base pour les cartes
BASE_DIR = r"D:\GeoSearch_Data"

# Fonction pour récupérer les données depuis PostGIS
def fetch_data_from_postgis(city, layer):
    table_name = f"{city}_{city}_{layer}"
    query = f"""
        SELECT ST_AsGeoJSON(wkb_geometry) AS geojson, name
        FROM {table_name}
        WHERE wkb_geometry IS NOT NULL
        LIMIT 5000;
    """
    try:
        conn = psycopg2.connect(
            dbname=DB_NAME, user=DB_USER, password=DB_PASSWORD, host=DB_HOST, port=DB_PORT
        )
        cursor = conn.cursor()
        cursor.execute(query)
        results = cursor.fetchall()
        cursor.close()
        conn.close()
        return results
    except Exception as e:
        print(f"Erreur lors de la récupération des données pour {table_name} : {e}")
        return []

# Fonction pour créer une carte de base et ajouter des données OSM
def create_map_with_osm_data(city, base_dir):
    try:
        # Définir un emplacement central pour chaque ville (coordonnées à personnaliser)
        city_locations = {
            "abidjan": [5.316667, -4.033333],
            "bamako": [12.639232, -8.002889],
            "cotonou": [6.370293, 2.391236],
            "libreville": [0.416198, 9.467268],
            "paris": [48.8566, 2.3522],
            "tokyo": [35.6895, 139.6917],
        }
        city_location = city_locations.get(city.lower(), [0, 0])  # Par défaut : [0, 0]

        # Créer une carte Folium centrée sur la ville
        m = folium.Map(location=city_location, zoom_start=12)

        # Ajouter les données OSM pour chaque type (highway, building, amenity)
        for layer, color in zip(["highway", "building", "amenity"], ["blue", "red", "green"]):
            data = fetch_data_from_postgis(city, layer)
            if data:
                for row in data:
                    geojson = row[0]  # GeoJSON
                    name = row[1] or "Inconnu"  # Nom ou défaut
                    folium.GeoJson(
                        geojson,
                        name=f"{layer} ({city})",
                        style_function=lambda x: {'color': color},
                        tooltip=folium.Tooltip(text=name)
                    ).add_to(m)

        # Ajouter le contrôle des couches
        folium.LayerControl().add_to(m)

        # Sauvegarder la carte
        output_path = os.path.join(base_dir, city, f"{city}_map.html")
        if not os.path.exists(os.path.dirname(output_path)):
            os.makedirs(os.path.dirname(output_path))
        m.save(output_path)
        print(f"Carte générée et sauvegardée : {output_path}")
    except Exception as e:
        print(f"Erreur lors de la création de la carte pour {city} : {e}")

# Créer les cartes pour toutes les villes
def generate_maps_for_all_cities(base_dir):
    cities = ["abidjan", "bamako", "cotonou", "libreville", "paris", "tokyo"]
    for city in cities:
        print(f"Création de la carte pour {city}...")
        create_map_with_osm_data(city, base_dir)

# Exécuter la génération des cartes
generate_maps_for_all_cities(BASE_DIR)


Création de la carte pour abidjan...
Carte générée et sauvegardée : D:\GeoSearch_Data\abidjan\abidjan_map.html
Création de la carte pour bamako...
Carte générée et sauvegardée : D:\GeoSearch_Data\bamako\bamako_map.html
Création de la carte pour cotonou...
Carte générée et sauvegardée : D:\GeoSearch_Data\cotonou\cotonou_map.html
Création de la carte pour libreville...
Carte générée et sauvegardée : D:\GeoSearch_Data\libreville\libreville_map.html
Création de la carte pour paris...
Carte générée et sauvegardée : D:\GeoSearch_Data\paris\paris_map.html
Création de la carte pour tokyo...
Carte générée et sauvegardée : D:\GeoSearch_Data\tokyo\tokyo_map.html


In [1]:
import folium
import psycopg2
import os

# Paramètres PostgreSQL/PostGIS
DB_NAME = "geosearch_data_finale"
DB_USER = "postgres"
DB_PASSWORD = "Malika2000"
DB_HOST = "localhost"
DB_PORT = "5432"

# Chemin de base pour les cartes
BASE_DIR = r"D:\GeoSearch_Data"

# Fonction pour récupérer les données depuis PostGIS
def fetch_data_from_postgis(city, layer):
    table_name = f"{city}_{city}_{layer}"
    query = f"""
        SELECT ST_AsGeoJSON(wkb_geometry) AS geojson
        FROM {table_name}
        WHERE wkb_geometry IS NOT NULL
        LIMIT 5000;
    """
    try:
        conn = psycopg2.connect(
            dbname=DB_NAME, user=DB_USER, password=DB_PASSWORD, host=DB_HOST, port=DB_PORT
        )
        cursor = conn.cursor()
        cursor.execute(query)
        results = cursor.fetchall()
        cursor.close()
        conn.close()
        return results
    except Exception as e:
        print(f"Erreur lors de la récupération des données pour {table_name} : {e}")
        return []

# Fonction pour ajouter une légende HTML
def add_legend(map_object):
    legend_html = '''
     <div style="position: fixed; 
                 bottom: 50px; left: 50px; width: 250px; height: 150px; 
                 background-color: white; z-index:9999; font-size:14px;
                 border:2px solid grey; padding: 10px;">
         <b>Légende :</b><br>
         <i style="background: blue; width: 10px; height: 10px; display: inline-block;"></i> Routes (highway)<br>
         <i style="background: red; width: 10px; height: 10px; display: inline-block;"></i> Bâtiments (building)<br>
         <i style="background: green; width: 10px; height: 10px; display: inline-block;"></i> Équipements (amenity)<br>
     </div>
     '''
    map_object.get_root().html.add_child(folium.Element(legend_html))

# Fonction pour créer une carte et ajouter les données OSM
def create_map_with_osm_data(city, base_dir):
    try:
        # Coordonnées par défaut pour centrer la carte
        city_locations = {
            "abidjan": [5.316667, -4.033333],
            "bamako": [12.639232, -8.002889],
            "cotonou": [6.370293, 2.391236],
            "libreville": [0.416198, 9.467268],
            "paris": [48.8566, 2.3522],
            "tokyo": [35.6895, 139.6917],
        }
        city_location = city_locations.get(city.lower(), [0, 0])

        # Créer une carte Folium
        m = folium.Map(location=city_location, zoom_start=12)

        # Ajouter les données OSM pour chaque type
        for layer, color in zip(["highway", "building", "amenity"], ["blue", "red", "green"]):
            data = fetch_data_from_postgis(city, layer)
            if data:
                feature_group = folium.FeatureGroup(name=f"{layer.capitalize()} ({city})")
                for row in data:
                    geojson = row[0]  # GeoJSON
                    folium.GeoJson(
                        geojson,
                        style_function=lambda x, color=color: {'color': color, 'weight': 2},
                    ).add_to(feature_group)
                feature_group.add_to(m)

        # Ajouter la légende
        add_legend(m)

        # Ajouter le contrôle des couches
        folium.LayerControl().add_to(m)

        # Sauvegarder la carte
        output_path = os.path.join(base_dir, city, f"{city}_map.html")
        if not os.path.exists(os.path.dirname(output_path)):
            os.makedirs(os.path.dirname(output_path))
        m.save(output_path)
        print(f"Carte générée et sauvegardée : {output_path}")
    except Exception as e:
        print(f"Erreur lors de la création de la carte pour {city} : {e}")

# Générer les cartes pour toutes les villes
def generate_maps_for_all_cities(base_dir):
    cities = ["abidjan", "bamako", "cotonou", "libreville", "paris", "tokyo"]
    for city in cities:
        print(f"Création de la carte pour {city}...")
        create_map_with_osm_data(city, base_dir)

# Exécuter la génération des cartes
generate_maps_for_all_cities(BASE_DIR)


Création de la carte pour abidjan...
Carte générée et sauvegardée : D:\GeoSearch_Data\abidjan\abidjan_map.html
Création de la carte pour bamako...
Carte générée et sauvegardée : D:\GeoSearch_Data\bamako\bamako_map.html
Création de la carte pour cotonou...
Carte générée et sauvegardée : D:\GeoSearch_Data\cotonou\cotonou_map.html
Création de la carte pour libreville...
Carte générée et sauvegardée : D:\GeoSearch_Data\libreville\libreville_map.html
Création de la carte pour paris...
Carte générée et sauvegardée : D:\GeoSearch_Data\paris\paris_map.html
Création de la carte pour tokyo...
Carte générée et sauvegardée : D:\GeoSearch_Data\tokyo\tokyo_map.html


In [4]:
import folium
import psycopg2
import os

# Paramètres PostgreSQL/PostGIS
DB_NAME = "geosearch_data"
DB_USER = "postgres"
DB_PASSWORD = "Malika2000"
DB_HOST = "localhost"
DB_PORT = "5432"

# Chemin de base pour les cartes
BASE_DIR = r"D:\GeoSearch_Data_finale"

# Fonction pour récupérer les données depuis PostGIS
def fetch_data_from_postgis(city, layer):
    table_name = f"{city}_{city}_{layer}"
    query = f"""
        SELECT ST_AsGeoJSON(wkb_geometry) AS geojson
        FROM {table_name}
        WHERE wkb_geometry IS NOT NULL
        LIMIT 5000;
    """
    try:
        conn = psycopg2.connect(
            dbname=DB_NAME, user=DB_USER, password=DB_PASSWORD, host=DB_HOST, port=DB_PORT
        )
        cursor = conn.cursor()
        cursor.execute(query)
        results = cursor.fetchall()
        cursor.close()
        conn.close()
        return results
    except Exception as e:
        print(f"Erreur lors de la récupération des données pour {table_name} : {e}")
        return []

# Fonction pour ajouter une légende HTML
def add_legend(map_object):
    legend_html = '''
     <div style="position: fixed; 
                 bottom: 50px; left: 50px; width: 250px; height: 150px; 
                 background-color: white; z-index:9999; font-size:14px;
                 border:2px solid grey; padding: 10px;">
         <b>Légende :</b><br>
         <i style="background: red; width: 10px; height: 10px; display: inline-block;"></i> Routes (highway)<br>
         <i style="background: blue; width: 10px; height: 10px; display: inline-block;"></i> Bâtiments (building)<br>
         <i style="background: green; width: 10px; height: 10px; display: inline-block;"></i> Équipements (amenity)<br>
     </div>
     '''
    map_object.get_root().html.add_child(folium.Element(legend_html))

# Fonction pour créer une carte et ajouter les données OSM
def create_map_with_osm_data(city, base_dir):
    try:
        # Coordonnées par défaut pour centrer la carte
        city_locations = {
            "abidjan": [5.316667, -4.033333],
            "bamako": [12.639232, -8.002889],
            "cotonou": [6.370293, 2.391236],
            "libreville": [0.416198, 9.467268],
            "paris": [48.8566, 2.3522],
            "tokyo": [35.6895, 139.6917],
        }
        city_location = city_locations.get(city.lower(), [0, 0])

        # Créer une carte Folium
        m = folium.Map(location=city_location, zoom_start=12)

        # Ajouter les données OSM pour chaque type
        for layer, color in zip(["highway", "building", "amenity"], ["red", "blue", "green"]):
            data = fetch_data_from_postgis(city, layer)
            if data:
                feature_group = folium.FeatureGroup(name=f"{layer.capitalize()} ({city})")
                for row in data:
                    geojson = row[0]  # GeoJSON
                    folium.GeoJson(
                        geojson,
                        style_function=lambda x, color=color: {'color': color, 'weight': 2},
                    ).add_to(feature_group)
                feature_group.add_to(m)

        # Ajouter la légende
        add_legend(m)

        # Ajouter le contrôle des couches
        folium.LayerControl().add_to(m)

        # Sauvegarder la carte
        output_path = os.path.join(base_dir, city, f"{city}_map.html")
        if not os.path.exists(os.path.dirname(output_path)):
            os.makedirs(os.path.dirname(output_path))
        m.save(output_path)
        print(f"Carte générée et sauvegardée : {output_path}")
    except Exception as e:
        print(f"Erreur lors de la création de la carte pour {city} : {e}")

# Générer les cartes pour toutes les villes
def generate_maps_for_all_cities(base_dir):
    cities = ["abidjan", "bamako", "cotonou", "libreville", "paris", "tokyo"]
    for city in cities:
        print(f"Création de la carte pour {city}...")
        create_map_with_osm_data(city, base_dir)

# Exécuter la génération des cartes
generate_maps_for_all_cities(BASE_DIR)


Création de la carte pour abidjan...
Carte générée et sauvegardée : D:\GeoSearch_Data_finale\abidjan\abidjan_map.html
Création de la carte pour bamako...
Carte générée et sauvegardée : D:\GeoSearch_Data_finale\bamako\bamako_map.html
Création de la carte pour cotonou...
Carte générée et sauvegardée : D:\GeoSearch_Data_finale\cotonou\cotonou_map.html
Création de la carte pour libreville...
Carte générée et sauvegardée : D:\GeoSearch_Data_finale\libreville\libreville_map.html
Création de la carte pour paris...
Carte générée et sauvegardée : D:\GeoSearch_Data_finale\paris\paris_map.html
Création de la carte pour tokyo...
Carte générée et sauvegardée : D:\GeoSearch_Data_finale\tokyo\tokyo_map.html


In [6]:
import folium
import psycopg2
import os

# Paramètres PostgreSQL/PostGIS
DB_NAME = "geosearch_data"
DB_USER = "postgres"
DB_PASSWORD = "Malika2000"
DB_HOST = "localhost"
DB_PORT = "5432"

# Chemin de base pour les cartes
BASE_DIR = r"D:\GeoSearch_Data_true"

# Fonction pour récupérer les données depuis PostGIS
def fetch_data_from_postgis(city, layer):
    table_name = f"{city}_{city}_{layer}"
    query = f"""
        SELECT ST_AsGeoJSON(wkb_geometry) AS geojson
        FROM {table_name}
        WHERE wkb_geometry IS NOT NULL
        LIMIT 5000;
    """
    try:
        conn = psycopg2.connect(
            dbname=DB_NAME, user=DB_USER, password=DB_PASSWORD, host=DB_HOST, port=DB_PORT
        )
        cursor = conn.cursor()
        cursor.execute(query)
        results = cursor.fetchall()
        cursor.close()
        conn.close()
        return results
    except Exception as e:
        print(f"Erreur lors de la récupération des données pour {table_name} : {e}")
        return []

# Fonction pour ajouter une légende HTML
def add_legend(map_object):
    legend_html = '''
     <div style="position: fixed; 
                 bottom: 50px; left: 50px; width: 250px; height: 150px; 
                 background-color: white; z-index:9999; font-size:14px;
                 border:2px solid grey; padding: 10px;">
         <b>Légende :</b><br>
         <i style="background: red; width: 10px; height: 10px; display: inline-block;"></i> Routes (highway)<br>
         <i style="background: blue; width: 10px; height: 10px; display: inline-block;"></i> Bâtiments (building)<br>
         <i style="background: green; width: 10px; height: 10px; display: inline-block;"></i> Équipements (amenity)<br>
     </div>
     '''
    map_object.get_root().html.add_child(folium.Element(legend_html))

# Fonction pour créer une carte et ajouter les données OSM
def create_map_with_osm_data(city, base_dir):
    try:
        # Coordonnées par défaut pour centrer la carte
        city_locations = {
            "abidjan": [5.316667, -4.033333],
            "bamako": [12.639232, -8.002889],
            "cotonou": [6.370293, 2.391236],
            "libreville": [0.416198, 9.467268],
            "paris": [48.8566, 2.3522],
            "tokyo": [35.6895, 139.6917],
        }
        city_location = city_locations.get(city.lower(), [0, 0])

        # Créer une carte Folium
        m = folium.Map(location=city_location, zoom_start=12)

        # Ajouter les données OSM pour chaque type
        for layer, color in zip(["highway", "building", "amenity"], ["red", "blue", "green"]):
            data = fetch_data_from_postgis(city, layer)
            if data:
                feature_group = folium.FeatureGroup(name=f"{layer.capitalize()} ({city})")
                for row in data:
                    geojson = row[0]  # GeoJSON
                    folium.GeoJson(
                        geojson,
                        style_function=lambda x, color=color: {"color": color, "weight": 2},
                        marker=None,  # Supprime les marqueurs bleus
                    ).add_to(feature_group)
                feature_group.add_to(m)

        # Ajouter la légende
        add_legend(m)

        # Ajouter le contrôle des couches
        folium.LayerControl().add_to(m)

        # Sauvegarder la carte
        output_path = os.path.join(base_dir, city, f"{city}_map.html")
        if not os.path.exists(os.path.dirname(output_path)):
            os.makedirs(os.path.dirname(output_path))
        m.save(output_path)
        print(f"Carte générée et sauvegardée : {output_path}")
    except Exception as e:
        print(f"Erreur lors de la création de la carte pour {city} : {e}")

# Générer les cartes pour toutes les villes
def generate_maps_for_all_cities(base_dir):
    cities = ["abidjan", "bamako", "cotonou", "libreville", "paris", "tokyo"]
    for city in cities:
        print(f"Création de la carte pour {city}...")
        create_map_with_osm_data(city, base_dir)

# Exécuter la génération des cartes
generate_maps_for_all_cities(BASE_DIR)


Création de la carte pour abidjan...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\abidjan\abidjan_map.html
Création de la carte pour bamako...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\bamako\bamako_map.html
Création de la carte pour cotonou...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\cotonou\cotonou_map.html
Création de la carte pour libreville...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\libreville\libreville_map.html
Création de la carte pour paris...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\paris\paris_map.html
Création de la carte pour tokyo...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\tokyo\tokyo_map.html


In [9]:
import folium
import psycopg2
import os

# Paramètres PostgreSQL/PostGIS
DB_NAME = "geosearch_data"
DB_USER = "postgres"
DB_PASSWORD = "Malika2000"
DB_HOST = "localhost"
DB_PORT = "5432"

# Chemin de base pour les cartes
BASE_DIR = r"D:\GeoSearch_Data_true"

# Fonction pour récupérer les données depuis PostGIS
def fetch_data_from_postgis(city, layer):
    table_name = f"{city}_{city}_{layer}"
    query = f"""
        SELECT ST_AsGeoJSON(wkb_geometry) AS geojson
        FROM {table_name}
        WHERE wkb_geometry IS NOT NULL
        LIMIT 5000;
    """
    try:
        conn = psycopg2.connect(
            dbname=DB_NAME, user=DB_USER, password=DB_PASSWORD, host=DB_HOST, port=DB_PORT
        )
        cursor = conn.cursor()
        cursor.execute(query)
        results = cursor.fetchall()
        cursor.close()
        conn.close()
        return results
    except Exception as e:
        print(f"Erreur lors de la récupération des données pour {table_name} : {e}")
        return []

# Fonction pour ajouter une légende HTML
def add_legend(map_object):
    legend_html = '''
     <div style="position: fixed; 
                 bottom: 50px; left: 50px; width: 250px; height: 150px; 
                 background-color: white; z-index:9999; font-size:14px;
                 border:2px solid grey; padding: 10px;">
         <b>Légende :</b><br>
         <i style="background: red; width: 10px; height: 10px; display: inline-block;"></i> Routes (highway)<br>
         <i style="background: rgba(70, 130, 180, 0.5); width: 10px; height: 10px; display: inline-block;"></i> Bâtiments (building)<br>
         <i style="background: green; width: 10px; height: 10px; display: inline-block;"></i> Équipements (amenity)<br>
     </div>
     '''
    map_object.get_root().html.add_child(folium.Element(legend_html))

# Fonction pour créer une carte et ajouter les données OSM
def create_map_with_osm_data(city, base_dir):
    try:
        # Coordonnées par défaut pour centrer la carte
        city_locations = {
            "abidjan": [5.316667, -4.033333],
            "bamako": [12.639232, -8.002889],
            "cotonou": [6.370293, 2.391236],
            "libreville": [0.416198, 9.467268],
            "paris": [48.8566, 2.3522],
            "tokyo": [35.6895, 139.6917],
        }
        city_location = city_locations.get(city.lower(), [0, 0])

        # Créer une carte Folium
        m = folium.Map(location=city_location, zoom_start=12)

        # Ajouter les données OSM pour chaque type
        for layer, color in zip(["highway", "building", "amenity"], ["red", "rgba(70, 130, 180, 0.5)", "green"]):
            data = fetch_data_from_postgis(city, layer)
            if data:
                feature_group = folium.FeatureGroup(name=f"{layer.capitalize()} ({city})")
                for row in data:
                    geojson = row[0]  # GeoJSON
                    folium.GeoJson(
                        geojson,
                        style_function=lambda x, color=color: {"color": color, "weight": 2, "fillOpacity": 0.5} if layer == "building" else {"color": color, "weight": 2},
                        marker=None,  # Désactiver les marqueurs
                    ).add_to(feature_group)
                feature_group.add_to(m)

        # Ajouter la légende
        add_legend(m)

        # Ajouter le contrôle des couches
        folium.LayerControl().add_to(m)

        # Sauvegarder la carte
        output_path = os.path.join(base_dir, city, f"{city}_map.html")
        if not os.path.exists(os.path.dirname(output_path)):
            os.makedirs(os.path.dirname(output_path))
        m.save(output_path)
        print(f"Carte générée et sauvegardée : {output_path}")
    except Exception as e:
        print(f"Erreur lors de la création de la carte pour {city} : {e}")

# Générer les cartes pour toutes les villes
def generate_maps_for_all_cities(base_dir):
    cities = ["abidjan", "bamako", "cotonou", "libreville", "paris", "tokyo"]
    for city in cities:
        print(f"Création de la carte pour {city}...")
        create_map_with_osm_data(city, base_dir)

# Exécuter la génération des cartes
generate_maps_for_all_cities(BASE_DIR)


Création de la carte pour abidjan...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\abidjan\abidjan_map.html
Création de la carte pour bamako...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\bamako\bamako_map.html
Création de la carte pour cotonou...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\cotonou\cotonou_map.html
Création de la carte pour libreville...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\libreville\libreville_map.html
Création de la carte pour paris...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\paris\paris_map.html
Création de la carte pour tokyo...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\tokyo\tokyo_map.html


In [10]:
import folium
import psycopg2
import os
import json

# Paramètres PostgreSQL/PostGIS
DB_NAME = "geosearch_data"
DB_USER = "postgres"
DB_PASSWORD = "Malika2000"
DB_HOST = "localhost"
DB_PORT = "5432"

# Chemin de base pour les cartes
BASE_DIR = r"D:\GeoSearch_Data_true"

# Fonction pour récupérer les données filtrées depuis PostGIS
def fetch_filtered_data(city, layer):
    table_name = f"{city}_{city}_{layer}"
    query = f"""
        SELECT ST_AsGeoJSON(wkb_geometry) AS geojson
        FROM {table_name}
        WHERE ST_GeometryType(wkb_geometry) IN ('ST_LineString', 'ST_Polygon')
        LIMIT 5000;
    """
    try:
        conn = psycopg2.connect(
            dbname=DB_NAME, user=DB_USER, password=DB_PASSWORD, host=DB_HOST, port=DB_PORT
        )
        cursor = conn.cursor()
        cursor.execute(query)
        results = cursor.fetchall()
        cursor.close()
        conn.close()
        return results
    except Exception as e:
        print(f"Erreur lors de la récupération des données pour {table_name} : {e}")
        return []

# Fonction pour ajouter une légende HTML
def add_legend(map_object):
    legend_html = '''
     <div style="position: fixed; 
                 bottom: 50px; left: 50px; width: 250px; height: 150px; 
                 background-color: white; z-index:9999; font-size:14px;
                 border:2px solid grey; padding: 10px;">
         <b>Légende :</b><br>
         <i style="background: red; width: 10px; height: 10px; display: inline-block;"></i> Routes (highway)<br>
         <i style="background: rgba(70, 130, 180, 0.5); width: 10px; height: 10px; display: inline-block;"></i> Bâtiments (building)<br>
         <i style="background: green; width: 10px; height: 10px; display: inline-block;"></i> Équipements (amenity)<br>
     </div>
     '''
    map_object.get_root().html.add_child(folium.Element(legend_html))

# Fonction pour créer une carte et ajouter les données filtrées
def create_filtered_map(city, base_dir):
    try:
        # Coordonnées par défaut pour centrer la carte
        city_locations = {
            "abidjan": [5.316667, -4.033333],
            "bamako": [12.639232, -8.002889],
            "cotonou": [6.370293, 2.391236],
            "libreville": [0.416198, 9.467268],
            "paris": [48.8566, 2.3522],
            "tokyo": [35.6895, 139.6917],
        }
        city_location = city_locations.get(city.lower(), [0, 0])

        # Créer une carte Folium
        m = folium.Map(location=city_location, zoom_start=12)

        # Ajouter les données filtrées pour chaque type
        for layer, color in zip(["highway", "building", "amenity"], ["red", "rgba(70, 130, 180, 0.5)", "green"]):
            data = fetch_filtered_data(city, layer)
            if data:
                feature_group = folium.FeatureGroup(name=f"{layer.capitalize()} ({city})")
                for row in data:
                    geojson = json.loads(row[0])  # Charger le GeoJSON
                    folium.GeoJson(
                        geojson,
                        style_function=lambda x, color=color: {"color": color, "weight": 2, "fillOpacity": 0.5} if layer == "building" else {"color": color, "weight": 2},
                    ).add_to(feature_group)
                feature_group.add_to(m)

        # Ajouter la légende
        add_legend(m)

        # Ajouter le contrôle des couches
        folium.LayerControl().add_to(m)

        # Sauvegarder la carte
        output_path = os.path.join(base_dir, city, f"{city}_map.html")
        if not os.path.exists(os.path.dirname(output_path)):
            os.makedirs(os.path.dirname(output_path))
        m.save(output_path)
        print(f"Carte générée et sauvegardée : {output_path}")
    except Exception as e:
        print(f"Erreur lors de la création de la carte pour {city} : {e}")

# Générer les cartes pour toutes les villes
def generate_filtered_maps(base_dir):
    cities = ["abidjan", "bamako", "cotonou", "libreville", "paris", "tokyo"]
    for city in cities:
        print(f"Création de la carte filtrée pour {city}...")
        create_filtered_map(city, base_dir)

# Exécuter la génération des cartes
generate_filtered_maps(BASE_DIR)


Création de la carte filtrée pour abidjan...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\abidjan\abidjan_map.html
Création de la carte filtrée pour bamako...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\bamako\bamako_map.html
Création de la carte filtrée pour cotonou...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\cotonou\cotonou_map.html
Création de la carte filtrée pour libreville...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\libreville\libreville_map.html
Création de la carte filtrée pour paris...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\paris\paris_map.html
Création de la carte filtrée pour tokyo...
Carte générée et sauvegardée : D:\GeoSearch_Data_true\tokyo\tokyo_map.html


In [11]:
import folium
import psycopg2
import os
import json

# PostgreSQL/PostGIS connection parameters
DB_NAME = "geosearch_data"
DB_USER = "postgres"
DB_PASSWORD = "Malika2000"
DB_HOST = "localhost"
DB_PORT = "5432"

# Base directory for saving the maps
BASE_DIR = r"D:\GeoSearch_Data_true"

# Fetch filtered data from PostGIS
def fetch_filtered_data(city, layer):
    table_name = f"{city}_{city}_{layer}"
    query = f"""
        SELECT ST_AsGeoJSON(wkb_geometry) AS geojson
        FROM {table_name}
        WHERE ST_GeometryType(wkb_geometry) IN ('ST_LineString', 'ST_Polygon')
        LIMIT 5000;
    """
    try:
        conn = psycopg2.connect(
            dbname=DB_NAME, user=DB_USER, password=DB_PASSWORD, host=DB_HOST, port=DB_PORT
        )
        cursor = conn.cursor()
        cursor.execute(query)
        results = cursor.fetchall()
        cursor.close()
        conn.close()
        return results
    except Exception as e:
        print(f"Error fetching data from {table_name}: {e}")
        return []

# Add HTML legend to the map
def add_legend(map_object):
    legend_html = '''
    <div style="position: fixed; 
                bottom: 50px; left: 50px; width: 250px; height: 150px; 
                background-color: white; z-index:9999; font-size:14px;
                border:2px solid grey; padding: 10px;">
        <b>Legend:</b><br>
        <i style="background: red; width: 10px; height: 10px; display: inline-block;"></i> Highways (Red)<br>
        <i style="background: rgba(70, 130, 180, 0.5); width: 10px; height: 10px; display: inline-block;"></i> Buildings (Blue)<br>
        <i style="background: green; width: 10px; height: 10px; display: inline-block;"></i> Amenities (Green)<br>
    </div>
    '''
    map_object.get_root().html.add_child(folium.Element(legend_html))

# Create interactive map with filtered data
def create_filtered_map(city, base_dir):
    try:
        # Default city locations for centering the map
        city_locations = {
            "abidjan": [5.316667, -4.033333],
            "bamako": [12.639232, -8.002889],
            "cotonou": [6.370293, 2.391236],
            "libreville": [0.416198, 9.467268],
            "paris": [48.8566, 2.3522],
            "tokyo": [35.6895, 139.6917],
        }
        city_location = city_locations.get(city.lower(), [0, 0])

        # Create a Folium map object
        m = folium.Map(location=city_location, zoom_start=12, tiles="OpenStreetMap")

        # Add layers for each category with filtered data
        for layer, color in zip(["highway", "building", "amenity"], ["red", "blue", "green"]):
            data = fetch_filtered_data(city, layer)
            if data:
                feature_group = folium.FeatureGroup(name=f"{layer.capitalize()} ({city})")
                for row in data:
                    geojson = json.loads(row[0])  # Parse GeoJSON data
                    folium.GeoJson(
                        geojson,
                        style_function=lambda x, color=color: {
                            "color": color, 
                            "weight": 2, 
                            "fillOpacity": 0.5 if layer == "building" else 0
                        },
                    ).add_to(feature_group)
                feature_group.add_to(m)

        # Add legend and layer control
        add_legend(m)
        folium.LayerControl().add_to(m)

        # Save the map to file
        output_path = os.path.join(base_dir, city, f"{city}_map.html")
        os.makedirs(os.path.dirname(output_path), exist_ok=True)
        m.save(output_path)
        print(f"Map for {city} saved at {output_path}")
    except Exception as e:
        print(f"Error creating map for {city}: {e}")

# Generate maps for all cities
def generate_filtered_maps(base_dir):
    cities = ["abidjan", "bamako", "cotonou", "libreville", "paris", "tokyo"]
    for city in cities:
        print(f"Creating map for {city}...")
        create_filtered_map(city, base_dir)

# Execute the map generation
generate_filtered_maps(BASE_DIR)


Creating map for abidjan...
Map for abidjan saved at D:\GeoSearch_Data_true\abidjan\abidjan_map.html
Creating map for bamako...
Map for bamako saved at D:\GeoSearch_Data_true\bamako\bamako_map.html
Creating map for cotonou...
Map for cotonou saved at D:\GeoSearch_Data_true\cotonou\cotonou_map.html
Creating map for libreville...
Map for libreville saved at D:\GeoSearch_Data_true\libreville\libreville_map.html
Creating map for paris...
Map for paris saved at D:\GeoSearch_Data_true\paris\paris_map.html
Creating map for tokyo...
Map for tokyo saved at D:\GeoSearch_Data_true\tokyo\tokyo_map.html


Charger les images et leurs métadonnées dans PostGIS

In [62]:
import os
import json
from sqlalchemy import create_engine, MetaData, Table, Column, String
from geoalchemy2 import Geometry
from sqlalchemy.exc import SQLAlchemyError

# Configuration de la base
DB_NAME = "geosearch_data"
DB_USER = "postgres"
DB_PASSWORD = "Malika2000"
DB_HOST = "localhost"
DB_PORT = "5432"
IMG_DIR = r"C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte_Donnee\IMG_SentinelHub"

# Connexion à PostGIS
engine = create_engine(f"postgresql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}")
metadata = MetaData()

# Définition de la table
images_table = Table(
    'satellites_images', metadata,
    Column('id', String, primary_key=True),
    Column('city', String),
    Column('file_path', String),
    Column('geometry', Geometry('POLYGON', srid=4326))
)
metadata.create_all(engine)

# Charger les fichiers JSON et insérer dans la base
with engine.connect() as conn:
    for city in os.listdir(IMG_DIR):
        city_path = os.path.join(IMG_DIR, city)
        if os.path.isdir(city_path):
            for file in os.listdir(city_path):
                if file.endswith('.json'):
                    json_path = os.path.join(city_path, file)
                    try:
                        with open(json_path, 'r', encoding='utf-8') as f:
                            data = json.load(f)

                        # Construire la géométrie POLYGON WKT
                        bbox = data['bbox']
                        polygon_wkt = (
                            f"SRID=4326;POLYGON(({bbox['min_lon']} {bbox['min_lat']}, "
                            f"{bbox['max_lon']} {bbox['min_lat']}, "
                            f"{bbox['max_lon']} {bbox['max_lat']}, "
                            f"{bbox['min_lon']} {bbox['max_lat']}, "
                            f"{bbox['min_lon']} {bbox['min_lat']}))"
                        )

                        # Insérer les données dans une transaction
                        with conn.begin():  # Démarrer une transaction
                            stmt = images_table.insert().values(
                                id=f"{data['city']}_{data['date']}",
                                city=data['city'],
                                file_path=os.path.join(city_path, data['image_path']),
                                geometry=polygon_wkt
                            )
                            conn.execute(stmt)
                            print(f"Fichier JSON inséré : {json_path}")

                    except SQLAlchemyError as e:
                        print(f"Erreur SQL lors de l'insertion de {json_path} : {str(e)}")
                    except Exception as e:
                        print(f"Erreur lors du traitement de {json_path} : {str(e)}")


Fichier JSON inséré : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte_Donnee\IMG_SentinelHub\Abidjan\Abidjan_2023-10-01.json
Fichier JSON inséré : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte_Donnee\IMG_SentinelHub\Abidjan\Abidjan_2023-10-02.json
Fichier JSON inséré : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte_Donnee\IMG_SentinelHub\Abidjan\Abidjan_2023-10-03.json
Fichier JSON inséré : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte_Donnee\IMG_SentinelHub\Abidjan\Abidjan_2023-10-04.json
Fichier JSON inséré : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte_Donnee\IMG_SentinelHub\Abidjan\Abidjan_2023-10-05.json
Fichier JSON inséré : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte_Donnee\IMG_SentinelHub\Abidjan\Abidjan_2023-10-06.json
Fichier JSON inséré : C:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\Collecte_Donnee\IMG_S

In [66]:
import folium
import geopandas as gpd
import pandas as pd
from sqlalchemy import create_engine
import json
from shapely.geometry import shape

# Connexion à la base de données
DB_NAME = "geosearch_data"
DB_USER = "postgres"
DB_PASSWORD = "Malika2000"
DB_HOST = "localhost"
DB_PORT = "5432"

engine = create_engine(f"postgresql://{DB_USER}:{DB_PASSWORD}@{DB_HOST}:{DB_PORT}/{DB_NAME}")

# Charger les données au format GeoJSON
def fetch_images_for_city(city):
    query = f"""
    SELECT id, city, file_path, ST_AsGeoJSON(geometry) AS geojson
    FROM satellite_images
    WHERE city = '{city}';
    """
    df = pd.read_sql(query, con=engine)

    if not df.empty:
        # Convertir GeoJSON en objets géométriques Shapely
        df['geometry'] = df['geojson'].apply(lambda x: shape(json.loads(x)))
        gdf = gpd.GeoDataFrame(df, geometry='geometry')
        gdf.set_crs(epsg=4326, inplace=True)
        return gdf
    return gpd.GeoDataFrame()  # Retourne un DataFrame vide si aucune donnée

# Créer une carte interactive
def create_city_map(city):
    gdf = fetch_images_for_city(city)

    if gdf.empty:
        print(f"Aucune donnée trouvée pour la ville : {city}")
        return

    # Créez une carte centrée sur le premier élément
    centroid = gdf.geometry[0].centroid
    city_map = folium.Map(location=[centroid.y, centroid.x], zoom_start=12)

    # Ajouter les polygones des images satellites
    for _, row in gdf.iterrows():
        folium.GeoJson(
            row.geometry.__geo_interface__,
            name=row.file_path,
            tooltip=f"ID: {row.id}, Path: {row.file_path}"
        ).add_to(city_map)

    # Ajouter un contrôle pour afficher les couches
    folium.LayerControl().add_to(city_map)

    # Sauvegarder la carte
    map_file = f"{city}_satellite_map.html"
    city_map.save(map_file)
    print(f"Carte générée : {map_file}")

# Générer une carte pour Abidjan
create_city_map("Abidjan")


Carte générée : Abidjan_satellite_map.html


### Application Streamlit 

In [5]:
import streamlit as st
if not os.path.exists(FAISS_INDEX_PATH):
    st.sidebar.error(f"Fichier FAISS introuvable à l'emplacement : {FAISS_INDEX_PATH}")
else:
    st.sidebar.success(f"Fichier FAISS trouvé à : {FAISS_INDEX_PATH}")


2024-12-03 12:34:24.473 
  command:

    streamlit run c:\Users\ec\OneDrive\Bureau\Generative_IA\Projet_Generative_IA\LLM\Lib\site-packages\ipykernel_launcher.py [ARGUMENTS]


In [13]:
import faiss
import numpy as np

# Chemin vers les vecteurs (assurez-vous d'avoir ce fichier)
VECTOR_FILE = r"C:\FAISS\vectors.npy"
FAISS_INDEX_PATH = r"C:\FAISS\faiss_index"

# Charger les vecteurs
vectors = np.load(VECTOR_FILE)
dimension = vectors.shape[1]

# Créer un index FAISS
index = faiss.IndexFlatL2(dimension)
index.add(vectors)

# Sauvegarder l'index FAISS
faiss.write_index(index, FAISS_INDEX_PATH)
print(f"Index FAISS sauvegardé dans : {FAISS_INDEX_PATH}")


Index FAISS sauvegardé dans : C:\FAISS\faiss_index


In [14]:
import os
import faiss

FAISS_INDEX_PATH = r"C:\FAISS\faiss_index.bin"

if not os.path.exists(FAISS_INDEX_PATH):
    print(f"Erreur : Le fichier {FAISS_INDEX_PATH} est introuvable.")
else:
    print(f"Fichier trouvé à : {FAISS_INDEX_PATH}")
    try:
        # Chargement de l'index pour vérifier son intégrité
        index = faiss.read_index(FAISS_INDEX_PATH)
        print("Index FAISS chargé avec succès.")
    except Exception as e:
        print(f"Erreur lors du chargement de l'index FAISS : {e}")


Fichier trouvé à : C:\FAISS\faiss_index.bin
Index FAISS chargé avec succès.


In [15]:
import faiss
import json
import os

FAISS_INDEX_PATH = r"C:\FAISS\faiss_index.bin"
METADATA_FILE = r"C:\FAISS\metadata_faiss.json"

# Test du fichier FAISS
if os.path.exists(FAISS_INDEX_PATH):
    index = faiss.read_index(FAISS_INDEX_PATH)
    print(f"Index FAISS chargé avec succès : {index.ntotal} vecteurs.")
else:
    print(f"Erreur : Fichier FAISS introuvable à {FAISS_INDEX_PATH}")

# Test du fichier de métadonnées
if os.path.exists(METADATA_FILE):
    with open(METADATA_FILE, "r", encoding="utf-8") as f:
        metadata = json.load(f)
    print(f"Métadonnées chargées avec succès : {len(metadata)} entrées.")
else:
    print(f"Erreur : Fichier de métadonnées introuvable à {METADATA_FILE}")


Index FAISS chargé avec succès : 19 vecteurs.
Métadonnées chargées avec succès : 19 entrées.


In [16]:
import os

FAISS_INDEX_PATH = r"C:\FAISS\faiss_index.bin"
if os.path.isfile(FAISS_INDEX_PATH):
    print(f"Le fichier FAISS existe : {FAISS_INDEX_PATH}")
else:
    print(f"Erreur : Le fichier FAISS est introuvable : {FAISS_INDEX_PATH}")


Le fichier FAISS existe : C:\FAISS\faiss_index.bin


In [17]:
import faiss

FAISS_INDEX_PATH = r"C:\FAISS\faiss_index.bin"

try:
    index = faiss.read_index(FAISS_INDEX_PATH)
    print(f"Index FAISS chargé avec succès. Nombre de vecteurs : {index.ntotal}")
except Exception as e:
    print(f"Erreur lors du chargement de l'index FAISS : {e}")


Index FAISS chargé avec succès. Nombre de vecteurs : 19
