# Enrichissement Hybride LLM - Paris.fr Appels √† Projets

Ce notebook scrape ET enrichit les donn√©es avec Claude Sonnet 4.5 pour extraire:
- **Scraping complet** du site Paris.fr
- **R√©sum√©s structur√©s** via LLM
- **Montants (min/max)** extraits automatiquement
- **Cat√©gories et tags** intelligents
- **Public cible** identifi√©
- **Modalit√©s et d√©marches** structur√©es
- **Extraction PDF** des r√®glements

**Approche:** Workflow complet et ind√©pendant = Scraping + LLM Claude pour enrichissement

## 1. Imports et configuration

In [1]:
import requests
import pandas as pd
import re
from bs4 import BeautifulSoup
from datetime import datetime
import json
from urllib.parse import urljoin
import time
import os
from dotenv import load_dotenv
import tempfile
import hashlib
import itertools

# Imports LLM
from anthropic import Anthropic
import pypdf

In [2]:
# Charger les variables d'environnement
load_dotenv(override=True)

# V√©rifier Claude API key
claude_api_key = os.getenv('ANTHROPIC_API_KEY')
if claude_api_key:
    print(f"‚úÖ ANTHROPIC_API_KEY trouv√©e: {claude_api_key[:10]}...")
else:
    print(f"‚ùå ANTHROPIC_API_KEY non trouv√©e dans .env")
    print(f"   ‚ö†Ô∏è Vous devez ajouter: ANTHROPIC_API_KEY=sk-ant-xxxxxx")

‚úÖ ANTHROPIC_API_KEY trouv√©e: sk-ant-api...


## 2. Configuration scraper

In [3]:
# Configuration du scraper
BASE_URL = "https://www.paris.fr/appels-a-projets"
HEADERS = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36'
}

print(f"‚úÖ Configuration pr√™te")
print(f"   Base URL: {BASE_URL}")
print(f"   D√©pendances: requests, BeautifulSoup4, pandas, anthropic, pypdf")

‚úÖ Configuration pr√™te
   Base URL: https://www.paris.fr/appels-a-projets
   D√©pendances: requests, BeautifulSoup4, pandas, anthropic, pypdf


## 3. Scraper les appels √† projets de Paris.fr

In [4]:
# R√©cup√©rer le HTML de la page
print(f"üîÑ Fetching {BASE_URL}...")
try:
    response = requests.get(BASE_URL, headers=HEADERS, timeout=10)
    response.raise_for_status()
    html_content = response.text
    print(f"‚úÖ Page r√©cup√©r√©e ({len(html_content)} caract√®res)")
except Exception as e:
    print(f"‚ùå Erreur: {str(e)}")
    html_content = None

üîÑ Fetching https://www.paris.fr/appels-a-projets...
‚úÖ Page r√©cup√©r√©e (312287 caract√®res)


In [5]:
# Parser le HTML
if html_content:
    soup = BeautifulSoup(html_content, 'html.parser')
    print(f"‚úÖ HTML pars√© avec BeautifulSoup")
    print(f"   Titre: {soup.title.string if soup.title else 'N/A'}")
else:
    soup = None
    print("‚ö†Ô∏è Pas de contenu HTML")

‚úÖ HTML pars√© avec BeautifulSoup
   Titre: Appels √† projets - Ville de Paris


In [6]:
def scrape_paris_aap(soup):
    """Scrape les AAP du site Paris.fr"""
    aap_list = []
    
    if not soup:
        return aap_list
    
    # Chercher les conteneurs des AAP
    article_containers = soup.find_all(['article', 'div'], class_=re.compile(r'(appel|project|call|aap)', re.I))
    
    if not article_containers:
        article_containers = soup.find_all('a', href=re.compile(r'appel|project', re.I))
    
    print(f"üìù Trouv√© {len(article_containers)} conteneurs potentiels")
    
    for container in article_containers:
        try:
            aap = {}
            
            # Titre
            title_elem = container.find(['h2', 'h3', 'h4', 'a'])
            aap['titre'] = title_elem.get_text(strip=True) if title_elem else 'N/A'
            
            # URL
            if container.name == 'a':
                aap['url_source'] = urljoin(BASE_URL, container.get('href', ''))
            else:
                link = container.find('a', href=True)
                aap['url_source'] = urljoin(BASE_URL, link.get('href', '')) if link else None
            
            # Description/r√©sum√©
            desc = container.find(['p', 'span'], class_=re.compile(r'(desc|summary|excerpt)', re.I))
            aap['resume'] = desc.get_text(strip=True) if desc else None
            
            # Dates
            text_content = container.get_text(' ')
            dates = re.findall(r'\d{1,2}/\d{1,2}/\d{4}', text_content)
            if len(dates) >= 2:
                try:
                    aap['date_publication'] = pd.to_datetime(dates[0], format='%d/%m/%Y').date()
                    aap['date_limite'] = pd.to_datetime(dates[1], format='%d/%m/%Y').date()
                except:
                    aap['date_publication'] = None
                    aap['date_limite'] = None
            elif len(dates) == 1:
                try:
                    aap['date_limite'] = pd.to_datetime(dates[0], format='%d/%m/%Y').date()
                    aap['date_publication'] = None
                except:
                    aap['date_publication'] = None
                    aap['date_limite'] = None
            else:
                aap['date_publication'] = None
                aap['date_limite'] = None
            
            # Montant
            amounts = re.findall(r'(\d+[\s.,]*\d*)\s*(?:‚Ç¨|euros?|EUROS?)', text_content, re.I)
            if amounts:
                try:
                    cleaned = amounts[-1].replace(' ', '').replace('.', '').replace(',', '.')
                    aap['montant_max'] = float(cleaned)
                except:
                    aap['montant_max'] = None
            else:
                aap['montant_max'] = None
            
            # Organisme
            org = container.find(['span', 'p'], class_=re.compile(r'(organisme|provider|publisher)', re.I))
            aap['organisme'] = org.get_text(strip=True) if org else 'Mairie de Paris'
            
            # Cat√©gories
            categories_elem = container.find_all(['span', 'a'], class_=re.compile(r'(categor|tag|theme)', re.I))
            if categories_elem:
                aap['categories'] = [cat.get_text(strip=True) for cat in categories_elem]
            else:
                aap['categories'] = None
            
            # ID unique
            aap['id_record'] = f"paris_{datetime.now().strftime('%Y%m%d%H%M%S')}_{hash(aap['titre']) % 10000}"
            
            aap_list.append(aap)
        except Exception as e:
            print(f"  ‚ö†Ô∏è Erreur parsing: {str(e)}")
            continue
    
    return aap_list

# Scraper
aap_data = scrape_paris_aap(soup)
print(f"\n‚úÖ {len(aap_data)} appels √† projets extraits")

üìù Trouv√© 12 conteneurs potentiels

‚úÖ 12 appels √† projets extraits


## 4. Cr√©er et nettoyer le DataFrame

In [7]:
# Cr√©er DataFrame
mapped_df_paris = pd.DataFrame(aap_data)
print(f"üìä DataFrame cr√©√©: {mapped_df_paris.shape}")
print(f"   Colonnes: {list(mapped_df_paris.columns)}")

üìä DataFrame cr√©√©: (12, 9)
   Colonnes: ['titre', 'url_source', 'resume', 'date_publication', 'date_limite', 'montant_max', 'organisme', 'categories', 'id_record']


In [8]:
# Fonction de nettoyage du texte
def clean_text(text):
    if not isinstance(text, str):
        return text
    text = re.sub(r'<[^>]+>', '', text)
    html_entities = {
        '&eacute;': '√©', '&icirc;': '√Æ', '&ag√†;': '√†',
        '&nbsp;': ' ', '&quot;': '\"', '&amp;': '&',
        '&rsquo;': "'", '&ldquo;': '\u201c', '&rdquo;': '\u201d'
    }
    for entity, char in html_entities.items():
        text = text.replace(entity, char)
    text = re.sub(r'\s+', ' ', text)
    return text.strip()

# Appliquer le nettoyage
for col in mapped_df_paris.select_dtypes(include=['object']).columns:
    if col not in ['categories']:
        mapped_df_paris[col] = mapped_df_paris[col].apply(clean_text)

print("‚úÖ Texte nettoy√©")

‚úÖ Texte nettoy√©


In [9]:
# Ajouter colonnes manquantes
colonnes_requises = ['public_cible', 'taux_financement', 'contact', 'modalite', 'demarches', 'mots_cles', 'objectif', 'montant_min', 'note', 'tags']

for col in colonnes_requises:
    if col not in mapped_df_paris.columns:
        mapped_df_paris[col] = None

if 'perimetre_geo' not in mapped_df_paris.columns:
    mapped_df_paris['perimetre_geo'] = 'Paris'

if 'fingerprint' not in mapped_df_paris.columns:
    def create_fingerprint(row):
        titre = str(row['titre']) if pd.notna(row['titre']) else ''
        organisme = str(row['organisme']) if pd.notna(row['organisme']) else ''
        date_limite = str(row['date_limite']) if pd.notna(row['date_limite']) else ''
        combined = f"{titre}|{organisme}|{date_limite}"
        return hashlib.md5(combined.encode()).hexdigest()[:12]
    
    mapped_df_paris['fingerprint'] = mapped_df_paris.apply(create_fingerprint, axis=1)

print(f"‚úÖ DataFrame pr√©par√©: {mapped_df_paris.shape}")
print(f"   Colonnes finales: {list(mapped_df_paris.columns)}")

‚úÖ DataFrame pr√©par√©: (12, 21)
   Colonnes finales: ['titre', 'url_source', 'resume', 'date_publication', 'date_limite', 'montant_max', 'organisme', 'categories', 'id_record', 'public_cible', 'taux_financement', 'contact', 'modalite', 'demarches', 'mots_cles', 'objectif', 'montant_min', 'note', 'tags', 'perimetre_geo', 'fingerprint']


## 5. Fonctions pour extraction PDF

In [10]:
def extract_pdf_text(pdf_url, max_pages=3):
    """Extraire le texte d'un PDF depuis une URL"""
    try:
        response = requests.get(pdf_url, timeout=10)
        response.raise_for_status()
        
        with tempfile.NamedTemporaryFile(suffix='.pdf', delete=False) as tmp:
            tmp.write(response.content)
            tmp_path = tmp.name
        
        reader = pypdf.PdfReader(tmp_path)
        text = ''
        for page_num, page in enumerate(reader.pages[:max_pages]):
            text += page.extract_text() + '\n'
        
        os.remove(tmp_path)
        return text if text.strip() else None
    except Exception as e:
        print(f"  ‚ö†Ô∏è Erreur PDF {pdf_url}: {str(e)[:50]}")
        return None


def find_pdf_links(soup, base_url):
    """Trouver les liens PDF dans une page"""
    pdf_links = []
    for link in soup.find_all('a', href=True):
        href = link.get('href', '')
        text = link.get_text().lower()
        
        if ('pdf' in href.lower() or 
            any(keyword in text for keyword in ['reglement', 'document', 'cahier', 'guide'])):
            full_url = urljoin(base_url, href)
            if full_url not in pdf_links:
                pdf_links.append(full_url)
    
    return pdf_links[:2]

print("‚úÖ Fonctions PDF cr√©√©es")

‚úÖ Fonctions PDF cr√©√©es


## 6. Classe LLMEnricher

In [12]:
class LLMEnricher:
    """Enrichir les donn√©es AAP avec Claude Sonnet 4.5"""
    
    def __init__(self, api_key=None, model='claude-sonnet-4-5'):
        self.api_key = api_key or os.getenv('ANTHROPIC_API_KEY')
        self.model = model
        self.client = Anthropic(api_key=self.api_key) if self.api_key else None
        self.max_retries = 3
        self.retry_delay = 1
        
        if not self.client:
            raise ValueError('‚ùå ANTHROPIC_API_KEY non trouv√©e')
    
    def extract_full_page(self, url, html_content, pdf_texts=None):
        """Extraire toutes les donn√©es manquantes d'une page avec retry logic"""
        
        if not self.client:
            return None
        
        soup = BeautifulSoup(html_content, 'html.parser')
        text_content = soup.get_text('\n')
        
        if pdf_texts:
            text_content += '\n\n--- DOCUMENTS PDF ---\n'
            text_content += '\n\n'.join(pdf_texts)
        
        text_content = text_content[:16000]
        
        prompt = f"""Tu es un expert en analyse d'appels √† projets parisiens.
        
Analyse cette page et extrais les informations manquantes en JSON valide:

{{
   "resume": "R√©sum√© en 1-2 phrases (max 300 caract√®res)",
  "montant_max": montant maximum en euros (nombre ou null),
  "montant_min": montant minimum en euros (nombre ou null),
  "taux_financement": "pourcentage ou description (null si non trouv√©)",
  "categories": ["liste", "de", "cat√©gories"],
  "public_cible": ["associations", "PME", "collectivit√©s"],
  "mots_cles": ["mots-cl√©s", "pertinents"],
  "objectif": "Quel est l'objectif principal",
  "modalite": "Conditions principales",
  "demarches": "Comment candidater",
  "contact": "Email ou t√©l√©phone si trouv√© (ou null)"
}}

IMPORTANT:
- Retourne UNIQUEMENT du JSON valide
- Si une info n'existe pas, mets null
- Les montants doivent √™tre des nombres
- Les listes doivent √™tre des arrays JSON

Contenu:
{text_content}"""
        
        for attempt in range(self.max_retries):
            try:
                message = self.client.messages.create(
                    model=self.model,
                    max_tokens=1024,
                    messages=[{"role": "user", "content": prompt}]
                )
                
                response_text = message.content[0].text
                response_text = response_text.replace('```json', '').replace('```', '')
                
                return json.loads(response_text.strip())
            except json.JSONDecodeError as e:
                print(f"    ‚ùå JSON parsing error: {str(e)[:50]}")
                return None
            except Exception as e:
                error_msg = str(e)
                print(f"    ‚ùå Attempt {attempt + 1}/{self.max_retries} - Error: {error_msg[:80]}")
                if attempt < self.max_retries - 1:
                    wait_time = self.retry_delay * (2 ** attempt)
                    print(f"    ‚è≥ Retrying in {wait_time}s...")
                    time.sleep(wait_time)
                else:
                    print(f"    ‚ùå Max retries exceeded")
                    return None

print("‚úÖ Classe LLMEnricher cr√©√©e")

‚úÖ Classe LLMEnricher cr√©√©e


## 7.5 Aper√ßu des PDFs extraits

In [13]:
# Afficher un aper√ßu des PDFs avant le LLM
if mapped_df_paris is not None and len(mapped_df_paris) > 0:
    print("üìÑ Aper√ßu de l'extraction PDF:")
    print("="*80)
    
    pdf_preview_data = []
    
    for idx, row in itertools.islice(mapped_df_paris.iterrows(), 3):  # Limiter √† 3 aper√ßus
        url = row.get('url_source')
        titre = str(row.get('titre', 'N/A'))[:50]
        
        if not url or pd.isna(url):
            continue
        
        try:
            response = requests.get(url, headers=HEADERS, timeout=10)
            response.raise_for_status()
            
            soup = BeautifulSoup(response.text, 'html.parser')
            pdf_links = find_pdf_links(soup, url)
            
            if pdf_links:
                print(f"\nüìå {titre}")
                print(f"   URL: {url[:60]}...")
                print(f"   PDFs trouv√©s: {len(pdf_links)}")
                
                for pdf_idx, pdf_url in enumerate(pdf_links, 1):
                    pdf_filename = pdf_url.split('/')[-1][:50]
                    print(f"   \n   {pdf_idx}Ô∏è‚É£ {pdf_filename}")
                    print(f"      URL: {pdf_url[:70]}...")
                    
                    pdf_text = extract_pdf_text(pdf_url, max_pages=1)
                    if pdf_text:
                        text_preview = pdf_text[:200].replace('\n', ' ').strip()
                        print(f"      Contenu (1√®re page): {text_preview}...")
                    else:
                        print(f"      ‚ùå Impossible d'extraire le texte")
        except Exception as e:
            print(f"\n‚ö†Ô∏è  Erreur pour {titre}: {str(e)[:50]}")
        
        time.sleep(0.5)
    
    print("\n" + "="*80)
    print("‚úÖ Aper√ßu termin√© - Pr√™t pour l'enrichissement LLM")

üìÑ Aper√ßu de l'extraction PDF:

üìå Appel √† projets pour le partage de la culture scie
   URL: https://www.paris.fr/pages/appel-a-projets-2024-pour-le-part...
   PDFs trouv√©s: 2
   
   1Ô∏è‚É£ budget-type-aapcs2026-v4Hz.pdf
      URL: https://cdn.paris.fr/paris/2025/12/23/budget-type-aapcs2026-v4Hz.pdf...
      Contenu (1√®re page): Document type √† t√©l√©charger, √† compl√©ter,   puis √† joindre au dossier de candidature    Budget pr√©visionnel du projet      CHARGES MONTANT PRODUITS MONTANT  Achats   Recette des activit√©s   Prestation...
   
   2Ô∏è‚É£ aap_culture-scientifique_2026-DqVw.pdf
      URL: https://cdn.paris.fr/paris/2025/12/23/aap_culture-scientifique_2026-Dq...
      Contenu (1√®re page): o  o  o...

üìå Appel √† projets ¬´ Pr√©venir les conduites √† risques
   URL: https://www.paris.fr/pages/appel-a-projets-prevenir-les-cond...
   PDFs trouv√©s: 2
   
   1Ô∏è‚É£ aap_2026-2027_demarche-foyers-mmpcr-2-kzeJ.pdf
      URL: https://cdn.paris.fr/paris/2025/12/16/aap_2

## 8. Initialiser l'enrichisseur LLM

In [14]:
try:
    enricher = LLMEnricher()
    print("‚úÖ LLMEnricher initialis√©")
    print(f"   Mod√®le: claude-sonnet-4-5")
    print(f"   Retry logic: Enabled (max 3 attempts with exponential backoff)")
except ValueError as e:
    print(f"‚ùå {str(e)}")
    enricher = None

‚úÖ LLMEnricher initialis√©
   Mod√®le: claude-sonnet-4-5
   Retry logic: Enabled (max 3 attempts with exponential backoff)


## 9. Enrichir avec LLM

In [15]:
if enricher and mapped_df_paris is not None and len(mapped_df_paris) > 0:
    print(f"üîÑ Enrichissement de {len(mapped_df_paris)} appels √† projets...\n")
    
    for idx, row in mapped_df_paris.iterrows():
        url = row.get('url_source')
        titre = str(row.get('titre', 'N/A'))[:50]
        
        if not url or pd.isna(url):
            print(f"‚è≠Ô∏è  [{idx+1}/{len(mapped_df_paris)}] {titre}: pas d'URL")
            continue
        
        print(f"üîÑ [{idx+1}/{len(mapped_df_paris)}] {titre}...", end=' ')
        
        try:
            response = requests.get(url, headers=HEADERS, timeout=10)
            response.raise_for_status()
            
            soup = BeautifulSoup(response.text, 'html.parser')
            pdf_links = find_pdf_links(soup, url)
            
            pdf_texts = []
            if pdf_links:
                print(f"(+{len(pdf_links)} PDFs)", end=' ')
                for pdf_url in pdf_links:
                    pdf_text = extract_pdf_text(pdf_url)
                    if pdf_text:
                        pdf_texts.append(pdf_text[:3000])
            
            extracted = enricher.extract_full_page(url, response.text, pdf_texts)
            
            if extracted:
                for key, value in extracted.items():
                    if key in mapped_df_paris.columns:
                        mapped_df_paris.at[idx, key] = value
                print("‚úÖ")
            else:
                print("‚ö†Ô∏è  Aucune donn√©e")
                
        except requests.exceptions.Timeout:
            print("‚è±Ô∏è  Timeout")
        except Exception as e:
            print(f"‚ùå {str(e)[:30]}")
        
        time.sleep(1)
    
    print(f"\n‚úÖ Enrichissement termin√©!")
else:
    if enricher is None:
        print("‚ùå Enrichisseur LLM non disponible")
    if mapped_df_paris is None:
        print("‚ùå Pas de donn√©es")

üîÑ Enrichissement de 12 appels √† projets...

üîÑ [1/12] Les appels √† projets de la Ville de Paris... ‚úÖ
üîÑ [2/12] Appel √† projets pour le partage de la culture scie... (+2 PDFs) ‚úÖ
üîÑ [3/12] Appel √† projets ¬´ Pr√©venir les conduites √† risques... (+2 PDFs) ‚úÖ
üîÑ [4/12] Appel √† projets ¬´ Paris Fabrik ¬ª : formations prof... (+2 PDFs) ‚úÖ
üîÑ [5/12] Appel √† projets immobiliers 2026 pour des lieux de... (+1 PDFs) ‚úÖ
üîÑ [6/12] Appel √† propositions pour un emplacement commercia... (+2 PDFs) ‚úÖ
üîÑ [7/12] Appel √† projets ¬´ Parcours linguistiques √† vis√©e p... (+2 PDFs) 

invalid pdf header: b'<!DOC'
EOF marker not found


  ‚ö†Ô∏è Erreur PDF https://www.paris.fr/pages/appel-a-projets-parcours-linguistiques-a-visee-professionnelle-plvp-2020-7465#reglement-documents-de-candidatures-et-faq: Stream has ended unexpectedly
‚úÖ
üîÑ [8/12] Appel √† projets : Actions de pr√©vention de la pert... (+2 PDFs) ‚úÖ
üîÑ [9/12] Appel √† projets des activit√©s p√©ri et extrascolair... (+2 PDFs) ‚úÖ
üîÑ [10/12] Appel √† projets des temps d'activit√©s p√©riscolaire... (+2 PDFs) ‚úÖ
üîÑ [11/12] N/A... ‚úÖ
üîÑ [12/12] N/A... ‚úÖ

‚úÖ Enrichissement termin√©!


## 10. Statistiques et aper√ßu

In [16]:
if mapped_df_paris is not None:
    print("üìä Statistiques:")
    print(f"\n‚úÖ Total: {len(mapped_df_paris)} enregistrements")
    print(f"\n‚úÖ Remplissage:")
    for col in ['titre', 'resume', 'montant_max', 'montant_min', 'categories', 'public_cible', 'mots_cles', 'objectif']:
        if col in mapped_df_paris.columns:
            filled = mapped_df_paris[col].notna().sum()
            pct = (filled / len(mapped_df_paris) * 100) if len(mapped_df_paris) > 0 else 0
            print(f"   - {col}: {filled}/{len(mapped_df_paris)} ({pct:.1f}%)")

üìä Statistiques:

‚úÖ Total: 12 enregistrements

‚úÖ Remplissage:
   - titre: 12/12 (100.0%)
   - resume: 12/12 (100.0%)
   - montant_max: 1/12 (8.3%)
   - montant_min: 1/12 (8.3%)
   - categories: 12/12 (100.0%)
   - public_cible: 12/12 (100.0%)
   - mots_cles: 12/12 (100.0%)
   - objectif: 12/12 (100.0%)


In [17]:
if mapped_df_paris is not None and len(mapped_df_paris) > 0:
    print("\nüìã Aper√ßu:")
    print("\n" + "="*80)
    for idx in range(min(2, len(mapped_df_paris))):
        row = mapped_df_paris.iloc[idx]
        print(f"\nüìå {row['titre'][:60]}")
        print(f"   Org: {row['organisme']}")
        print(f"   Montant: {row['montant_max']}‚Ç¨")
        if pd.notna(row['resume']):
            print(f"   R√©sum√©: {str(row['resume'])[:100]}...")


üìã Aper√ßu:


üìå Les appels √† projets de la Ville de Paris
   Org: Mairie de Paris
   Montant: None‚Ç¨
   R√©sum√©: La Ville de Paris propose divers appels √† projets pour associations et structures : TAP, r√©sidences ...

üìå Appel √† projets pour le partage de la culture scientifique 2
   Org: Mairie de Paris
   Montant: 19000‚Ç¨
   R√©sum√©: Appel √† projets pour le partage de la culture scientifique √† Paris en 2026. Favorise la diffusion de...


In [19]:
# Vue tabulaire simple
mapped_df_paris.to_string()

# Vue HTML interactive (meilleure pour Jupyter)
from IPython.display import HTML
display(HTML(mapped_df_paris.to_html()))

# Vue transpos√©e (une ligne = une colonne)
mapped_df_paris.T

Unnamed: 0,titre,url_source,resume,date_publication,date_limite,montant_max,organisme,categories,id_record,public_cible,taux_financement,contact,modalite,demarches,mots_cles,objectif,montant_min,note,tags,perimetre_geo,fingerprint
0,Les appels √† projets de la Ville de Paris,https://www.paris.fr/pages/repondre-a-un-appel-a-projets-5412,"La Ville de Paris propose divers appels √† projets pour associations et structures : TAP, r√©sidences artistiques, ESS, pr√©vention, animation locale, culture scientifique, formations √©cologiques et animation de kiosques.",,,,Mairie de Paris,"[√âducation, Culture, Jeunesse, Solidarit√©, √âconomie sociale et solidaire, Pr√©vention, Animation locale, Formation professionnelle, Transition √©cologique, Culture scientifique]",paris_20260102203048_4825,"[associations, √©tablissements publics, fondations, SIAE, ESUS, coop√©ratives]",,,D√©p√¥t de candidature via la plateforme Paris Asso dans les d√©lais impartis pour chaque appel √† projets. Les projets doivent s'inscrire dans le cadre d√©fini par l'appel. Instruction technique puis s√©lection selon les crit√®res du r√®glement.,"Enregistrer votre association sur Paris Asso, consulter les appels √† projets en cours, d√©poser votre candidature en ligne avant la date limite sp√©cifique √† chaque appel","[appel √† projets, Paris, associations, TAP, p√©riscolaire, r√©sidences artistiques, Art pour grandir, ESS, troph√©es, pr√©vention rixes, fonds animation locale, parcours linguistiques, culture scientifique, conduites √† risques, Paris Fabrik, transition √©cologique, kiosques, jeunesse]","Soutenir financi√®rement des projets associatifs et d'utilit√© sociale dans divers domaines (√©ducation, culture, jeunesse, solidarit√©, ESS, pr√©vention) r√©pondant aux probl√©matiques d√©finies par la Ville de Paris",,,,Paris,bf30bdb77246
1,Appel √† projets pour le partage de la culture scientifique 2026 √† Paris,https://www.paris.fr/pages/appel-a-projets-2024-pour-le-partage-de-la-culture-scientifique-a-paris-25958,Appel √† projets pour le partage de la culture scientifique √† Paris en 2026. Favorise la diffusion de la culture scientifique aupr√®s du grand public parisien.,,2026-02-11,19000.0,Mairie de Paris,"[Culture, Sciences, Recherche, Education, M√©diation scientifique]",paris_20260102203048_4099,"[associations, coop√©ratives, fondations, organismes publics, organismes de recherche, universit√©s]",Cofinancement obligatoire,,"Projets devant d√©marrer avant fin d√©cembre 2026, se d√©rouler √† Paris, s'adresser au grand public. Cofinancement obligatoire. Budget total de 150 000 ‚Ç¨ r√©parti entre les laur√©ats. Annexe AAPCS 2026 obligatoire.",D√©p√¥t d√©mat√©rialis√© via le service Subventions du portail Paris Asso avant le mercredi 11 f√©vrier 2026 √† 23h59. Une seule candidature par structure. Joindre l'annexe AAPCS 2026 et un compte-rendu financier si financ√© en 2025.,"[culture scientifique, recherche, grand public, Paris Recherche, m√©diation scientifique, jeunes publics, pluridisciplinarit√©, sciences humaines et sociales]",Favoriser le partage de la culture scientifique √† travers le financement de projets mis en ≈ìuvre en 2026 sur le territoire parisien dans le cadre de la strat√©gie Paris Recherche,1000.0,,,Paris,305e6ffab869
2,Appel √† projets ¬´ Pr√©venir les conduites √† risques dans les √©tablissements accueillant des adolescents et jeunes majeurs en situation de placement ¬ª,https://www.paris.fr/pages/appel-a-projets-prevenir-les-conduites-a-risques-dans-les-etablissements-accueillant-des-adolescents-et-jeunes-majeurs-en-situation-de-placement-33349,"Appel √† projets pour renforcer la pr√©vention des conduites √† risques (addictions, num√©rique, vie affective) aupr√®s des jeunes en situation de placement et des √©quipes qui les accompagnent.",2025-12-16,2026-02-16,,Mairie de Paris,"[Sant√© publique, Pr√©vention, Protection de l'enfance, Action sociale]",paris_20260102203048_1575,"[associations, structures de pr√©vention, √©tablissements d'accueil, structures intervenant aupr√®s des 13-21 ans]",,melissa.hadoux@paris.fr ou isabelle.jeannes@paris.fr,"Interventions sur site et sur mesure avec diagnostic pr√©alable, actions r√©guli√®res aupr√®s des professionnels et des jeunes accueillis, implication des √©quipes et des jeunes, travail en r√©seau entre pr√©venteurs. Th√©matiques : vie affective/relationnelle/sexuelle, consommations de produits psychoactifs, usages √† risque du num√©rique",D√©p√¥t d√©mat√©rialis√© uniquement sur la plateforme Paris Subventions. Enregistrement pr√©alable sur Paris Asso pour les primo-demandeurs. Date limite : 16 f√©vrier 2026 inclus,"[conduites √† risques, protection de l'enfance, adolescents, jeunes majeurs, pr√©vention, addictions, produits psychoactifs, vie affective et sexuelle, usages du num√©rique, comp√©tences psychosociales, √©tablissements d'accueil, placement]","Renforcer les comp√©tences psycho-sociales des mineurs et jeunes majeurs accueillis ainsi que celles des √©quipes qui les accompagnent, et inscrire la pr√©vention des conduites √† risques dans les projets d'√©tablissements de protection de l'enfance",,,,Paris,695a6626f45a
3,Appel √† projets ¬´ Paris Fabrik ¬ª : formations professionnelles aux m√©tiers de la transition √©cologique,https://www.paris.fr/pages/appel-a-projets-parisfabrik-5-20455,"Appel √† projets pour formations aux m√©tiers de la transition √©cologique (√©coconstruction, √©nergies renouvelables, √©conomie circulaire, mobilit√©s douces) destin√©es aux Parisien¬∑ne¬∑s √©loign√©¬∑e¬∑s de l'emploi.",2025-12-15,2026-02-19,,Mairie de Paris,"[Formation professionnelle, Transition √©cologique, Emploi, Insertion professionnelle]",paris_20260102203048_4708,"[Organismes de formation, Associations, Structures ESS, Consortiums d'acteurs, Entreprises (partenaires), OPCO, Campus des m√©tiers]",,dae-parisfabrik@paris.fr,Formation certifiante ou qualifiante aux m√©tiers verts. Certification Qualiopi requise. D√©p√¥t d√©mat√©rialis√© sur Paris Asso. Possibilit√© de co-portage de projet. Innovation p√©dagogique et lien avec les entreprises privil√©gi√©s.,"Candidater uniquement en ligne sur la plateforme Paris Asso avant le 19 f√©vrier 2026 (23h59). Cr√©er un compte si n√©cessaire, compl√©ter le formulaire et joindre le dossier de candidature avec tous les documents requis.","[Paris Fabrik, transition √©cologique, √©coconstruction, r√©novation √©nerg√©tique, √©nergies renouvelables, √©conomie circulaire, mobilit√©s douces, fabrication artisanale durable, emplois verts, formation professionnelle, certification Qualiopi, Parisiens √©loign√©s de l'emploi]","Former les Parisien¬∑ne¬∑s √©loign√©¬∑e¬∑s de l'emploi aux m√©tiers porteurs de la transition √©cologique, favoriser la mont√©e en comp√©tences et l'acc√®s √† l'emploi dans les fili√®res vertes en tension",,,,Paris,26a2db5b180d
4,"Appel √† projets immobiliers 2026 pour des lieux de collecte, transformation, production, vente et logistique pour une √©conomie solidaire et engag√©e √† Paris",https://www.paris.fr/pages/appel-a-projets-immobiliers-dans-le-19e-des-locaux-pour-des-activites-circulaires-de-l-economie-sociale-et-solidaire-24205,Appel √† projets pour aider les op√©rateurs immobiliers √† installer des acteurs de l'ESS dans l'√©conomie circulaire et l'alimentation durable √† Paris.,2026-12-10,2026-04-02,,Mairie de Paris,"[Economie sociale et solidaire, Economie circulaire, Alimentation durable, Immobilier, Transition √©cologique]",paris_20260102203048_5197,"[Bailleurs, Fonci√®res, Promoteurs, Op√©rateurs immobiliers]",,,"Projets immobiliers (achat, construction, r√©novation, r√©habilitation) sur le territoire parisien ou √† son b√©n√©fice, dans les secteurs prioritaires : alternatives aux plastiques √† usage unique, allongement dur√©e de vie √©quipements √©lectroniques/ameublement/textiles, mobilit√© et logistique douce, transformation alimentaire, circuits courts",D√©poser le dossier de candidature sur la plateforme Paris Subventions avant le 2 avril 2026 (1√®re vague) ou le 9 juillet 2026 (2√®me vague sous r√©serve de disponibilit√©). Documents √† joindre d√©taill√©s dans le r√®glement t√©l√©chargeable.,"[√©conomie sociale et solidaire, ESS, √©conomie circulaire, alimentation durable, immobilier, r√©emploi, r√©paration, circuits courts, plastiques usage unique, reconditionnement, logistique douce, transformation alimentaire]",Identifier un projet immobilier pour h√©berger une association ou entreprise de l'ESS portant sur l'√©conomie circulaire ou l'alimentation durable √† Paris,,,,Paris,9a510f3b0fdd
5,Appel √† propositions pour un emplacement commercial 115 Avenue des Champs Elys√©es (8e),https://www.paris.fr/pages/appel-a-propositions-pour-un-emplacement-commercial-115-avenue-des-champs-elysees-8e-arrondissement-33265,"Appel √† propositions pour un emplacement commercial au 115 Avenue des Champs Elys√©es (8e) d√©di√© √† une activit√© exp√©rimentale 2.0 (visite virtuelle, lab kiosque, start-up, espace 3D, √©crans serviciels).",2025-12-05,2026-01-14,,Mairie de Paris,"[Commerce, Innovation, Num√©rique, Occupation du domaine public]",paris_20260102203048_9238,"[Entreprises, Start-ups, Professionnels]",,,"Autorisation d'occupation du domaine public pour 5 ans. Redevance minimale garantie avec possibilit√© de proposition sup√©rieure. √âvaluation sur 3 crit√®res : qualit√© du projet (55%), d√©veloppement durable (15%), crit√®re financier. Visite de l'emplacement fortement conseill√©e. Candidature uniquement en ligne via plateforme Agorize.",1. Consulter le guide du candidat. 2. Suivre le lien vers la plateforme Agorize (aap-bka-bee.agorize.com). 3. Remplir le formulaire en ligne avec informations administratives et pr√©sentation du projet. Date limite : 14 janvier 2026 √† 12h00.,"[emplacement commercial, Champs Elys√©es, exp√©rimental 2.0, visite virtuelle, lab kiosque, start-up, espace 3D, √©crans serviciels, domaine public, innovation num√©rique]",Attribution d'une autorisation d'occupation du domaine public pour une activit√© exp√©rimentale 2.0 au 115 Avenue des Champs Elys√©es,,,,Paris,a118aa97ec7c
6,Appel √† projets ¬´ Parcours linguistiques √† vis√©e professionnelle ¬ª (PLVP) 2026,https://www.paris.fr/pages/appel-a-projets-parcours-linguistiques-a-visee-professionnelle-plvp-2020-7465,Appel √† projets pour des formations linguistiques √† vis√©e professionnelle destin√©es aux Parisiens en recherche d'emploi dont la ma√Ætrise du fran√ßais constitue un frein √† l'insertion.,2025-12-04,2026-02-03,,Mairie de Paris,"[Emploi, Formation, Insertion professionnelle, Apprentissage du fran√ßais, Inclusion sociale]",paris_20260102203048_6556,"[Associations, Fondations, √âtablissements publics, Entreprises ESS agr√©√©es ESUS, Soci√©t√©s coop√©ratives (SCOP, SCIC)]",,plvp@paris.fr,"Les actions doivent constituer une √©tape interm√©diaire entre des cours de fran√ßais classiques et les dispositifs de formation qualifiants. Public prioritaire : habitants des quartiers populaires parisiens, femmes, allocataires du RSA. Candidature d√©mat√©rialis√©e uniquement via Parisasso.",D√©p√¥t d√©mat√©rialis√© sur Parisasso entre le 4 d√©cembre 2025 et le 3 f√©vrier 2026 √† 23h59. Remplir une demande en ligne et le dossier de candidature PLVP 2026 (format Word √† demander par mail). R√©union d'information le 18 d√©cembre 2025 √† 15h30.,"[langue fran√ßaise, formation linguistique, insertion professionnelle, parcours linguistiques, PLVP, chercheurs d'emploi, quartiers prioritaires, RSA, femmes, savoirs de base]","Permettre la mise en place de formations alliant am√©lioration de la ma√Ætrise du fran√ßais, connaissance du monde du travail en France et travail sur le projet professionnel pour favoriser l'acc√®s ou le retour √† l'emploi durable, l'√©volution professionnelle ou l'acc√®s √† des formations qualifiantes.",,,,Paris,48c5cd1dfab4
7,Appel √† projets : Actions de pr√©vention de la perte d‚Äôautonomie des s√©niors parisiens,https://www.paris.fr/pages/appel-a-projets-actions-de-prevention-de-la-perte-d-autonomie-des-seniors-parisiens-a-paris-33034,"Appel √† projets pour soutenir des actions de pr√©vention de la perte d'autonomie destin√©es aux seniors parisiens de 60 ans et plus, avec attention particuli√®re aux plus fragiles et isol√©s.",2025-11-21,2026-01-09,,Mairie de Paris,"[Social, Sant√©, Pr√©vention, Seniors, Autonomie]",paris_20260102203048_2858,"[associations, fondations, gestionnaires de r√©sidences sociales, centres d'h√©bergement, pensions de famille]",,dsol-conferencefinanceurs@paris.fr,"Projets favorisant le maintien en autonomie des seniors, partenariaux et r√©pondant aux besoins des territoires. Souscription au contrat d'engagement r√©publicain obligatoire. Documents √† fournir : formulaire de candidature, budget pr√©visionnel du projet et de la structure, attestations.","D√©p√¥t du dossier via formulaire en ligne avant le 9 janvier 2026 √† 18h. T√©l√©charger et compl√©ter les documents (formulaire candidature, budget pr√©visionnel, attestations), puis enregistrer la candidature en ligne en une seule fois.","[seniors, pr√©vention, perte d'autonomie, vieillissement, maintien √† domicile, personnes √¢g√©es, 60 ans et plus, fragilit√©, isolement, proximit√©, territorialisation]","Proposer aux seniors parisiens une offre de pr√©vention diversifi√©e et territorialis√©e de la perte d'autonomie, avec une attention sp√©cifique sur les seniors les plus fragiles et isol√©s, dans une logique de proximit√© et d'am√©lioration de la couverture territoriale",,,,Paris,d3856d2a3933
8,Appel √† projets des activit√©s p√©ri et extrascolaires ¬´ Renouvellement urbain ¬ª,https://www.paris.fr/pages/appel-a-projets-des-activites-peri-et-extrascolaires-renouvellement-urbain-16541,Appel √† projets pour des ateliers p√©dagogiques favorisant l'appropriation des changements urbains par les √©l√®ves d'√©coles et coll√®ges situ√©s en quartiers NPNRU.,2025-11-03,2026-01-05,,Mairie de Paris,"[√âducation, Urbanisme, P√©riscolaire, Renouvellement urbain]",paris_20260102203048_6092,"[associations, organismes √©ducatifs, √©tablissements scolaires]",,dasco-tap@paris.fr,"Ateliers co-construits avec l'√©quipe d'animation et l'√©quipe de d√©veloppement local, durant l'ann√©e scolaire 2026-2027, sur temps p√©riscolaire (TAP mardi/vendredi 15h-16h30, midi) ou extrascolaire (centres de loisirs, mercredis, vacances)",D√©p√¥t des candidatures uniquement sur la plateforme Paris Asso du 3 novembre 2025 au 5 janvier 2026 inclus. S'enregistrer sur Paris Asso en amont. Pi√®ces √† t√©l√©charger disponibles sur la page.,"[NPNRU, renouvellement urbain, activit√©s p√©riscolaires, extrascolaire, √©coles, coll√®ges, architecture, urbanisme, enfants, √©ducation, Paris]",Favoriser l'appropriation des changements du quartier et la participation des enfants √† l'√©volution de leur environnement urbain √† travers des ateliers ludiques et p√©dagogiques,,,,Paris,93400ca4e149
9,Appel √† projets des temps d'activit√©s p√©riscolaires (TAP),https://www.paris.fr/pages/appel-a-projets-des-temps-d-activites-periscolaires-tap-16522,"Appel √† projets pour l'organisation d'ateliers p√©dagogiques durant les temps d'activit√©s p√©riscolaires dans les √©coles maternelles et √©l√©mentaires parisiennes, les mardis et vendredis de 15h √† 16h30.",2025-11-03,2026-01-05,,Mairie de Paris,"[√âducation, P√©riscolaire, Enfance, Animation, Activit√©s p√©dagogiques]",paris_20260102203048_8528,"[associations, organismes proposant des ateliers p√©riscolaires]",,dasco-tap@paris.fr,"Projet co-construit avec le Responsable √âducatif Ville, attestation de co-construction obligatoire. Ateliers attractifs et ludiques sur diverses th√©matiques (arts num√©riques, sciences, environnement, sant√©, JO 2024, √©veil culturel). Maximum 10 projets par porteur. S√©lection apr√®s analyse p√©dagogique et financi√®re, puis commission d'arrondissement.","D√©p√¥t exclusivement via la plateforme Paris Asso du 3 novembre 2025 au 5 janvier 2026 inclus. Enregistrement pr√©alable n√©cessaire. Fournir : fiche technique d'atelier, budget pr√©visionnel, attestation de co-construction sign√©e par le REV, documents administratifs et financiers.","[TAP, temps d'activit√©s p√©riscolaires, √©coles maternelles, √©coles √©l√©mentaires, ateliers p√©dagogiques, co-construction, responsable √©ducatif ville, projet √©ducatif territorial, arts num√©riques, sciences, environnement, sant√©, bien-√™tre, √©veil culturel]","Compl√©ter l'offre d'ateliers ludo-√©ducatifs p√©riscolaires propos√©s aux √©l√®ves des √©coles parisiennes par des projets innovants co-construits avec les √©quipes d'animation, r√©pondant aux besoins locaux sp√©cifiques de chaque √©cole",,,,Paris,b4a85cc0bda7


Unnamed: 0,0,1,2,3,4,5,6,7,8,9,10,11
titre,Les appels √† projets de la Ville de Paris,Appel √† projets pour le partage de la culture ...,Appel √† projets ¬´ Pr√©venir les conduites √† ris...,Appel √† projets ¬´ Paris Fabrik ¬ª : formations ...,Appel √† projets immobiliers 2026 pour des lieu...,Appel √† propositions pour un emplacement comme...,Appel √† projets ¬´ Parcours linguistiques √† vis...,Appel √† projets : Actions de pr√©vention de la ...,Appel √† projets des activit√©s p√©ri et extrasco...,Appel √† projets des temps d'activit√©s p√©riscol...,,
url_source,https://www.paris.fr/pages/repondre-a-un-appel...,https://www.paris.fr/pages/appel-a-projets-202...,https://www.paris.fr/pages/appel-a-projets-pre...,https://www.paris.fr/pages/appel-a-projets-par...,https://www.paris.fr/pages/appel-a-projets-imm...,https://www.paris.fr/pages/appel-a-proposition...,https://www.paris.fr/pages/appel-a-projets-par...,https://www.paris.fr/pages/appel-a-projets-act...,https://www.paris.fr/pages/appel-a-projets-des...,https://www.paris.fr/pages/appel-a-projets-des...,https://www.paris.fr/appels-a-projets?page=2,https://www.paris.fr/appels-a-projets?page=2
resume,La Ville de Paris propose divers appels √† proj...,Appel √† projets pour le partage de la culture ...,Appel √† projets pour renforcer la pr√©vention d...,Appel √† projets pour formations aux m√©tiers de...,Appel √† projets pour aider les op√©rateurs immo...,Appel √† propositions pour un emplacement comme...,Appel √† projets pour des formations linguistiq...,Appel √† projets pour soutenir des actions de p...,Appel √† projets pour des ateliers p√©dagogiques...,Appel √† projets pour l'organisation d'ateliers...,Page regroupant les appels √† projets de la Vil...,Page regroupant les diff√©rents appels √† projet...
date_publication,,,2025-12-16,2025-12-15,2026-12-10,2025-12-05,2025-12-04,2025-11-21,2025-11-03,2025-11-03,,
date_limite,,2026-02-11,2026-02-16,2026-02-19,2026-04-02,2026-01-14,2026-02-03,2026-01-09,2026-01-05,2026-01-05,,
montant_max,,19000,,,,,,,,,,
organisme,Mairie de Paris,Mairie de Paris,Mairie de Paris,Mairie de Paris,Mairie de Paris,Mairie de Paris,Mairie de Paris,Mairie de Paris,Mairie de Paris,Mairie de Paris,Mairie de Paris,Mairie de Paris
categories,"[√âducation, Culture, Jeunesse, Solidarit√©, √âco...","[Culture, Sciences, Recherche, Education, M√©di...","[Sant√© publique, Pr√©vention, Protection de l'e...","[Formation professionnelle, Transition √©cologi...","[Economie sociale et solidaire, Economie circu...","[Commerce, Innovation, Num√©rique, Occupation d...","[Emploi, Formation, Insertion professionnelle,...","[Social, Sant√©, Pr√©vention, Seniors, Autonomie]","[√âducation, Urbanisme, P√©riscolaire, Renouvell...","[√âducation, P√©riscolaire, Enfance, Animation, ...","[Recherche, Jeunesse, Culture, Vie associative...","[Appels √† projets, Culture, Jeunesse, Vacances..."
id_record,paris_20260102203048_4825,paris_20260102203048_4099,paris_20260102203048_1575,paris_20260102203048_4708,paris_20260102203048_5197,paris_20260102203048_9238,paris_20260102203048_6556,paris_20260102203048_2858,paris_20260102203048_6092,paris_20260102203048_8528,paris_20260102203048_942,paris_20260102203048_942
public_cible,"[associations, √©tablissements publics, fondati...","[associations, coop√©ratives, fondations, organ...","[associations, structures de pr√©vention, √©tabl...","[Organismes de formation, Associations, Struct...","[Bailleurs, Fonci√®res, Promoteurs, Op√©rateurs ...","[Entreprises, Start-ups, Professionnels]","[Associations, Fondations, √âtablissements publ...","[associations, fondations, gestionnaires de r√©...","[associations, organismes √©ducatifs, √©tablisse...","[associations, organismes proposant des atelie...","[Associations, Professionnels, Artistes, Coll√©...","[Professionnels, Associations, Artistes, Coll√©..."


## 11. Exporter les donn√©es

In [None]:
if mapped_df_paris is not None:
    # Exporter en CSV
    csv_output = '../data/paris_aap_enriched.csv'
    try:
        os.makedirs(os.path.dirname(csv_output), exist_ok=True)
        mapped_df_paris.to_csv(csv_output, index=False, encoding='utf-8')
        print(f"‚úÖ Export√© en CSV: {csv_output}")
    except Exception as e:
        print(f"‚ö†Ô∏è  Erreur CSV: {str(e)}")
    
    # Exporter en JSON
    json_output = '../data/paris_aap_enriched.json'
    try:
        os.makedirs(os.path.dirname(json_output), exist_ok=True)
        df_for_json = mapped_df_paris.copy()
        for col in df_for_json.columns:
            if df_for_json[col].dtype == 'object':
                df_for_json[col] = df_for_json[col].astype(str)
        
        df_for_json.to_json(json_output, orient='records', force_ascii=False, indent=2)
        print(f"‚úÖ Export√© en JSON: {json_output}")
    except Exception as e:
        print(f"‚ö†Ô∏è  Erreur JSON: {str(e)}")

## 12. Upload Airtable (optionnel)

In [None]:
if mapped_df_paris is not None:
    # D√©commentez pour uploader
    # from appels_a_projets.connectors.airtable_connector import AirtableConnector
    # 
    # airtable = AirtableConnector()
    # uploaded = airtable.upload_dataframe(mapped_df_paris)
    # print(f"‚úÖ Uploaded {uploaded} records to Airtable!")
    
    print("‚è∏Ô∏è  Upload Airtable optionnel (d√©commenter si besoin)")