# üîç Scraper Wikidata - Recherche d'entit√©s

**Auteur:** May8326  
**Date:** 2025-07-02  
**Description:** Outil pour scraper toutes les entit√©s Wikidata contenant un terme de recherche sp√©cifique.

Ce notebook utilise l'API EntitySearch de Wikidata avec pagination automatique pour r√©cup√©rer **tous** les r√©sultats sans limitation des 50 premiers.

---

## üì¶ Installation et imports

Installation des d√©pendances n√©cessaires :

In [None]:
# Installation des d√©pendances (d√©commentez si n√©cessaire)
# !pip install requests pandas jupyter

In [14]:
import requests
import time
import json
import csv
import pandas as pd
from urllib.parse import quote
from IPython.display import display, HTML, clear_output
import warnings
warnings.filterwarnings('ignore')

print("‚úÖ Toutes les biblioth√®ques sont import√©es avec succ√®s!")

‚úÖ Toutes les biblioth√®ques sont import√©es avec succ√®s!


## ‚öôÔ∏è Configuration

D√©finissez vos param√®tres de recherche ici :

In [15]:
# Configuration globale
LANGUAGE = "fr"  # Langue pour la recherche (fr, en, es, etc.)
LIMIT = 50       # Nombre de r√©sultats par page (max 50)
DELAY = 2        # D√©lai entre les requ√™tes (secondes)

print(f"üåç Langue de recherche: {LANGUAGE}")
print(f"üìÑ R√©sultats par page: {LIMIT}")
print(f"‚è±Ô∏è  D√©lai entre requ√™tes: {DELAY}s")

üåç Langue de recherche: fr
üìÑ R√©sultats par page: 50
‚è±Ô∏è  D√©lai entre requ√™tes: 2s


## üéØ Terme de recherche

Saisissez le terme que vous souhaitez rechercher dans Wikidata :

In [16]:
# Saisie du terme de recherche
search_term = input("üîç Entrez le terme de recherche (par exemple, 'aero'): ")

if not search_term.strip():
    raise ValueError("‚ùå Le terme de recherche ne peut pas √™tre vide.")


print(f"‚úÖ Terme de recherche: '{search_term}'")

‚úÖ Terme de recherche: 'aeronaut'


## üõ†Ô∏è Classe WikidataAeroScraper

D√©finition de la classe principale pour le scraping :

In [17]:
class WikidataAeroScraper:
    """Scraper pour r√©cup√©rer toutes les entit√©s Wikidata contenant un terme sp√©cifique"""
    
    def __init__(self):
        self.endpoint = "https://query.wikidata.org/sparql"
        self.headers = {
            'User-Agent': 'WikidataBot/1.0 (https://github.com/May8326/wikidata-scraper)',
            'Accept': 'application/sparql-results+json'
        }
        self.results = []
        self.stats = {
            'total_pages': 0,
            'total_results': 0,
            'start_time': None,
            'end_time': None
        }

    def build_query(self, search_term, language, limit, offset):
        """Construit la requ√™te SPARQL avec pagination"""
        query = f"""
        SELECT ?item ?itemLabel WHERE {{
          SERVICE wikibase:mwapi {{
            bd:serviceParam wikibase:endpoint "www.wikidata.org";
                            wikibase:api "EntitySearch";
                            mwapi:search "{search_term}";
                            mwapi:language "{language}";
                            mwapi:limit "{limit}";
                            mwapi:continue "{offset}".
            ?item wikibase:apiOutputItem mwapi:item.
          }}
          
          SERVICE wikibase:label {{ 
            bd:serviceParam wikibase:language "en". 
          }}
        }}
        """
        return query
    
    def execute_query(self, query):
        """Ex√©cute une requ√™te SPARQL et retourne les r√©sultats"""
        try:
            response = requests.get(
                self.endpoint,
                params={'query': query, 'format': 'json'},
                headers=self.headers,
                timeout=30
            )
            response.raise_for_status()
            return response.json()
        except requests.exceptions.RequestException as e:
            print(f"‚ùå Erreur lors de la requ√™te: {e}")
            return None
    
    def extract_results(self, data):
        """Extrait les r√©sultats du JSON retourn√©"""
        if not data or 'results' not in data:
            return []
        
        results = []
        for binding in data['results']['bindings']:
            item_uri = binding.get('item', {}).get('value', '')
            item_label = binding.get('itemLabel', {}).get('value', '')
            
            # Extraire l'ID Wikidata de l'URI
            item_id = item_uri.split('/')[-1] if item_uri else ''
            
            results.append({
                'wikidata_id': item_id,
                'label': item_label,
                'uri': item_uri
            })
        
        return results

print("‚úÖ Classe WikidataAeroScraper d√©finie avec succ√®s!")

‚úÖ Classe WikidataAeroScraper d√©finie avec succ√®s!


### Test pour un scraper plus robuste

## üîÑ M√©thodes de scraping et sauvegarde

In [18]:
# Ajout des m√©thodes de scraping √† la classe
def scrape_all_results(self):
    """Scrape tous les r√©sultats en paginant automatiquement"""
    offset = 0
    page = 1
    total_results = 0
    
    self.stats['start_time'] = time.time()
    
    print(f"üöÄ D√©but du scraping des entit√©s contenant '{search_term}'...")
    print("=" * 60)
    
    while True:
        print(f"üìÑ Page {page} (offset: {offset})...", end=" ")
        
        # Construire et ex√©cuter la requ√™te
        query = self.build_query(search_term, LANGUAGE, LIMIT, offset)
        data = self.execute_query(query)
        
        if not data:
            print("‚ùå Erreur lors de l'ex√©cution de la requ√™te")
            break
        
        # Extraire les r√©sultats
        page_results = self.extract_results(data)
        
        if not page_results:
            print(f"‚úÖ Fin des r√©sultats atteinte")
            break
        
        # Ajouter aux r√©sultats totaux
        self.results.extend(page_results)
        total_results += len(page_results)
        
        print(f"[{len(page_results)} r√©sultats] Total: {total_results}")
        
        # V√©rifier si on a moins de LIMIT r√©sultats (derni√®re page)
        if len(page_results) < LIMIT:
            print(f"‚úÖ Derni√®re page atteinte ({len(page_results)} < {LIMIT} r√©sultats)")
            break
        
        # Pr√©parer la page suivante
        offset += LIMIT
        page += 1
        
        # Pause pour √™tre respectueux envers l'API
        time.sleep(DELAY)
    
    self.stats['end_time'] = time.time()
    self.stats['total_pages'] = page
    self.stats['total_results'] = total_results
    
    duration = self.stats['end_time'] - self.stats['start_time']
    print("=" * 60)
    print(f"üéâ Scraping termin√©! Total: {total_results} r√©sultats en {duration:.1f}s")
    return self.results

def save_to_csv(self, filename=None):
    """Sauvegarde les r√©sultats en CSV"""
    if not self.results:
        print("‚ùå Aucun r√©sultat √† sauvegarder")
        return
    
    if filename is None:
        filename = f"wikidata_{search_term}_results.csv"
    
    with open(filename, 'w', newline='', encoding='utf-8') as csvfile:
        fieldnames = ['wikidata_id', 'label', 'uri']
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
        
        writer.writeheader()
        for result in self.results:
            writer.writerow(result)
    
    print(f"üíæ R√©sultats sauvegard√©s dans: {filename}")
    return filename

def save_to_json(self, filename=None):
    """Sauvegarde les r√©sultats en JSON"""
    if not self.results:
        print("‚ùå Aucun r√©sultat √† sauvegarder")
        return
    
    if filename is None:
        filename = f"wikidata_{search_term}_results.json"
    
    with open(filename, 'w', encoding='utf-8') as jsonfile:
        json.dump(self.results, jsonfile, ensure_ascii=False, indent=2)
    
    print(f"üíæ R√©sultats sauvegard√©s dans: {filename}")
    return filename

def get_dataframe(self):
    """Retourne les r√©sultats sous forme de DataFrame pandas"""
    if not self.results:
        return pd.DataFrame()
    
    return pd.DataFrame(self.results)

def print_sample_results(self, limit=10):
    """Affiche un √©chantillon des r√©sultats"""
    if not self.results:
        print("‚ùå Aucun r√©sultat √† afficher")
        return
    
    print(f"\nüìã √âchantillon des r√©sultats (premiers {limit}):")
    print("-" * 80)
    
    for i, result in enumerate(self.results[:limit]):
        print(f"{i+1:2d}. {result['wikidata_id']:12s} | {result['label']}")
    
    if len(self.results) > limit:
        print(f"... et {len(self.results) - limit} autres r√©sultats")

def get_stats(self):
    """Retourne les statistiques du scraping"""
    return self.stats

# Ajouter les m√©thodes √† la classe
WikidataAeroScraper.scrape_all_results = scrape_all_results
WikidataAeroScraper.save_to_csv = save_to_csv
WikidataAeroScraper.save_to_json = save_to_json
WikidataAeroScraper.get_dataframe = get_dataframe
WikidataAeroScraper.print_sample_results = print_sample_results
WikidataAeroScraper.get_stats = get_stats

print("‚úÖ M√©thodes de scraping et sauvegarde ajout√©es!")

‚úÖ M√©thodes de scraping et sauvegarde ajout√©es!


## üöÄ Ex√©cution du scraping

Lance le processus de scraping complet :

In [19]:
# Initialisation du scraper
scraper = WikidataAeroScraper()

try:
    # Lancer le scraping
    results = scraper.scrape_all_results()
    
    if results:
        print(f"\nüéØ Mission accomplie! {len(results)} entit√©s r√©cup√©r√©es.")
    else:
        print("‚ùå Aucun r√©sultat trouv√©")
        
except KeyboardInterrupt:
    print("\n‚õî Arr√™t demand√© par l'utilisateur")
    if scraper.results:
        print(f"üíæ Sauvegarde des {len(scraper.results)} r√©sultats partiels...")
        scraper.save_to_csv(f"wikidata_{search_term}_partial.csv")
except Exception as e:
    print(f"‚ùå Erreur inattendue: {e}")

üöÄ D√©but du scraping des entit√©s contenant 'aeronaut'...
üìÑ Page 1 (offset: 0)... ‚ùå Erreur lors de la requ√™te: 500 Server Error: Internal Server Error for url: https://query.wikidata.org/sparql?query=%0A++++++++SELECT+%3Fitem+%3FitemLabel+WHERE+%7B%0A++++++++++SERVICE+wikibase%3Amwapi+%7B%0A++++++++++++bd%3AserviceParam+wikibase%3Aendpoint+%22www.wikidata.org%22%3B%0A++++++++++++++++++++++++++++wikibase%3Aapi+%22EntitySearch%22%3B%0A++++++++++++++++++++++++++++mwapi%3Asearch+%22aeronaut%22%3B%0A++++++++++++++++++++++++++++mwapi%3Alanguage+%22fr%22%3B%0A++++++++++++++++++++++++++++mwapi%3Alimit+%2250%22%3B%0A++++++++++++++++++++++++++++mwapi%3Acontinue+%220%22.%0A++++++++++++%3Fitem+wikibase%3AapiOutputItem+mwapi%3Aitem.%0A++++++++++%7D%0A%0A++++++++++SERVICE+wikibase%3Alabel+%7B+%0A++++++++++++bd%3AserviceParam+wikibase%3Alanguage+%22en%22.+%0A++++++++++%7D%0A++++++++%7D%0A++++++++&format=json
‚ùå Erreur lors de l'ex√©cution de la requ√™te
üéâ Scraping termin√©! Total: 0 r√©s

### D√©bogage du scraping

In [None]:
# Cellule de d√©bogage pour identifier la cause de l'arr√™t
def debug_scraping_stop(scraper):
    """Diagnostique pourquoi le scraping s'est arr√™t√©"""
    print("üîç DIAGNOSTIC DE L'ARR√äT DU SCRAPING")
    print("=" * 50)
    
    # V√©rifier les statistiques
    stats = scraper.get_stats()
    total_results = len(scraper.results)
    
    print(f"üìä R√©sultats obtenus: {total_results}")
    print(f"üìÑ Pages scrap√©es: {stats.get('total_pages', 'N/A')}")
    
    # V√©rifier la derni√®re page
    if total_results > 0:
        last_offset = (stats.get('total_pages', 1) - 1) * LIMIT
        print(f"üî¢ Dernier offset utilis√©: {last_offset}")
        
        # Test de la page suivante pour voir s'il y a encore des r√©sultats
        print(f"\nüß™ Test de la page suivante (offset {last_offset + LIMIT})...")
        
        next_query = scraper.build_query(search_term, LANGUAGE, LIMIT, last_offset + LIMIT)
        next_data = scraper.execute_query(next_query)
        
        if next_data:
            next_results = scraper.extract_results(next_data)
            print(f"   ‚Üí {len(next_results)} r√©sultats trouv√©s sur la page suivante")
            
            if len(next_results) == 0:
                print("   ‚úÖ Confirmation: plus de r√©sultats disponibles")
            else:
                print("   ‚ö†Ô∏è  Il y a encore des r√©sultats ! Le scraping s'est arr√™t√© pr√©matur√©ment")
                
                # Afficher quelques exemples de la page suivante
                print("   üìã Exemples de r√©sultats manqu√©s:")
                for i, result in enumerate(next_results[:5]):
                    print(f"      {i+1}. {result['wikidata_id']} | {result['label']}")
        else:
            print("   ‚ùå Erreur lors du test de la page suivante")
    
    # V√©rifier s'il y a une limite exacte √† 10000
    if total_results == 10000:
        print(f"\n‚ö†Ô∏è  ALERTE: Arr√™t √† exactement 10 000 r√©sultats!")
        print(f"   Cela sugg√®re une limite API c√¥t√© Wikidata EntitySearch")
    
    print("=" * 50)

# Lancer le diagnostic
if 'scraper' in locals() and scraper.results:
    debug_scraping_stop(scraper)
else:
    print("‚ùå Aucun scraper avec des r√©sultats trouv√©")



üîç DIAGNOSTIC DE L'ARR√äT DU SCRAPING
üìä R√©sultats obtenus: 22
üìÑ Pages scrap√©es: 1
üî¢ Dernier offset utilis√©: 0

üß™ Test de la page suivante (offset 50)...
‚ùå Erreur lors de la requ√™te: 500 Server Error: Internal Server Error for url: https://query.wikidata.org/sparql?query=%0A++++++++SELECT+%3Fitem+%3FitemLabel+WHERE+%7B%0A++++++++++SERVICE+wikibase%3Amwapi+%7B%0A++++++++++++bd%3AserviceParam+wikibase%3Aendpoint+%22www.wikidata.org%22%3B%0A++++++++++++++++++++++++++++wikibase%3Aapi+%22EntitySearch%22%3B%0A++++++++++++++++++++++++++++mwapi%3Asearch+%22aero%22%3B%0A++++++++++++++++++++++++++++mwapi%3Alanguage+%22fr%22%3B%0A++++++++++++++++++++++++++++mwapi%3Alimit+%2250%22%3B%0A++++++++++++++++++++++++++++mwapi%3Acontinue+%2250%22.%0A++++++++++++%3Fitem+wikibase%3AapiOutputItem+mwapi%3Aitem.%0A++++++++++%7D%0A%0A++++++++++SERVICE+wikibase%3Alabel+%7B+%0A++++++++++++bd%3AserviceParam+wikibase%3Alanguage+%22en%22.+%0A++++++++++%7D%0A++++++++%7D%0A++++++++&format=json
   ‚ù

### Essai pour contourner les limites

In [None]:
def alternative_search_all_results(search_terme, max_retries=3):
    """
    M√©thode alternative utilisant plusieurs approches combin√©es
    pour r√©cup√©rer TOUS les r√©sultats
    """
    print(f"üîÑ Recherche alternative pour '{search_terme}'...")
    
    # M√©thode 1: EntitySearch classique (jusqu'√† 10k)
    scraper1 = WikidataAeroScraper()
    results1 = scraper1.scrape_all_results()
    
    print(f"üìä M√©thode 1 (EntitySearch): {len(results1)} r√©sultats")
    
    # M√©thode 2: Recherche SPARQL directe avec REGEX
    query_sparql = f"""
    SELECT DISTINCT ?item ?itemLabel WHERE {{
      ?item rdfs:label ?itemLabel .
      FILTER(LANG(?itemLabel) = "en")
      FILTER(REGEX(?itemLabel, "{search_terme}", "i"))
      
      SERVICE wikibase:label {{ 
        bd:serviceParam wikibase:language "en". 
      }}
    }}
    LIMIT 50000
    """
    
    print(f"üîÑ M√©thode 2: Recherche SPARQL directe...")
    
    headers = {
        'User-Agent': 'WikidataBot/1.0 (https://github.com/May8326/wikidata-scraper)',
        'Accept': 'application/sparql-results+json'
    }
    
    try:
        response = requests.get(
            "https://query.wikidata.org/sparql",
            params={'query': query_sparql, 'format': 'json'},
            headers=headers,
            timeout=60
        )
        
        if response.status_code == 200:
            data = response.json()
            results2 = []
            
            for binding in data.get('results', {}).get('bindings', []):
                item_uri = binding.get('item', {}).get('value', '')
                item_label = binding.get('itemLabel', {}).get('value', '')
                item_id = item_uri.split('/')[-1] if item_uri else ''
                
                results2.append({
                    'wikidata_id': item_id,
                    'label': item_label,
                    'uri': item_uri,
                    'method': 'sparql_direct'
                })
            
            print(f"üìä M√©thode 2 (SPARQL): {len(results2)} r√©sultats")
        else:
            print(f"‚ùå M√©thode 2 √©chou√©e: {response.status_code}")
            results2 = []
            
    except Exception as e:
        print(f"‚ùå Erreur M√©thode 2: {e}")
        results2 = []
    
    # Fusionner et d√©dupliquer les r√©sultats
    all_results = results1.copy()
    
    # Ajouter les r√©sultats de la m√©thode 2 qui ne sont pas d√©j√† pr√©sents
    existing_ids = {r['wikidata_id'] for r in results1}
    
    new_from_method2 = 0
    for result in results2:
        if result['wikidata_id'] not in existing_ids:
            all_results.append(result)
            existing_ids.add(result['wikidata_id'])
            new_from_method2 += 1
    
    print(f"‚úÖ Total combin√©: {len(all_results)} r√©sultats")
    print(f"   ‚Üí {len(results1)} de EntitySearch")
    print(f"   ‚Üí {new_from_method2} nouveaux de SPARQL direct")
    
    return all_results

# Utilisation
# all_results = alternative_search_all_results(search_terme)

## üì± Affichage avec DataFrame pandas

Visualisation moderne avec pandas :

In [12]:
# Conversion en DataFrame pandas
if scraper.results:
    df = scraper.get_dataframe()
    
    print(f"üìä DataFrame avec {len(df)} entr√©es:")
    print(f"Colonnes: {list(df.columns)}")
    
    # Affichage des premi√®res lignes
    display(df.head(10))
    
    # Informations sur le dataset
    print(f"\nüìã Informations sur le dataset:")
    print(df.info())
else:
    print("‚ùå Aucune donn√©e √† afficher")

üìä DataFrame avec 22 entr√©es:
Colonnes: ['wikidata_id', 'label', 'uri']


Unnamed: 0,wikidata_id,label,uri
0,Q35684,TARDIS,http://www.wikidata.org/entity/Q35684
1,Q565483,3325 TARDIS,http://www.wikidata.org/entity/Q565483
2,Q30897888,traversable acausal retrograde domains in spac...,http://www.wikidata.org/entity/Q30897888
3,Q29043590,Doctor Who: TARDIS,http://www.wikidata.org/entity/Q29043590
4,Q7685721,Tardisode,http://www.wikidata.org/entity/Q7685721
5,Q659822,Mastrils,http://www.wikidata.org/entity/Q659822
6,Q50403238,Traversable acausal retrograde domains in spac...,http://www.wikidata.org/entity/Q50403238
7,Q124372683,TARDIS,http://www.wikidata.org/entity/Q124372683
8,Q106601446,Tardis Data Core,http://www.wikidata.org/entity/Q106601446
9,Q57655398,TARDIS,http://www.wikidata.org/entity/Q57655398



üìã Informations sur le dataset:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 22 entries, 0 to 21
Data columns (total 3 columns):
 #   Column       Non-Null Count  Dtype 
---  ------       --------------  ----- 
 0   wikidata_id  22 non-null     object
 1   label        22 non-null     object
 2   uri          22 non-null     object
dtypes: object(3)
memory usage: 660.0+ bytes
None


## üíæ Sauvegarde des r√©sultats

Export des donn√©es dans diff√©rents formats :

In [13]:
# Sauvegarde des r√©sultats
if scraper.results:
    # Sauvegarde CSV
    csv_file = scraper.save_to_csv()
    
    # Sauvegarde JSON
    json_file = scraper.save_to_json()
    
    # Sauvegarde Excel avec pandas (optionnel)
    try:
        df = scraper.get_dataframe()
        excel_file = f"wikidata_{search_term}_results.xlsx"
        df.to_excel(excel_file, index=False)
        print(f"üíæ R√©sultats sauvegard√©s dans: {excel_file}")
    except ImportError:
        print("‚ö†Ô∏è  Excel non disponible (installer openpyxl: pip install openpyxl)")
    
    print(f"\n‚úÖ Tous les fichiers ont √©t√© sauvegard√©s!")
else:
    print("‚ùå Aucun r√©sultat √† sauvegarder")

üíæ R√©sultats sauvegard√©s dans: wikidata_tardis_results.csv
üíæ R√©sultats sauvegard√©s dans: wikidata_tardis_results.json
‚ö†Ô∏è  Excel non disponible (installer openpyxl: pip install openpyxl)

‚úÖ Tous les fichiers ont √©t√© sauvegard√©s!


## üîç Analyse des r√©sultats

Quelques analyses simples des donn√©es r√©cup√©r√©es :

In [14]:
# Analyses des r√©sultats
if scraper.results:
    df = scraper.get_dataframe()
    
    print("üîç Analyse des r√©sultats:")
    print(f"   ‚Ä¢ Nombre total d'entit√©s: {len(df)}")
    print(f"   ‚Ä¢ Nombre d'IDs uniques: {df['wikidata_id'].nunique()}")
    print(f"   ‚Ä¢ Nombre de labels uniques: {df['label'].nunique()}")
    
    # Labels les plus longs/courts
    df['label_length'] = df['label'].str.len()
    print(f"   ‚Ä¢ Label le plus long: {df['label_length'].max()} caract√®res")
    print(f"   ‚Ä¢ Label le plus court: {df['label_length'].min()} caract√®res")
    
    # Top 10 des labels les plus longs
    print(f"\nüìè Top 5 des labels les plus longs:")
    longest = df.nlargest(5, 'label_length')[['wikidata_id', 'label', 'label_length']]
    for _, row in longest.iterrows():
        print(f"   ‚Ä¢ {row['wikidata_id']}: {row['label']} ({row['label_length']} chars)")
    
    # Recherche de mots-cl√©s sp√©cifiques dans les labels
    keywords = ['company', 'airport', 'aircraft', 'airline']
    print(f"\nüè∑Ô∏è  Analyse par mots-cl√©s:")
    for keyword in keywords:
        count = df['label'].str.contains(keyword, case=False, na=False).sum()
        if count > 0:
            print(f"   ‚Ä¢ '{keyword}': {count} entit√©s")
else:
    print("‚ùå Aucune donn√©e √† analyser")

üîç Analyse des r√©sultats:
   ‚Ä¢ Nombre total d'entit√©s: 22
   ‚Ä¢ Nombre d'IDs uniques: 22
   ‚Ä¢ Nombre de labels uniques: 19
   ‚Ä¢ Label le plus long: 51 caract√®res
   ‚Ä¢ Label le plus court: 6 caract√®res

üìè Top 5 des labels les plus longs:
   ‚Ä¢ Q30897888: traversable acausal retrograde domains in spacetime (51 chars)
   ‚Ä¢ Q50403238: Traversable acausal retrograde domains in spacetime (51 chars)
   ‚Ä¢ Q99441542: TarDiS: Targets and Dynamics in Speech (38 chars)
   ‚Ä¢ Q29043590: Doctor Who: TARDIS (18 chars)
   ‚Ä¢ Q119844953: Tardis in a Field (17 chars)

üè∑Ô∏è  Analyse par mots-cl√©s:


## üéØ R√©sum√© final

Bilan de l'ex√©cution :

In [16]:
# R√©sum√© final
print("üéØ R√âSUM√â FINAL")
print("=" * 50)
print(f"Terme recherch√©: '{search_term}'")
print(f"Langue: {LANGUAGE}")
print(f"R√©sultats trouv√©s: {len(scraper.results) if scraper.results else 0}")

if scraper.results:
    stats = scraper.get_stats()
    if stats['start_time'] and stats['end_time']:
        duration = stats['end_time'] - stats['start_time']
        print(f"Dur√©e d'ex√©cution: {duration:.1f} secondes")
        print(f"Pages scrap√©es: {stats['total_pages']}")
    
    print(f"\nüìÅ Fichiers g√©n√©r√©s:")
    print(f"   ‚Ä¢ wikidata_{search_term}_results.csv")
    print(f"   ‚Ä¢ wikidata_{search_term}_results.json")
    print(f"   ‚Ä¢ wikidata_{search_term}_results.xlsx (si disponible)")
    
    print(f"\n‚úÖ Scraping termin√© avec succ√®s!")
else:
    print(f"\n‚ùå Aucun r√©sultat trouv√© pour '{search_term}'")

print("=" * 50)

üéØ R√âSUM√â FINAL
Terme recherch√©: 'tardis'
Langue: fr
R√©sultats trouv√©s: 22
Dur√©e d'ex√©cution: 0.4 secondes
Pages scrap√©es: 1

üìÅ Fichiers g√©n√©r√©s:
   ‚Ä¢ wikidata_tardis_results.csv
   ‚Ä¢ wikidata_tardis_results.json
   ‚Ä¢ wikidata_tardis_results.xlsx (si disponible)

‚úÖ Scraping termin√© avec succ√®s!
