# Analyse de l'Impact de la Compression sur un Moteur de Recherche d'Images

Ce projet étudie l'influence de différentes méthodes de compression sur les performances d'un moteur de recherche d'images basé sur la similarité visuelle. L'analyse compare quatre approches : deux méthodes classiques (PNG sans perte et JPEG avec perte) et deux méthodes modernes (compression par ondelettes de Haar et transformation DCT).

Le dataset utilisé contient environ 3000 images de montagnes et de neige avec des features CNN pré-extraites (11520 dimensions). L'objectif est de quantifier le compromis entre efficacité de compression et préservation de la qualité de recherche.

**Méthodologie :**
- Compression des images avec les quatre méthodes sélectionnées
- Mesure des métriques de qualité (PSNR, SSIM) et d'efficacité (ratio de compression, temps)
- Évaluation de l'impact sur la précision du moteur de recherche par similarité visuelle
- Analyse comparative des résultats pour identifier les approches optimales selon le contexte d'usage


In [1]:
import sys
import pandas as pd
import numpy as np
from pathlib import Path
import time
import warnings
warnings.filterwarnings('ignore')

sys.path.append('libs_vision')
from compression_engine import CompressionEvaluator
from search_engine import ImageSearchEngine
from analysis_tools import CompressionImpactAnalyzer

print("Analyse de compression d'images pour moteur de recherche")
print("=" * 55)

evaluator = CompressionEvaluator()
classiques = [m for m in evaluator.methods if m.name.startswith(('PNG', 'JPEG'))]
modernes = [m for m in evaluator.methods if m.name.startswith(('Haar', 'DCT'))]

print(f"Méthodes configurées: {[m.name for m in evaluator.methods]}")
print(f"Configuration: {len(classiques)} méthodes classiques, {len(modernes)} méthodes modernes")


Analyse de compression d'images pour moteur de recherche
Méthodes configurées: ['PNG_Lossless', 'JPEG_Q85', 'Haar_T5.0', 'DCT_Q50']
Configuration: 2 méthodes classiques, 2 méthodes modernes


In [None]:
analyzer = CompressionImpactAnalyzer(data_path="data")

print("Début de l'analyse de compression")
print("Durée estimée : 5 minutes")
print()

start_time = time.time()

results = analyzer.run_complete_analysis(
    max_images=15,
    num_queries=10
)

total_time = time.time() - start_time

print(f"\nAnalyse terminée en {total_time:.1f}s")
print(f"Résultats générés: {len(results)} datasets")


: 

: 

In [None]:
report = analyzer.generate_summary_report(results)
print(report)

timestamp = time.strftime('%Y%m%d_%H%M%S')

with open(f'results/rapport_final_compression_{timestamp}.txt', 'w', encoding='utf-8') as f:
    f.write(report)

if 'compression_evaluation' in results:
    results['compression_evaluation'].to_csv(f'results/compression_results_{timestamp}.csv', index=False)
    print(f"Sauvegarde compression: compression_results_{timestamp}.csv")

if 'search_impact' in results:
    results['search_impact'].to_csv(f'results/search_impact_{timestamp}.csv', index=False)  
    print(f"Sauvegarde impact recherche: search_impact_{timestamp}.csv")

print(f"Rapport final: rapport_final_compression_{timestamp}.txt")
print("\nAnalyse terminée - Fichiers de résultats générés")


: 

: 