# Doc2PPTX: Génération Automatique de Présentations PowerPoint

Ce notebook démontre les fonctionnalités de `doc2pptx`, un outil Python qui permet de générer des présentations PowerPoint à partir de fichiers Markdown ou JSON structurés, avec optimisation par IA.

## Fonctionnalités principales

- Conversion de Markdown/JSON en présentations PowerPoint
- Optimisation des layouts avec IA
- Planification intelligente du contenu
- Support pour tableaux, listes à puces, et images
- Templates personnalisables

## Prérequis

Pour utiliser ce notebook, vous devez avoir installé le package `doc2pptx` et ses dépendances. Si ce n'est pas déjà fait, vous pouvez l'installer via:

```bash
# Dans un environnement conda (recommandé)
conda env create -f env.yml
conda activate doc2pptx

# Ou via pip
pip install -e .
```

## Configuration initiale

Commençons par importer les modules nécessaires et configurer l'environnement.

In [5]:
import os
import sys
import json
from pathlib import Path
from IPython.display import display, Markdown, HTML
import tempfile
import shutil

# Assurez-vous que doc2pptx est dans le PYTHONPATH
# Si vous exécutez ce notebook depuis le répertoire du projet, cette étape n'est pas nécessaire
if not any("doc2pptx" in p for p in sys.path):
    sys.path.append(os.path.abspath(os.path.join(os.getcwd(), 'src')))

# Configuration des chemins
DATA_DIR = Path('./data')
TEMPLATES_DIR = DATA_DIR / 'templates'
INPUT_DIR = DATA_DIR / 'input'
OUTPUT_DIR = DATA_DIR / 'output'

# Créer les répertoires s'ils n'existent pas
for dir_path in [DATA_DIR, TEMPLATES_DIR, INPUT_DIR, OUTPUT_DIR]:
    dir_path.mkdir(parents=True, exist_ok=True)

# Vérifiez si les fichiers nécessaires existent
base_template = TEMPLATES_DIR / 'base_template.pptx'
example_md = INPUT_DIR / 'example2.md'

if not base_template.exists():
    print(f"⚠️ Le template {base_template} n'existe pas. Veuillez fournir un fichier PowerPoint template.")
else:
    print(f"✅ Template trouvé: {base_template}")

if not example_md.exists():
    print(f"⚠️ Le fichier d'exemple {example_md} n'existe pas. Veuillez fournir un fichier Markdown d'exemple.")
else:
    print(f"✅ Fichier d'exemple trouvé: {example_md}")

✅ Template trouvé: data\templates\base_template.pptx
✅ Fichier d'exemple trouvé: data\input\example2.md


## Vérification de l'API OpenAI

L'optimisation par IA et la planification de contenu nécessitent une clé API OpenAI valide. Vérifions que celle-ci est correctement configurée.

In [6]:
# Importer les paramètres
from doc2pptx.core.settings import settings

# Vérifier si la clé API est configurée
if not settings.openai_api_key:
    # Permettre à l'utilisateur de saisir une clé API temporairement
    import getpass
    api_key = getpass.getpass("Entrez votre clé API OpenAI (ne sera pas sauvegardée): ")
    settings.openai_api_key = api_key
    print("Clé API temporaire configurée pour cette session.")
else:
    print("✅ Clé API OpenAI déjà configurée dans les paramètres.")

print(f"Modèle OpenAI configuré: {settings.openai_model}")

✅ Clé API OpenAI déjà configurée dans les paramètres.
Modèle OpenAI configuré: gpt-4o


## Explorer le fichier Markdown d'entrée

Avant de générer une présentation, examinons le contenu du fichier Markdown qui servira d'entrée.

In [7]:
def display_markdown_content(markdown_file):
    """Affiche le contenu d'un fichier Markdown."""
    with open(markdown_file, 'r', encoding='utf-8') as f:
        content = f.read()
    
    # Afficher les métadonnées YAML si présentes
    if content.startswith('---'):
        end_frontmatter = content.find('---', 3)
        if end_frontmatter > 0:
            frontmatter = content[3:end_frontmatter].strip()
            content_body = content[end_frontmatter+3:].strip()
            
            print("Métadonnées YAML:")
            print(f"```yaml\n{frontmatter}\n```")
            
            return content_body
    
    return content

# Afficher le contenu du fichier Markdown
if example_md.exists():
    markdown_content = display_markdown_content(example_md)
    display(Markdown(markdown_content))

Métadonnées YAML:
```yaml
title: Rapport d'Analyse de Marché Web 2025
author: Jean Martin
description: Analyse des tendances du marché web pour l'année 2025
```


# Rapport d'Analyse de Marché Web 2025

## Résumé Exécutif

Le paysage du développement web continue d'évoluer rapidement. Cette analyse détaille les principales tendances qui façonneront le marché en 2025 et propose des stratégies d'adaptation.

### Points clés

* L'IA générative est devenue un outil standard dans le développement web
* Les interfaces no-code représentent 35% du marché des nouveaux sites
* La sécurité et la protection des données restent les préoccupations principales
* Le Web3 a trouvé des applications pratiques au-delà de la finance

## Technologies Émergentes

Voici les technologies qui ont connu la plus forte croissance depuis 2023:

| Technologie | Taux d'adoption | Croissance annuelle | Maturité |
|-------------|-----------------|---------------------|----------|
| React Server Components | 68% | +42% | Établie |
| WebAssembly | 54% | +37% | En croissance |
| WebGPU | 23% | +75% | Émergente |
| Web Bluetooth | 12% | +90% | Naissante |

![Graphique montrant l'adoption des technologies web émergentes sur la période 2023-2025, avec des barres de progression pour chaque technologie](web_tech_adoption.jpg)

## Impact Économique

L'évolution des technologies web a un impact significatif sur les modèles économiques des entreprises. Les entreprises qui ont adopté ces technologies montrent une performance supérieure.

Les impacts les plus notables sont:

* Réduction des coûts de développement de 22% grâce aux outils assistés par IA
* Augmentation de 34% de la vitesse de mise sur le marché
* Amélioration de 45% des taux de conversion grâce à des interfaces plus performantes
* Diminution de 18% des coûts de maintenance

### Investissements par Secteur

Le tableau suivant montre la répartition des investissements technologiques par secteur:

| Secteur | Investissement 2025 (M€) | Changement vs 2024 | Focus principal |
|---------|--------------------------|---------------------|----------------|
| E-commerce | 4,250 | +15% | UI/UX personnalisée |
| Services financiers | 5,780 | +23% | Sécurité et conformité |
| Santé | 3,450 | +42% | Applications mobiles |
| Éducation | 2,120 | +35% | Plateformes interactives |
| Industrie | 3,960 | +18% | IoT et monitoring |

## Recommandations Stratégiques

En fonction des tendances observées, nous recommandons les approches suivantes:

Pour les startups:
* Adopter immédiatement les technologies serverless
* Investir dans la formation à l'IA appliquée au développement
* Privilégier les interfaces mobiles adaptatives

Pour les entreprises établies:
* Moderniser progressivement les systèmes legacy
* Former les équipes aux nouvelles méthodologies
* Développer des API standardisées

![Image illustrant une équipe de développement travaillant sur des projets web modernes avec des écrans affichant du code et des interfaces](dev_team.jpg)

## Prévisions 2026

Les technologies qui devraient connaître une forte croissance l'année prochaine:

| Technologie | Prévision d'adoption | Potentiel disruptif |
|-------------|----------------------|---------------------|
| Web Neural | 15-25% | Très élevé |
| Interfaces cerveau-ordinateur | 5-8% | Révolutionnaire |
| Hologrammes web | 10-15% | Élevé |
| Blockchain décentralisée | 30-40% | Modéré |

## Chargement du Markdown et conversion en modèle Presentation

Maintenant, chargeons le fichier Markdown et convertissons-le en un modèle `Presentation` qui sera utilisé pour générer le PowerPoint.

In [8]:
from doc2pptx.ingest.markdown_loader import load_presentation_from_markdown
from doc2pptx.core.models import Presentation, Section, Slide, SlideBlock, ContentType

def load_and_analyze_markdown(markdown_file):
    """Charge un fichier Markdown et analyse sa structure."""
    try:
        presentation = load_presentation_from_markdown(markdown_file)
        
        print(f"✅ Présentation chargée avec succès: '{presentation.title}'")
        print(f"Nombre de sections: {len(presentation.sections)}")
        
        # Afficher un résumé de la structure
        for i, section in enumerate(presentation.sections, 1):
            print(f"\nSection {i}: {section.title} (Type: {section.type})")
            
            for j, slide in enumerate(section.slides, 1):
                content_types = [block.content.content_type for block in slide.blocks]
                content_summary = ", ".join([ct.value for ct in content_types]) if content_types else "vide"
                print(f"  Slide {j}: {slide.title} ({len(slide.blocks)} blocs - {content_summary})")
        
        return presentation
    except Exception as e:
        print(f"❌ Erreur lors du chargement du fichier Markdown: {e}")
        return None

# Charger et analyser le fichier Markdown
if example_md.exists():
    presentation = load_and_analyze_markdown(example_md)

Unknown section type 'default' - treating as 'custom'
API key format ('sk-pr...') seems unusual. Attempting to initialize OpenAI client anyway.


✅ Présentation chargée avec succès: 'Rapport d'Analyse de Marché Web 2025'
Nombre de sections: 1

Section 1: Rapport d'Analyse de Marché Web 2025 (Type: SectionType.TITLE)
  Slide 1: Rapport d'Analyse de Marché Web 2025 (0 blocs - vide)
  Slide 2: Résumé Exécutif (1 blocs - text)
  Slide 3: Points clés (1 blocs - bullet_points)
  Slide 4: Technologies Émergentes (3 blocs - text, table, text)
  Slide 5: Impact Économique (3 blocs - text, text, bullet_points)
  Slide 6: Investissements par Secteur (2 blocs - text, table)
  Slide 7: Recommandations Stratégiques (6 blocs - text, text, bullet_points, text, bullet_points, text)
  Slide 8: Prévisions 2026 (2 blocs - text, table)


## Générer la présentation PowerPoint

Maintenant, utilisons le modèle `Presentation` pour générer une présentation PowerPoint avec l'optimisation IA et la planification de contenu.

In [9]:
from doc2pptx.ppt.builder import PPTBuilder
from doc2pptx.llm.optimizer import PresentationOptimizer
from doc2pptx.llm.content_planner import ContentPlanner
import time

def generate_presentation(presentation, template_path, output_path, use_ai=True, use_content_planning=True):
    """Génère une présentation PowerPoint à partir d'un modèle Presentation."""
    start_time = time.time()
    
    print(f"⏳ Génération de la présentation...")
    print(f"Template: {template_path}")
    print(f"Optimisation IA: {'✅ Activée' if use_ai else '❌ Désactivée'}")
    print(f"Planification de contenu: {'✅ Activée' if use_content_planning else '❌ Désactivée'}")
    
    try:
        # Définir le template_path dans le modèle Presentation
        presentation.template_path = template_path
        
        # Initialiser le PPTBuilder avec les options d'optimisation
        builder = PPTBuilder(
            template_path=template_path,
            use_ai=use_ai,
            use_content_planning=use_content_planning
        )
        
        # Générer la présentation
        output_file = builder.build(presentation, output_path)
        
        elapsed_time = time.time() - start_time
        print(f"✅ Présentation générée avec succès en {elapsed_time:.2f} secondes.")
        print(f"Fichier de sortie: {output_file}")
        
        return output_file
    except Exception as e:
        print(f"❌ Erreur lors de la génération de la présentation: {e}")
        return None

# Générer la présentation
if presentation and base_template.exists():
    output_path = OUTPUT_DIR / f"{presentation.title.replace(' ', '_')}.pptx"
    pptx_file = generate_presentation(
        presentation=presentation,
        template_path=base_template,
        output_path=output_path,
        use_ai=True,
        use_content_planning=True
    )

Unknown section type 'default' - treating as 'custom'
API key format ('sk-pr...') seems unusual. Attempting to initialize OpenAI client anyway.
API key format ('sk-pr...') seems unusual. Attempting to initialize OpenAI client anyway.
API key format ('sk-pr...') seems unusual. Attempting to initialize OpenAI client anyway.
API key format ('sk-pr...') seems unusual. Attempting to initialize OpenAI client anyway.


⏳ Génération de la présentation...
Template: data\templates\base_template.pptx
Optimisation IA: ✅ Activée
Planification de contenu: ✅ Activée


Unknown section type 'default' - treating as 'custom'
API key format ('sk-pr...') seems unusual. Attempting to initialize OpenAI client anyway.
API key format ('sk-pr...') seems unusual. Attempting to initialize OpenAI client anyway.
Detected content area seems too small. Using adjusted margins.
Layout 'Titre et texte' supports max 1 blocks but slide has 2. Selecting a more appropriate layout.
Layout 'Titre et tableau' supports max 1 blocks but slide has 2. Selecting a more appropriate layout.
Detected content area seems too small. Using adjusted margins.
Layout 'Titre et tableau' supports max 1 blocks but slide has 2. Selecting a more appropriate layout.
Detected content area seems too small. Using adjusted margins.


✅ Présentation générée avec succès en 79.48 secondes.
Fichier de sortie: data\output\Rapport_d'Analyse_de_Marché_Web_2025.pptx


## Utilisation de l'API programmatique

Maintenant, voyons comment utiliser l'API programmatique de `doc2pptx` pour générer une présentation en une seule ligne de code.

In [10]:
from doc2pptx.cli import app
from typer.testing import CliRunner

def generate_with_cli(input_file, template_file, output_file=None, ai_optimize=True, content_planning=True):
    """Génère une présentation PowerPoint à l'aide de l'API CLI de doc2pptx."""
    
    if output_file is None:
        output_file = OUTPUT_DIR / f"output_{Path(input_file).stem}.pptx"
    
    print(f"⏳ Génération de la présentation via CLI...")
    
    # Construire la commande
    command = ["generate", "--template", str(template_file), "--output", str(output_file)]
    
    if ai_optimize:
        command.append("--ai-optimize")
    
    if content_planning:
        command.append("--content-planning")
    
    command.append(str(input_file))
    
    # Afficher la commande équivalente
    cmd_str = "python -m doc2pptx.cli " + " ".join(command)
    print(f"Commande équivalente: {cmd_str}")
    
    # Exécuter la commande via l'API CLI
    runner = CliRunner()
    result = runner.invoke(app, command)
    
    if result.exit_code == 0:
        print(f"✅ Présentation générée avec succès via CLI.")
        print(f"Fichier de sortie: {output_file}")
        return output_file
    else:
        print(f"❌ Erreur lors de la génération via CLI: {result.output}")
        return None

# Générer avec l'API CLI
output_cli = OUTPUT_DIR / "cli_example.pptx"
if example_md.exists() and base_template.exists():
    cli_output = generate_with_cli(
        input_file=example_md,
        template_file=base_template,
        output_file=output_cli,
        ai_optimize=True,
        content_planning=True
    )

⏳ Génération de la présentation via CLI...
Commande équivalente: python -m doc2pptx.cli generate --template data\templates\base_template.pptx --output data\output\cli_example.pptx --ai-optimize --content-planning data\input\example2.md


✅ Présentation générée avec succès via CLI.
Fichier de sortie: data\output\cli_example.pptx


## Personnalisation du processus d'optimisation

Examinons comment personnaliser le processus d'optimisation IA et de planification de contenu.

In [11]:
# Utilisation directe de l'optimiseur et du planificateur de contenu
def demo_optimization_pipeline(markdown_file, template_file):
    """Démontre le pipeline d'optimisation en détail."""
    print("📝 Démonstration du pipeline d'optimisation\n")
    
    # 1. Charger la présentation depuis le Markdown
    presentation = load_presentation_from_markdown(markdown_file)
    print(f"✅ Présentation chargée: {presentation.title}")
    
    # 2. Initialiser l'optimiseur
    print("\n🔍 Initialisation de l'optimiseur IA...")
    optimizer = PresentationOptimizer()
    print(f"Modèle utilisé: {optimizer.model}")
    
    # 3. Convertir la présentation en un format analysable par l'IA
    print("\n🔄 Conversion pour analyse IA...")
    simplified_data = optimizer._simplify_presentation(presentation.model_dump())
    print(f"Nombre de sections simplifiées: {len(simplified_data['sections'])}")
    
    # 4. Obtenir des recommandations d'optimisation
    print("\n🤖 Demande de recommandations d'optimisation à l'IA...")
    optimization_result = optimizer.optimize_presentation(presentation.model_dump())
    print(f"Nombre de sections optimisées: {len(optimization_result['sections'])}")
    
    # 5. Initialiser le planificateur de contenu
    print("\n📊 Initialisation du planificateur de contenu...")
    content_planner = ContentPlanner(optimizer=optimizer)
    
    # 6. Planifier le contenu de la première section
    print("\n🧠 Planification du contenu pour la première section...")
    if presentation.sections:
        section = presentation.sections[0]
        optimized_section = content_planner.plan_section_content(section)
        print(f"Section '{optimized_section.title}' planifiée avec {len(optimized_section.slides)} slides")
        
        # Afficher un exemple de slide optimisé
        if optimized_section.slides:
            slide = optimized_section.slides[0]
            print(f"\nExemple de slide optimisé: '{slide.title}'")
            print(f"Layout: {slide.layout_name}")
            print(f"Nombre de blocs: {len(slide.blocks)}")
    
    return {"presentation": presentation, "optimization": optimization_result}

# Exécuter la démonstration du pipeline d'optimisation
if example_md.exists() and base_template.exists():
    optimization_demo = demo_optimization_pipeline(example_md, base_template)

📝 Démonstration du pipeline d'optimisation



✅ Présentation chargée: Rapport d'Analyse de Marché Web 2025

🔍 Initialisation de l'optimiseur IA...


Modèle utilisé: gpt-4o

🔄 Conversion pour analyse IA...
Nombre de sections simplifiées: 1

🤖 Demande de recommandations d'optimisation à l'IA...


Nombre de sections optimisées: 1

📊 Initialisation du planificateur de contenu...

🧠 Planification du contenu pour la première section...


Section 'Rapport d'Analyse de Marché Web 2025' planifiée avec 10 slides

Exemple de slide optimisé: 'Rapport d'Analyse de Marché Web 2025'
Layout: Title Slide
Nombre de blocs: 0


## Expérimentation avec différents fichiers Markdown

Testez `doc2pptx` avec votre propre contenu Markdown. Voici un exemple simplifié que vous pouvez modifier et utiliser:

In [None]:
def create_custom_markdown():
    """Crée un exemple de fichier Markdown personnalisable."""
    markdown_content = """---
title: Ma Présentation Personnalisée
author: Votre Nom
description: Une présentation créée avec doc2pptx
---
# Ma Présentation Personnalisée

## Introduction
Ceci est une introduction à ma présentation personnalisée.
Elle démontre les capacités de conversion de doc2pptx.

### Points principaux
* Premier point important
* Deuxième point important
* Troisième point important

## Données et Tableaux
Voici un exemple de tableau de données:

| Catégorie | Valeur 1 | Valeur 2 | Tendance |
|-----------|----------|----------|----------|
| Produit A | 1250     | 1500     | +20%     |
| Produit B | 850      | 920      | +8%      |
| Produit C | 2100     | 1950     | -7%      |

## Conclusion
En conclusion, doc2pptx offre un moyen efficace de générer des présentations
PowerPoint à partir de contenu Markdown.
"""
    
    # Créer un fichier temporaire pour le Markdown
    custom_md_path = INPUT_DIR / "custom_example.md"
    with open(custom_md_path, 'w', encoding='utf-8') as f:
        f.write(markdown_content)
    
    print(f"✅ Fichier Markdown personnalisable créé: {custom_md_path}")
    return custom_md_path

# Créer et afficher le markdown personnalisable
custom_md = create_custom_markdown()
display(Markdown(open(custom_md, 'r', encoding='utf-8').read()))

In [None]:
# Générer une présentation avec le Markdown personnalisé
if custom_md.exists() and base_template.exists():
    custom_output = OUTPUT_DIR / "custom_presentation.pptx"
    custom_pptx = generate_with_cli(
        input_file=custom_md,
        template_file=base_template,
        output_file=custom_output,
        ai_optimize=True,
        content_planning=True
    )

## Conclusion

Ce notebook a démontré les principales fonctionnalités de `doc2pptx` pour la génération automatique de présentations PowerPoint à partir de fichiers Markdown.

### Points clés:

- **Facilité d'utilisation**: Convertissez rapidement du contenu Markdown en présentations professionnelles
- **Optimisation par IA**: Amélioration automatique des layouts et organisation du contenu
- **Flexibilité**: Utilisable via API programmatique ou ligne de commande
- **Personnalisation**: Utilisez vos propres templates PowerPoint pour un style cohérent

### Pour aller plus loin:

- Consultez la documentation complète du package pour découvrir toutes les options disponibles
- Expérimentez avec différents types de contenu et structures
- Créez vos propres templates PowerPoint pour des présentations personnalisées

Pour toute question ou assistance, n'hésitez pas à me contacter !

Noé Beserman
