<a href="https://colab.research.google.com/github/sloffer47/Puissant_Transcription/blob/main/Transcriber.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# TRANSCRIPTION AUDIO ULTRA-RAPIDE SUR GOOGLE COLAB
# Copiez ce code dans un nouveau notebook Google Colab
# https://colab.research.google.com/

# ========================================
# √âTAPE 1 : Installation (1-2 minutes)
# ========================================
print("üì¶ Installation des d√©pendances...")
!pip install -q openai-whisper
!pip install -q gradio

print("‚úÖ Installation termin√©e!")

# ========================================
# √âTAPE 2 : Code de transcription
# ========================================
import whisper
import gradio as gr
from pathlib import Path
import torch

print(f"üéÆ GPU disponible: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"üí™ GPU: {torch.cuda.get_device_name(0)}")

# Charger le mod√®le (large-v3 avec GPU gratuit!)
print("‚è≥ Chargement du mod√®le Whisper large-v3...")
model = whisper.load_model("large")
print("‚úÖ Mod√®le charg√©!")

def transcribe_audio(audio_file, language="fr"):
    """
    Transcrit un fichier audio

    Args:
        audio_file: Chemin du fichier audio
        language: Langue (fr, en, es, etc.)

    Returns:
        Texte transcrit
    """
    if audio_file is None:
        return "‚ùå Veuillez uploader un fichier audio"

    print(f"üé§ Transcription en cours...")

    try:
        # Transcription
        result = model.transcribe(
            audio_file,
            language=language,
            task="transcribe",
            fp16=True,  # Utilise GPU
            verbose=False,
            beam_size=5,
            best_of=5,
            temperature=0.0
        )

        # Formatage du r√©sultat
        transcript = ""
        for segment in result["segments"]:
            start = format_timestamp(segment["start"])
            end = format_timestamp(segment["end"])
            text = segment["text"].strip()
            transcript += f"[{start} ‚Üí {end}] {text}\n\n"

        print(f"‚úÖ Transcription termin√©e! {len(result['segments'])} segments")
        return transcript

    except Exception as e:
        return f"‚ùå Erreur: {str(e)}"

def format_timestamp(seconds):
    """Convertit secondes en HH:MM:SS"""
    h = int(seconds // 3600)
    m = int((seconds % 3600) // 60)
    s = int(seconds % 60)
    return f"{h:02d}:{m:02d}:{s:02d}"

# ========================================
# √âTAPE 3 : Interface Gradio
# ========================================
print("üé® Cr√©ation de l'interface...")

demo = gr.Interface(
    fn=transcribe_audio,
    inputs=[
        gr.Audio(type="filepath", label="üìÅ Upload ton fichier audio (MP3, WAV, etc.)"),
        gr.Dropdown(
            choices=["fr", "en", "es", "de", "it", "pt"],
            value="fr",
            label="üåç Langue"
        )
    ],
    outputs=gr.Textbox(
        label="üìù Transcrip",
        lines=20,
        show_copy_button=True
    ),
    title="üéôÔ∏è Transcripteur Audio Ultra-Puissant (GPU Gratuit)",
    description="""
    ### ‚ö° Transcription ultra-rapide avec Whisper large-v3 sur GPU NVIDIA gratuit!

    **üìã Formats support√©s:** MP3, WAV, M4A, FLAC, OGG, WMA
    **‚è±Ô∏è Vitesse:** ~5-10x plus rapide qu'un CPU normal
    **üíæ Limite:** 2 Go par fichier (largement suffisant!)

    **üí° Astuce:** Le GPU est d√©j√† activ√© si tu vois "GPU: Tesla T4" ci-dessus
    """,
    flagging_mode="never",
    cache_examples=False
)

# ========================================
# √âTAPE 4 : Lancement
# ========================================
print("\n" + "="*50)
print("üöÄ LANCEMENT DE L'APPLICATION")
print("="*50)
print("\nüì± L'interface va s'ouvrir ci-dessous...")
print("üé§ Upload ton fichier audio et clique sur Submit!")
print("="*50 + "\n")

demo.launch(share=True, debug=True)

üì¶ Installation des d√©pendances...
‚úÖ Installation termin√©e!
üéÆ GPU disponible: True
üí™ GPU: Tesla T4
‚è≥ Chargement du mod√®le Whisper large-v3...
‚úÖ Mod√®le charg√©!
üé® Cr√©ation de l'interface...

üöÄ LANCEMENT DE L'APPLICATION

üì± L'interface va s'ouvrir ci-dessous...
üé§ Upload ton fichier audio et clique sur Submit!

Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
* Running on public URL: https://91aef7f9b9252a967e.gradio.live

This share link expires in 1 week. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


üé§ Transcription en cours...


100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 12033/12033 [00:41<00:00, 290.20frames/s]


‚úÖ Transcription termin√©e! 40 segments
