In [1]:
import queue, threading, time
import numpy as np
import sounddevice as sd
from faster_whisper import WhisperModel

In [3]:
# stt_live_stable.py
import argparse, sys, time, queue
import numpy as np
import sounddevice as sd
from faster_whisper import WhisperModel

def main():
    ap = argparse.ArgumentParser()
    ap.add_argument("--device", type=int, default=None)
    ap.add_argument("--model",  type=str, default="tiny")
    ap.add_argument("--sr",     type=int, default=16000)
    ap.add_argument("--block",  type=float, default=0.25)
    ap.add_argument("--window", type=float, default=2.0)
    ap.add_argument("--gpu",    action="store_true")
    ap.add_argument("--vad",    action="store_true", default=True)
    ap.add_argument("--stable_n", type=int, default=3, help="nb d'itérations identiques avant de figer")
    args = ap.parse_args()

    device = "cuda" if args.gpu else "cpu"
    compute = "float16" if args.gpu else "int8"

    model = WhisperModel(args.model, device=device, compute_type=compute)

    q = queue.Queue()
    ring = np.zeros(int(args.sr*args.window), dtype=np.float32)

    def cb(indata, frames, time_info, status):
        if status:
            print(status, file=sys.stderr)
        q.put(indata[:,0].astype(np.float32).copy())

    print("🎤 Parlez… (Ctrl+C pour quitter)")
    with sd.InputStream(channels=1, samplerate=args.sr,
                        blocksize=int(args.sr*args.block),
                        dtype="float32", device=args.device, callback=cb):
        confirmed = ""          # texte figé (imprimé avec \n)
        pending = ""            # hypothèse courante (réécrite sur la même ligne)
        stable_count = 0

        while True:
            blk = q.get()
            # maj fenêtre
            n = len(blk)
            ring = np.concatenate([ring[n:], blk])

            # transcription
            segs, _ = model.transcribe(
                ring,
                language="fr",
                beam_size=1,
                vad_filter=args.vad,
                vad_parameters={"min_silence_duration_ms": 250},
                without_timestamps=True,
                condition_on_previous_text=True,
            )
            hyp = "".join(s.text for s in segs).strip()

            # ne garde que la partie non encore confirmée
            if hyp.startswith(confirmed):
                cur = hyp[len(confirmed):]
            else:
                # si le modèle réécrit tout, on repart de zéro sur pending
                cur = hyp

            if cur == pending:
                stable_count += 1
            else:
                pending = cur
                stable_count = 1

            # affiche la ligne courante (réécrite)
            line = "\r" + confirmed + pending
            print(line + " " * 6, end="", flush=True)  # padding pour effacer restes

            # conditions de figement : ponctuation forte OU stabilité N fois
            if pending.endswith((".", "!", "?", "…")) or stable_count >= args.stable_n:
                confirmed += pending
                pending = ""
                stable_count = 0
                print()  # nouvelle ligne pour le texte figé

if __name__ == "__main__":
    try:
        main()
    except KeyboardInterrupt:
        print()


"Non....Merci.Non, non, non.Non, non, non, non, non.Et on y va.et on y a une...Alors, je m'en occupe.Alors, je m'en occupe.Alors, je m'en occupe.Alors, je m'en occupe.Je m'en occupe le dessus.Je m'en occupe.Merci.Comme c'est...C'est comme ça.C'est bon.le constat.C'est comme ça.C'est comme ça.C'est bon, c'est bon....Ok, ça marche.Ok, ça marche pas, hein?Ok, ça marche pas, hein?Ok, ça marche pas, hein?Ok, ça marche pas, hein?Ok, ça marche pas, hein.ça marche pas.C'est bon.C'est un bon moment.C'est un bon moment.C'est un bon moment.C'est pas mon nom.T'es un peu ouner, c'est une épingle.Oh non, c'est une épidie.de détruire.Je vais vous détruire.C'est bon.C'est bon.Non.Ah, c'est bon.Non.Ah, c'est bon. Non.Alors...Allô !Alors...Alors, non.Alors, non.Alors, non.Non.Non, non.Non, non.Non, non.Non, non.Non. Non....Parle-t-je ?Arrête-t-je, Max ?Le T-Short, c'est divers.Le tige m'a que c'est diversif...Alors le tige m'a accepté diverses et rien n'a pas fait.le t-shirt que c'est divers, c'est rien