# Audio-Dateien Transkribieren

Mit diesem Code kann man eine Audio-Datei transkribieren:

- Schritt I): User Input eingeben.
- Schritt II): Datei auswählen. Standardmäßig werden MP3-Dateien vorgeschlagen. Man kann bei der Dateiauswahl rechts unten weitere Datei-Endungen angeben.

Die Word-Datei wird im gleichen Ordner unter dem gleichen Dateinamen wie die ursprüngliche Audio-Datei abgespeichert.

Die Dateigröße darf höchstens 25MB betragen.

<div class="alert alert-block alert-info"> <b>Hinweis:</b> OpenAI-Whisper unterstützt 74 Sprachen, eine Liste findet sich unter <a href="https://whisper-api.com/docs/languages">https://whisper-api.com/docs/languages</a>.  </div>


In [1]:
# Import standard libraries - do not edit
from pathlib import Path
import FreeSimpleGUI as sg
from docx import Document
import whisper
from pytictoc import TicToc
import warnings

## User Input:

Vorgabe durch Benutzer.

In [2]:
path_start = Path(r'C:\Users\Christof\PycharmProjects\Audio-Transkription')
my_language = 'de'  # 'en', 'fr', 'de', etc.
my_model = 'base'  # large, medium, small, base, tiny
warnings.simplefilter(action='ignore', category=Warning)

## Modell laden

Code nicht ändern:

In [3]:
print('Lade Modell:', my_model)
try:
    whisper_model = whisper.load_model(my_model)
except:
    print('Unbekannter Fehler.')

Lade Modell: base


100%|███████████████████████████████████████| 139M/139M [00:20<00:00, 7.00MiB/s]


## Datei auswählen, Trankription.

Code nicht abändern.

In [None]:
if 'whisper_model' not in globals():
    print('Modell nicht gefunden, starte Notebook erneut.')
else:
    layout = [[sg.Input(key='_FILE_'),
               sg.FileBrowse(file_types=(("MP3", ".mp3"), ("*", ".*")), button_text="Auswahl", initial_folder=path_start)],
              [sg.Button('OK'), sg.Button('Abbruch')]]
    window = sg.Window('Auswahl Audio-Datei', layout)
    event2, values2 = window.read()
    window.close()
    
    if event2 == 'OK':
        t = TicToc()
        t.tic()
        print('Starte Transkription')
        try:
            result = whisper_model.transcribe(values2['_FILE_'], language=my_language, fp16=False, verbose=True)
            print('erfolgreich')
            t.toc()
            # save file
            print('Word-Datei speichern')
            document = Document()
            document.add_paragraph(result["text"])
            try:
                document.save(str(Path(values2['_FILE_']).parent / Path(values2['_FILE_']).stem) + '.docx')
                print('erfolgreich')
                print('Transkription beendet.')
            except PermissionError:
                print(f'Datei speichern fehlgeschlagen. Möglicherweise ist die Datei  {Path(values2["_FILE_"]).stem}.docx  noch geöffnet.')
    
        except RuntimeError:
            print('fehlgeschlagen, Dateiformat überprüfen')
    
    else:
        print('Keine Datei ausgewählt, Vorgang wiederholen.')