In [1]:
import torch
from transformers import pipeline
import sys
import os
from scipy.io import wavfile
from bs4 import BeautifulSoup

In [None]:
device = "cuda:0" if torch.cuda.is_available() else "cpu"
transcribe = pipeline(task="automatic-speech-recognition", model="BUT-FIT/whisper-ATC-czech-full", chunk_length_s=30, device=device)
# transcribe.model.config.forced_decoder_ids = transcribe.tokenizer.get_decoder_prompt_ids(task="transcribe", language="czech")
# setting the parameters of model for correct working
transcribe.generation_config.language = "czech"
transcribe.generation_config.task = "transcribe"
transcribe.generation_config.forced_decoder_ids = None


In [3]:
audio_path = "/mnt/datadisk/ATCO2-ASRdataset-v1_final/DATA_nonEN/"
file="LKTB_BRNO_Tower_119_605MHz_20201028_140027.wav"
print('Transcription:', transcribe(os.path.join(audio_path,file)))

f = open(os.path.join(audio_path,file).replace('.wav','.xml'), "r")
xml_data = f.read()
soup = BeautifulSoup(xml_data, "xml")
print(soup.find("text").text)

You have passed task=transcribe, but also have set `forced_decoder_ids` to [[1, 50283], [2, 50359], [3, 50363]] which creates a conflict. `forced_decoder_ids` will be ignored in favor of task=transcribe.
The attention mask is not set and cannot be inferred from input because pad token is same as eos token. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.


Transcription: {'text': 'Oscar Kilo Charlie Echo Sierra informace November QNH jedna nula jedna šest a jste povoleni za VFR na Sierru squawk čtyři tři dva nula\n'}
Oscar Kilo Charlie Echo Sierra informace november QNH jedna nula jedna šest a jste povolení za VFR na sierru squawk čtyři tři dva nula


In [4]:
def getTranscription(file_path, display_audio=False, print_ts=False) -> tuple:
    # model transcription
    model_ts = transcribe(file_path)['text'].rstrip()
    
    if (os.path.exists(file_path.replace('.wav','.xml'))):
        f = open(file_path.replace('.wav','.xml'), "r")
        xml_data = f.read()
        soup = BeautifulSoup(xml_data, "xml")
        xml_ts = soup.find("text").text
    
    if (display_audio):
        display(Audio(filename=file_path))
    
    if (print_ts):
        print('Model Transcription:', model_ts)
        print('XML Transcription:', xml_ts)
        
    return model_ts, xml_ts

In [5]:
import json, re, glob

def loadJsonFile(file_path):
    if (os.path.exists(file_path)):
        with open(file_path) as json_file:
            return json.load(json_file)
    else: 
        return {"ProcessedFiles":[],"Records":[]}

def saveJsonFile(file_path, data):  
    with open(file_path, 'w') as outfile:
        json.dump(data, outfile, indent=None, separators=(",", ": "))

jsonpath = "./data.json"
data = loadJsonFile(jsonpath)
transcribed_files = data['ProcessedFiles']

for path in glob.glob("/mnt/datadisk/ATCO2-ASRdataset-v1_final/DATA_nonEN/*.wav"):
    filename = os.path.basename(path)
    if (filename not in transcribed_files):
        # so far, process only cs recordings (meaning BRNO and RUZYNE in this case)
        r = re.search(r'^[^_]+_([^_]+)_([^_]+)', filename)
        
        if (r.group(1) in ['RUZYNE', 'BRNO']):
            model_ts, xml_ts = getTranscription(path)
            # read the wav file
            sample_rate, wavdata = wavfile.read(path)
            
            data['ProcessedFiles'].append(filename)
            data['Records'].append({"Audio_path": path, "Name":filename, "Array": wavdata.tolist(), "Sample_rate": sample_rate, "Model_ts": transcribe(path)['text'].rstrip(), "XML_ts" :xml_ts})
            
            print('Processed:', filename)

saveJsonFile('data.json', data)



Processed: LKTB_BRNO_Tower_119_605MHz_20201028_153007.wav




Processed: LKPR_RUZYNE_Tower_134_560MHz_20201029_151000.wav




Processed: LKPR_RUZYNE_Tower_134_560MHz_20201025_110406.wav




Processed: LKTB_BRNO_Approach-Radar_127_350MHz_20201028_143213.wav


You seem to be using the pipelines sequentially on GPU. In order to maximize efficiency please use a dataset


Processed: LKTB_BRNO_Tower_119_605MHz_20201028_163859.wav




Processed: LKPR_RUZYNE_Tower_134_560MHz_20201028_131126.wav




Processed: LKTB_BRNO_Tower_119_605MHz_20201028_140027.wav




Processed: LKPR_RUZYNE_Tower_134_560MHz_20201027_161901.wav




Processed: LKTB_BRNO_Approach_118_375MHz_20201029_200954.wav




Processed: LKPR_RUZYNE_Tower_134_560MHz_20201026_155626.wav




Processed: LKPR_RUZYNE_Tower_134_560MHz_20201027_094835.wav




Processed: LKPR_RUZYNE_Radar_120_520MHz_20201025_165054.wav




Processed: LKTB_BRNO_Tower_119_605MHz_20201027_144500.wav




Processed: LKTB_BRNO_Tower_119_605MHz_20201028_151525.wav




Processed: LKPR_RUZYNE_Radar_120_520MHz_20201029_174523.wav




Processed: LKTB_BRNO_Tower_119_605MHz_20201029_155930.wav




Processed: LKPR_RUZYNE_Tower_134_560MHz_20201026_155816.wav




Processed: LKPR_RUZYNE_Radar_120_520MHz_20201025_125020.wav




Processed: LKPR_RUZYNE_Tower_134_560MHz_20201025_132420.wav


In [28]:
from ipywidgets import widgets
from IPython.display import display

jsonpath = "./data.json"
jsondata = loadJsonFile(jsonpath)

for item in jsondata['Records']:
    # Create a text input widget
    text_correct_long = widgets.Text(
        placeholder="Long correct text",
        description="Model transcript:",
        value=item['Model_ts'],
        layout=widgets.Layout(width='1500px'),
        disabled=True
    )

    text_correct_short = widgets.Text(
        placeholder="Short correct text",
        description="XML transcript:",
        value=item['XML_ts'],
        layout=widgets.Layout(width='1500px'),
        disabled=True
    )
    
    text_new_ts = widgets.Text(
        placeholder="New transcript",
        disabled=False,
        value=item['XML_ts'],
        layout=widgets.Layout(width='1500px'),
        description="New transcript:"
    )
    # Create a button widget
    submit_button = widgets.Button(description="Submit")

    def save_new_jsonval():
        item['XML_ts'] = "thisismyspecialtext"
        # print('New transcript:', item['mytranscript'])
        
    # Set the button's click event to the function
    submit_button.on_click(lambda _: save_new_jsonval)

    # Display the widgets
    display(text_correct_long,text_correct_short, text_new_ts,submit_button)

# Create a button widget
fin_btn = widgets.Button(description="Write to JSON")
    
# Set the button's click event to the function
fin_btn.on_click(lambda _: saveJsonFile(jsonpath,jsondata))
display(fin_btn)

Text(value='Oscar Whiskey India Tři Sedm QNH jedna nula jedna šest maximumě dva tisíce pět set stop povolení T…

Text(value='Oscar Whiskey India Tři Sedm QNH jedna nula jedna šest maximálně dva tisíce pět set stop povolení …

Text(value='Oscar Whiskey India Tři Sedm QNH jedna nula jedna šest maximálně dva tisíce pět set stop povolení …

Button(description='Submit', style=ButtonStyle())

Text(value='Kunovice Nula Jedna v CTR uzlíní maximum dva tisíce pět set stop QNH jedna nula jedna osm', descri…

Text(value='Kryštof Nula Jedna v CTR Ruzyně maximálně dva tisíce pět set stop QNH jedna nula jedna osm', descr…

Text(value='Kryštof Nula Jedna v CTR Ruzyně maximálně dva tisíce pět set stop QNH jedna nula jedna osm', descr…

Button(description='Submit', style=ButtonStyle())

Text(value='Oscar Kilo Oscar Kilo Bravo v této poloze zahájte vyčkávání zatáčkou máme třistašedesát doleva', d…

Text(value='Oscar Kilo Oscar Kilo Bravo a v této poloze zahajte vyčkávání zatáčkama o tři sta šedesát doleva',…

Text(value='Oscar Kilo Oscar Kilo Bravo a v této poloze zahajte vyčkávání zatáčkama o tři sta šedesát doleva',…

Button(description='Submit', style=ButtonStyle())

Text(value='Oscar Kilo Whiskey Alpha India Tři Pět pokračujte přímo Kunovice', description='Model transcript:'…

Text(value='Oscar Kilo Whiskey Alfa India Tři Pět pokračujte přímo Kunovice', description='XML transcript:', d…

Text(value='Oscar Kilo Whiskey Alfa India Tři Pět pokračujte přímo Kunovice', description='New transcript:', l…

Button(description='Submit', style=ButtonStyle())

Text(value='Kunovice Věžov jedna dva schváleno na slyšenou\nna slyšenou na slyšenou', description='Model trans…

Text(value='Kryštof Jedna Dva schváleno naslyšenou', description='XML transcript:', disabled=True, layout=Layo…

Text(value='Kryštof Jedna Dva schváleno naslyšenou', description='New transcript:', layout=Layout(width='1500p…

Button(description='Submit', style=ButtonStyle())

Text(value='jak bylo na Lošiní\nno díky jak tady\nno teď už je tady hezké bylo', description='Model transcript…

Text(value='a jak bylo na Losinji', description='XML transcript:', disabled=True, layout=Layout(width='1500px'…

Text(value='a jak bylo na Losinji', description='New transcript:', layout=Layout(width='1500px'), placeholder=…

Button(description='Submit', style=ButtonStyle())

Text(value='Oscar Kilo Charlie Echo Sierra informace November QNH jedna nula jedna šest a jste povoleni za VFR…

Text(value='Oscar Kilo Charlie Echo Sierra informace november QNH jedna nula jedna šest a jste povolení za VFR…

Text(value='Oscar Kilo Charlie Echo Sierra informace november QNH jedna nula jedna šest a jste povolení za VFR…

Button(description='Submit', style=ButtonStyle())

Text(value='hello Věž\ndávej\npřes práci dva a nebo prosilete neměrem přes den\na zpolega je zlínu\nsuper díky…

Text(value='Follow Věž', description='XML transcript:', disabled=True, layout=Layout(width='1500px'), placehol…

Text(value='Follow Věž', description='New transcript:', layout=Layout(width='1500px'), placeholder='New transc…

Button(description='Submit', style=ButtonStyle())

Text(value='jedna osm čára tři sedm pět Brno na hradán a zkoušku\nto je nula tři sedm pět Bravo pětkou\npětkou…

Text(value='jedna jedna osm čára tři sedm pět Brno náhrada na zkoušku', description='XML transcript:', disable…

Text(value='jedna jedna osm čára tři sedm pět Brno náhrada na zkoušku', description='New transcript:', layout=…

Button(description='Submit', style=ButtonStyle())

Text(value=' kračujte jako levé stačně a jsi nic nejné', description='Model transcript:', disabled=True, layou…

Text(value='no pokračuj akorát bezpečně vo nic nejde', description='XML transcript:', disabled=True, layout=La…

Text(value='no pokračuj akorát bezpečně vo nic nejde', description='New transcript:', layout=Layout(width='150…

Button(description='Submit', style=ButtonStyle())

Text(value='Oscar Kilo Tango Oscar Charlie a za minutu opouštěte CTR rozumě a squawk sedm tisíc a na slyšenou\…

Text(value='Oskar Kilo Tango Oscar Charlie a za minutu opustíte CTR Ruzyně a squawk sedm tisíc a na slyšenou',…

Text(value='Oskar Kilo Tango Oscar Charlie a za minutu opustíte CTR Ruzyně a squawk sedm tisíc a na slyšenou',…

Button(description='Submit', style=ButtonStyle())

Text(value='Kunovice Alpha Jedna pardon Kryštof nula sedm dobrý večer opět a jejte finále zítkové Sady\nfinále…

Text(value='Kryštofe Jedna pardon Kryštofe [hes] Nula Sedm dobrý večer opět dejte finále Zítkovy sady', descri…

Text(value='Kryštofe Jedna pardon Kryštofe [hes] Nula Sedm dobrý večer opět dejte finále Zítkovy sady', descri…

Button(description='Submit', style=ButtonStyle())

Text(value='Oscar Kilo Lima Papa Victor contact radar one two seven decimal three five zero\nOscar Kilo Echo O…

Text(value='Oscar Kilo Lima Papa Victor contact radar one two seven decimal three five zero', description='XML…

Text(value='Oscar Kilo Lima Papa Victor contact radar one two seven decimal three five zero', description='New…

Button(description='Submit', style=ButtonStyle())

Text(value='Oscar Hotel Uniform Čtyry Dva pokračujte po Whiskey a oznamte opuštění ploch', description='Model …

Text(value='Oskar Hotel Uniform Čtyři Dva pokračujte po whiskey a oznamte opuštění ploch', description='XML tr…

Text(value='Oskar Hotel Uniform Čtyři Dva pokračujte po whiskey a oznamte opuštění ploch', description='New tr…

Button(description='Submit', style=ButtonStyle())

Text(value='rozumím Radar Oscar Kilo Whiskey Kilo Foxtrot dobrý večer\nOscar Kilo Whiskey Kilo Foxtrot dobré č…

Text(value='Ruzyně Radar Oskar Kilo Whisky Kilo Foxtrot dobrý večer', description='XML transcript:', disabled=…

Text(value='Ruzyně Radar Oskar Kilo Whisky Kilo Foxtrot dobrý večer', description='New transcript:', layout=La…

Button(description='Submit', style=ButtonStyle())

Text(value='Oscar Kilo Golf opacera dráha dva sedm přistání povoleno vítr dva čtyři nula stupňů pět uzlů uvoln…

Text(value='Oskar Kilo Golf Papa Sierra drahá dva sedm přistání povoleno vítr dva čtyři nula stupňů pět uzlů u…

Text(value='Oskar Kilo Golf Papa Sierra drahá dva sedm přistání povoleno vítr dva čtyři nula stupňů pět uzlů u…

Button(description='Submit', style=ButtonStyle())

Text(value='Alpha o třetí kousek ve na Mikeed na Bravo\n Mikeed na Bravo pouzej', description='Model transcrip…

Text(value='[unk] třetí kousek bude na Mike Jedna Bravo', description='XML transcript:', disabled=True, layout…

Text(value='[unk] třetí kousek bude na Mike Jedna Bravo', description='New transcript:', layout=Layout(width='…

Button(description='Submit', style=ButtonStyle())

Text(value='Praha Radar Oscar Kilo Whiskey Yankee Zulu dobré odpoledne a pokračujeme November\nOscar Kilo Whis…

Text(value='a Praha Radar Oskar Kilo Whisky Yankee Zulu dobré odpoledne a pokračuji november', description='XM…

Text(value='a Praha Radar Oskar Kilo Whisky Yankee Zulu dobré odpoledne a pokračuji november', description='Ne…

Button(description='Submit', style=ButtonStyle())

Text(value='po Alphě pokračuju pravý baseleg dráhy dva čtyři a ohlásím finále Oscar Kilo Papa Alpha Zulu', des…

Text(value='po alfě pokračuju pravý base lag dráhy dva čtyři a ohlásím [hes] finále Oskar Kilo Papa Alfa Zulu'…

Text(value='po alfě pokračuju pravý base lag dráhy dva čtyři a ohlásím [hes] finále Oskar Kilo Papa Alfa Zulu'…

Button(description='Submit', style=ButtonStyle())

Button(description='Write to JSON', style=ButtonStyle())

In [12]:
dd = {
    "name": "Jmeno",
    "surname": "Prijmeni", 
    'dalsidata': [
        {"name": "Jmeno1", "surname": "Prijmeni1"},
        {"name": "Jmeno2", "surname": "Prijmeni2"},
    ]
}
with open('test.json', 'w') as outfile:
    json.dump(dd,outfile)


In [15]:
ddload = json.load(open('test.json'))
print(ddload)
for item in ddload['dalsidata']:
    print(item['name'], item['surname'])
    item['name'] = f'New{item["name"]}'
    item['surname'] = f'New{item["surname"]}'
print(ddload)

{'name': 'Jmeno', 'surname': 'Prijmeni', 'dalsidata': [{'name': 'Jmeno1', 'surname': 'Prijmeni1'}, {'name': 'Jmeno2', 'surname': 'Prijmeni2'}]}
Jmeno1 Prijmeni1
Jmeno2 Prijmeni2
{'name': 'Jmeno', 'surname': 'Prijmeni', 'dalsidata': [{'name': 'NewJmeno1', 'surname': 'NewPrijmeni1'}, {'name': 'NewJmeno2', 'surname': 'NewPrijmeni2'}]}


In [10]:
ddload['name'] = 'Pavel'
with open('test.json', 'w') as outfile:
    json.dump(ddload,outfile)