In [None]:
import os
import sys
import pathlib
import csv
import librosa

def parse_commonvoice(input_data_path: str, output_data_path: str, output_csv_path: str):
    input_data_path = pathlib.Path(input_data_path)
    output_data_path = pathlib.Path(output_data_path)
    output_csv_path = pathlib.Path(output_csv_path)

    with open(input_data_path, 'rb') as input_file, open(output_data_path, 'wb') as output_file:
        output_file.write(input_file.read())

    csv_filename = output_data_path.stem + '.csv'
    csv_path = output_csv_path / csv_filename

    audio, sr = librosa.load(output_data_path)

    offset_start = 10  # Sekundy
    offset_end = 20  # Sekundy
    offset_start_samples = int(offset_start * sr)
    offset_end_samples = int(offset_end * sr)
    audio_offset = audio[offset_start_samples:offset_end_samples]
    dlugosc_sygnalu = len(audio_offset) / sr

    print("Długość sygnału (offset): {:.2f} sekundy".format(dlugosc_sygnalu))

    with open(csv_path, 'w', newline='') as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(['Cecha 1', 'Cecha 2', 'Cecha 3'])
        writer.writerow([1, 2, 3])
        writer.writerow([4, 5, 6])


def parse_openslr(input_data_path: str, output_data_path: str, output_csv_path: str):
    input_data_path = pathlib.Path(input_data_path)
    output_data_path = pathlib.Path(output_data_path)
    output_csv_path = pathlib.Path(output_csv_path)

    audio, sr = librosa.load(input_data_path)
    dlugosc_sygnalu = len(audio) / sr
    print("Długość sygnału: {:.2f} sekundy".format(dlugosc_sygnalu))
    offset_start = 10  # Sekundy
    offset_end = 20  # Sekundy

    offset_start_samples = int(offset_start * sr)
    offset_end_samples = int(offset_end * sr)
    audio_offset = audio[offset_start_samples:offset_end_samples]
    dlugosc_sygnalu_offset = len(audio_offset) / sr

    print("Długość sygnału (offset): {:.2f} sekundy".format(dlugosc_sygnalu_offset))

    librosa.output.write_wav(output_data_path, audio_offset, sr)

    with open(output_csv_path, 'w', newline='') as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(['Długość sygnału', 'Długość sygnału (offset)'])
        writer.writerow([dlugosc_sygnalu, dlugosc_sygnalu_offset])


def run(input_data_path: str, output_data_path: str, output_csv_path: str):
    input_data_path = pathlib.Path(input_data_path)
    output_data_path = pathlib.Path(output_data_path)
    output_csv_path = pathlib.Path(output_csv_path)

    audio, sr = librosa.load(input_data_path)
    dlugosc_sygnalu = len(audio) / sr
    print("Długość sygnału: {:.2f} sekundy".format(dlugosc_sygnalu))

    offset_start = 10  # Sekundy
    offset_end = 20  # Sekundy
    offset_start_samples = int(offset_start * sr)
    offset_end_samples = int(offset_end * sr)
    audio_offset = audio[offset_start_samples:offset_end_samples]
    dlugosc_sygnalu_offset = len(audio_offset) / sr

    print("Długość sygnału (offset): {:.2f} sekundy".format(dlugosc_sygnalu_offset))

    librosa.output.write_wav(output_data_path, audio_offset, sr)

    with open(output_csv_path, 'w', newline='') as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(['Długość sygnału', 'Długość sygnału (offset)'])
        writer.writerow([dlugosc_sygnalu, dlugosc_sygnalu_offset])


if __name__ == "__main__":
    input_folder_path = "ścieżka/do/folderu/wejściowego"
    output_folder_path = "ścieżka/do/folderu/wyjściowego"
    output_csv_path = "ścieżka/do/pliku/wynik.csv"


    for root, _, files in os.walk(input_folder_path):
        for file in files:
            if file.endswith(".wav"):
                input_data_path = os.path.join(root, file)
                output_data_path = os.path.join(output_folder_path, file)
                parse_commonvoice(input_data_path, output_data_path, output_csv_path)


    for root, _, files in os.walk(input_folder_path):
        for file in files:
            if file.endswith(".wav"):
                input_data_path = os.path.join(root, file)
                output_data_path = os.path.join(output_folder_path, file)
                parse_openslr(input_data_path, output_data_path, output_csv_path)
