In [None]:
pip install pydub

In [None]:
import os
import pandas as pd
from pydub.utils import mediainfo
from pydub import AudioSegment
import matplotlib.pyplot as plt
import numpy as np

Arquivo: O nome do arquivo de áudio.

Duração: A duração total do arquivo de áudio em segundos.

Taxa de bits: A taxa de bits do arquivo de áudio. A taxa de bits é a quantidade de dados que são processados por unidade de tempo no arquivo de áudio.

Taxa de amostragem: A taxa de amostragem do arquivo de áudio. A taxa de amostragem é o número de amostras de áudio capturadas por segundo.

Canais: O número de canais de áudio no arquivo. Por exemplo, “1” para mono e “2” para estéreo.

Codec: O tipo de codec usado para codificar o arquivo de áudio.
Frequência de bits: A frequência de bits do arquivo de áudio.
 A frequência de bits é a taxa de bits por segundo do áudio.

Média de amplitude: A média das amplitudes das amostras de áudio.

Mediana de amplitude: A mediana das amplitudes das amostras de áudio.

Amplitude mínima: A menor amplitude entre as amostras de áudio.

Amplitude máxima: A maior amplitude entre as amostras de áudio.

Desvio padrão da amplitude: O desvio padrão das amplitudes das amostras de áudio.

In [None]:
def extract_metadata_from_folder(folder_path):
    # Lista todos os arquivos na pasta
    files = os.listdir(folder_path)

    # Filtra apenas os arquivos de áudio (por exemplo, .mp3)
    audio_files = [file for file in files if file.endswith('.mp3')]

    # Cria um DataFrame vazio para armazenar os metadados
    df = pd.DataFrame(columns=["Arquivo", "Duração", "Taxa de bits",
                               "Taxa de amostragem", "Canais", "Codec",
                               "Frequência de bits", "Média de amplitude",
                               "Mediana de amplitude", "Amplitude mínima",
                               "Amplitude máxima", "Desvio padrão da amplitude",
                               "Tamanho do arquivo (MB)"])

    # Extrai metadados de cada arquivo de áudio
    for audio_file in audio_files:
        file_path = os.path.join(folder_path, audio_file)
        info = mediainfo(file_path)
        audio = AudioSegment.from_file(file_path)

        # Extrai metadados
        duration = info["duration"]
        bit_rate = info["bit_rate"]
        sample_rate = info["sample_rate"]
        channels = info["channels"]
        codec = info["codec_name"]
        bit_rate = info["bit_rate"]

        # Calcula estatísticas do sinal de áudio
        samples = np.array(audio.get_array_of_samples())
        mean_amplitude = np.mean(samples)
        median_amplitude = np.median(samples)
        min_amplitude = np.min(samples)
        max_amplitude = np.max(samples)
        std_amplitude = np.std(samples)

        # Obtém o tamanho do arquivo em MB
        file_size_MB = os.path.getsize(file_path) / (1024 * 1024)

        # Adiciona os metadados ao DataFrame
        data = pd.DataFrame({
            "Arquivo": [audio_file],
            "Duração": [duration],
            "Taxa de bits": [bit_rate],
            "Taxa de amostragem": [sample_rate],
            "Canais": [channels],
            "Codec": [codec],
            "Frequência de bits": [bit_rate],
            "Média de amplitude": [mean_amplitude],
            "Mediana de amplitude": [median_amplitude],
            "Amplitude mínima": [min_amplitude],
            "Amplitude máxima": [max_amplitude],
            "Desvio padrão da amplitude": [std_amplitude],
            "Tamanho do arquivo (MB)": [file_size_MB]
        })
        df = pd.concat([df, data], ignore_index=True)

    return df

# Uso da função
df = extract_metadata_from_folder("/content/audio_files")
df.to_csv("/content/audio_info.csv", index=False)
df


Unnamed: 0,Arquivo,Duração,Taxa de bits,Taxa de amostragem,Canais,Codec,Frequência de bits,Média de amplitude,Mediana de amplitude,Amplitude mínima,Amplitude máxima,Desvio padrão da amplitude,Tamanho do arquivo (MB)
0,06 - The Zephyr Song.mp3,232.896,320004,48000,2,mp3,320004,-2.80295,16.0,-32768,32767,9207.860886,8.884407
1,04 - Dosed.mp3,312.144,320003,48000,2,mp3,320003,-1.949798,128.0,-32768,32767,8933.860942,11.907469
2,15 - Warm Tape.mp3,256.608,320004,48000,2,mp3,320004,-3.727987,0.0,-32768,32767,9484.853115,9.788943
3,09 - Midnight.mp3,295.608,320003,48000,2,mp3,320003,-2.79616,51.0,-32768,32767,9565.98991,11.276673
4,14 - Minor Thing.mp3,217.776,320004,48000,2,mp3,320004,-2.279238,27.0,-32768,32767,9476.575267,8.307622
5,16 - Venice Queen.mp3,367.056,320002,48000,2,mp3,320002,-2.674234,-5.0,-32768,32767,8913.22719,14.002203
6,05 - Don't Forget Me.mp3,277.92,320003,48000,2,mp3,320003,-1.940445,49.0,-32768,32767,8208.824551,10.601936
7,08 - I Could Die for You.mp3,193.872,320005,48000,2,mp3,320005,-1.729102,0.0,-32768,32767,8244.007686,7.395763
8,03 - This is the Place.mp3,257.736,320004,48000,2,mp3,320004,-4.579809,-46.0,-32768,32767,9620.796526,9.83198
9,07 - Can't Stop.mp3,269.352,320003,48000,2,mp3,320003,-5.424906,-22.0,-32768,32767,9113.351278,10.275088
