In [1]:
import pandas as pd
import glob
import re
import os

In [2]:
def read_and_parse(file_path):
    """
    Lê um CSV no formato:
      - 1ª linha de cabeçalho (pulada)
      - Linhas: <State0 ... StateN>  Time  Trial
      - Possíveis linhas em branco
    Retorna DataFrame com colunas State0..StateN, Time e Trial.
    """
    df = pd.read_csv(
        file_path,
        sep=r"\s+|\t+",
        engine="python",
        header=None,
        skiprows=1,
        skip_blank_lines=True
    ).dropna(how='all')
    
    total_cols = df.shape[1]
    n_states = total_cols - 2
    state_cols = [f"State{i}" for i in range(n_states)]
    df.columns = state_cols + ["Time", "Trial"]
    return df


In [3]:
def average_trials_all():
    """
    Para cada prefixo <namebase> (ex: 'Beta1') encontrado em arquivos
    Beta1Data0.csv, Beta1Data1.csv, …,
    faz a média das trials por Time e salva Beta1Data_avg.csv.
    """
    pattern = re.compile(r"(.+?)Data\d+\.csv$")
    groups = {}
    for path in glob.glob("*.csv"):
        m = pattern.match(path)
        if m:
            prefix = m.group(1)
            groups.setdefault(prefix, []).append(path)
    
    if not groups:
        print("⚠️ Nenhum arquivo '*DataN.csv' encontrado.")
        return
    
    for prefix, files in groups.items():
        print(f"Processando '{prefix}': {len(files)} arquivos")
        dfs = [read_and_parse(f) for f in sorted(files)]
        all_df = pd.concat(dfs, ignore_index=True)
        avg_df = all_df.groupby("Time", as_index=False).mean()
        out_name = f"{prefix}Data_avg.csv"
        avg_df.to_csv(out_name, index=False)
        print(f"→ Salvo: {out_name}")


In [4]:
if __name__ == "__main__":
    average_trials_all()


Processando 'A2m_B0u_D10m': 3 arquivos
→ Salvo: A2m_B0u_D10mData_avg.csv
Processando 'A2m_B0u_D15m': 3 arquivos
→ Salvo: A2m_B0u_D15mData_avg.csv
Processando 'A2m_B0u_D20m': 3 arquivos
→ Salvo: A2m_B0u_D20mData_avg.csv
Processando 'A2m_B0u_D5m': 3 arquivos
→ Salvo: A2m_B0u_D5mData_avg.csv
Processando 'A2m_B100u_D10m': 3 arquivos
→ Salvo: A2m_B100u_D10mData_avg.csv
Processando 'A2m_B100u_D15m': 3 arquivos
→ Salvo: A2m_B100u_D15mData_avg.csv
Processando 'A2m_B100u_D20m': 3 arquivos
→ Salvo: A2m_B100u_D20mData_avg.csv
Processando 'A2m_B100u_D5m': 3 arquivos
→ Salvo: A2m_B100u_D5mData_avg.csv
Processando 'A2m_B150u_D10m': 3 arquivos
→ Salvo: A2m_B150u_D10mData_avg.csv
Processando 'A2m_B150u_D15m': 3 arquivos
→ Salvo: A2m_B150u_D15mData_avg.csv
Processando 'A2m_B150u_D20m': 3 arquivos
→ Salvo: A2m_B150u_D20mData_avg.csv
Processando 'A2m_B150u_D5m': 3 arquivos
→ Salvo: A2m_B150u_D5mData_avg.csv
Processando 'A2m_B200u_D10m': 3 arquivos
→ Salvo: A2m_B200u_D10mData_avg.csv
Processando 'A2m_B200

In [6]:
files = [f for f in os.listdir('.') if f.lower().endswith('.csv')]
count = len(files)
print(f"Encontrados {count} arquivos SVG na pasta atual:")
for f in files:
    print(f)

Encontrados 240 arquivos SVG na pasta atual:
A2m_B0u_D10mData0.csv
A2m_B0u_D10mData1.csv
A2m_B0u_D10mData2.csv
A2m_B0u_D10mData_avg.csv
A2m_B0u_D15mData0.csv
A2m_B0u_D15mData1.csv
A2m_B0u_D15mData2.csv
A2m_B0u_D15mData_avg.csv
A2m_B0u_D20mData0.csv
A2m_B0u_D20mData1.csv
A2m_B0u_D20mData2.csv
A2m_B0u_D20mData_avg.csv
A2m_B0u_D5mData0.csv
A2m_B0u_D5mData1.csv
A2m_B0u_D5mData2.csv
A2m_B0u_D5mData_avg.csv
A2m_B100u_D10mData0.csv
A2m_B100u_D10mData1.csv
A2m_B100u_D10mData2.csv
A2m_B100u_D10mData_avg.csv
A2m_B100u_D15mData0.csv
A2m_B100u_D15mData1.csv
A2m_B100u_D15mData2.csv
A2m_B100u_D15mData_avg.csv
A2m_B100u_D20mData0.csv
A2m_B100u_D20mData1.csv
A2m_B100u_D20mData2.csv
A2m_B100u_D20mData_avg.csv
A2m_B100u_D5mData0.csv
A2m_B100u_D5mData1.csv
A2m_B100u_D5mData2.csv
A2m_B100u_D5mData_avg.csv
A2m_B150u_D10mData0.csv
A2m_B150u_D10mData1.csv
A2m_B150u_D10mData2.csv
A2m_B150u_D10mData_avg.csv
A2m_B150u_D15mData0.csv
A2m_B150u_D15mData1.csv
A2m_B150u_D15mData2.csv
A2m_B150u_D15mData_avg.csv
A2m_B