In [3]:
import pandas as pd
import numpy as np
from scipy import stats

# === Configurações ===
CSV_PATH = "tests_timings.csv"
ALPHA = 0.05
THRESHOLD = 1.4  # "London é ≥ 40% mais lenta que Detroit"


def load_timings(csv_path: str) -> pd.DataFrame:
    raw = pd.read_csv(csv_path, sep=None, engine="python")

    # O ficheiro tem uma primeira linha com rótulos para as primeiras 4 e últimas 4 colunas
    header_left = raw.iloc[0, :4].tolist()
    header_right = raw.iloc[0, 4:].tolist()
    columns = header_left + header_right

    df = raw.drop(0).reset_index(drop=True)
    df.columns = columns

    # Converter vírgulas decimais para ponto e depois para float
    df = df.map(lambda x: str(x).replace(",", "."))
    df = df.astype(float)

    df.columns = [
        "detroit_unitary_cases", "detroit_integration_cases",
        "london_unitary_cases",  "london_integration_cases",
        "detroit_unitary_classes", "detroit_integration_classes",
        "london_unitary_classes",  "london_integration_classes",
    ]
    return df


def one_sample_ratio_test(
    name: str,
    london: pd.Series,
    detroit: pd.Series,
    threshold: float = THRESHOLD,
    alpha: float = ALPHA,
) -> dict:
    ratio = london / detroit
    mean_ratio = ratio.mean()
    std_ratio = ratio.std(ddof=1)
    n = ratio.shape[0]

    # t-test unilateral à direita sobre a média da razão
    t_stat, p_val = stats.ttest_1samp(ratio, popmean=threshold, alternative="greater")

    # Caso a variância seja ~0, o t-test devolve NaN; decide pela média
    if np.isnan(t_stat) or np.isnan(p_val):
        decision = "Rejeita H0" if mean_ratio > threshold else "Não rejeita H0"
    else:
        decision = "Rejeita H0" if p_val < alpha else "Não rejeita H0"

    return {
        "medida": name,
        "n_execucoes": int(n),
        "media_Detroit": detroit.mean(),
        "media_London": london.mean(),
        "media_razao_LonDet": mean_ratio,
        "desvio_padrao_razao": std_ratio,
        "t_stat": t_stat,
        "p_value": p_val,
        "alpha": alpha,
        "threshold_razao": threshold,
        "decisao_(H0: mean<=threshold vs H1: mean>threshold)": decision,
    }


def main():
    df = load_timings(CSV_PATH)

    results = []

    # --- Testes Unitários ---
    results.append(one_sample_ratio_test(
        "Unitários (Test Cases)", df["london_unitary_cases"], df["detroit_unitary_cases"]
    ))

    results.append(one_sample_ratio_test(
        "Unitários (Classes)", df["london_unitary_classes"], df["detroit_unitary_classes"]
    ))

    # --- Testes de Integração ---
    results.append(one_sample_ratio_test(
        "Integração (Test Cases)", df["london_integration_cases"], df["detroit_integration_cases"]
    ))

    results.append(one_sample_ratio_test(
        "Integração (Classes)", df["london_integration_classes"], df["detroit_integration_classes"]
    ))

    summary = pd.DataFrame(results)

    # Guardar resultados
    out_path = "h1_time_execution_results.csv"
    summary.to_csv(out_path, index=False)

    # Mostrar no console
    pd.set_option("display.float_format", lambda v: f"{v:.6f}")
    print(summary)
    print(f"\nResultados guardados em: {out_path}")


if __name__ == "__main__":
    main()


                    medida  n_execucoes  media_Detroit  media_London  \
0   Unitários (Test Cases)           10       0.334400      1.661400   
1      Unitários (Classes)           10       0.379400      1.705000   
2  Integração (Test Cases)           10       1.253000      1.108000   
3     Integração (Classes)           10       8.506000     13.948800   

   media_razao_LonDet  desvio_padrao_razao  t_stat  p_value    alpha  \
0            4.969745             0.096982     NaN      NaN 0.050000   
1            4.494348             0.049515     NaN      NaN 0.050000   
2            0.884367             0.019930     NaN      NaN 0.050000   
3            1.641075             0.049320     NaN      NaN 0.050000   

   threshold_razao decisao_(H0: mean<=threshold vs H1: mean>threshold)  
0         1.400000                                         Rejeita H0   
1         1.400000                                         Rejeita H0   
2         1.400000                                     Não 