## 1ï¸âƒ£ Setup - Clonar RepositÃ³rio e Verificar GPU

In [None]:
# Clonar repositÃ³rio do GitHub
!git clone https://github.com/gabrielamds/k-means-1d.git
%cd k-means-1d

# Verificar GPU disponÃ­vel
!nvidia-smi --query-gpu=name,memory.total,compute_cap --format=csv

## ðŸ“‹ Coletar InformaÃ§Ãµes do Ambiente

Esta cÃ©lula coleta informaÃ§Ãµes detalhadas do ambiente de execuÃ§Ã£o para o relatÃ³rio acadÃªmico.

In [None]:
import json
import subprocess
import os

# Coletar informaÃ§Ãµes do ambiente
env_info = {}

# GPU
gpu_info = subprocess.run(['nvidia-smi', '--query-gpu=name,memory.total', '--format=csv,noheader'], 
                         capture_output=True, text=True).stdout.strip().split(',')
env_info['gpu_name'] = gpu_info[0].strip()
env_info['gpu_memory'] = gpu_info[1].strip()

# CUDA Version
cuda_ver = subprocess.run(['nvcc', '--version'], capture_output=True, text=True).stdout
env_info['cuda_version'] = cuda_ver.split('release ')[-1].split(',')[0] if 'release' in cuda_ver else 'N/A'

# CPU
cpu_info = subprocess.run(['lscpu'], capture_output=True, text=True).stdout
for line in cpu_info.split('\n'):
    if 'Model name:' in line:
        env_info['cpu_model'] = line.split(':')[1].strip()
    elif 'CPU(s):' in line and 'NUMA' not in line and 'On-line' not in line:
        env_info['cpu_cores'] = line.split(':')[1].strip()

# RAM
mem_info = subprocess.run(['free', '-h'], capture_output=True, text=True).stdout.split('\n')[1]
env_info['ram_total'] = mem_info.split()[1]

# GCC Version
gcc_ver = subprocess.run(['gcc', '--version'], capture_output=True, text=True).stdout.split('\n')[0]
env_info['gcc_version'] = gcc_ver.split('gcc ')[-1].split()[0] if 'gcc' in gcc_ver else 'N/A'

# OpenMPI Version
mpi_ver = subprocess.run(['mpirun', '--version'], capture_output=True, text=True).stdout.split('\n')[0]
env_info['mpi_version'] = mpi_ver.strip()

# Salvar em JSON
os.makedirs('results', exist_ok=True)
with open('results/ambiente.json', 'w') as f:
    json.dump(env_info, f, indent=2)

# Mostrar informaÃ§Ãµes
print("="*60)
print("INFORMAÃ‡Ã•ES DO AMBIENTE")
print("="*60)
for key, value in env_info.items():
    print(f"{key:20s}: {value}")
print("="*60)
print("âœ“ Salvo em: results/ambiente.json")

## 2ï¸âƒ£ Gerar Datasets

Gera os mesmos dados usados no Windows (seeds 42, 43, 44):

In [None]:
# Gerar os 3 datasets
%cd data
!python3 generate_data.py --N 10000 --K 4 --output dados_pequeno --seed 42
!python3 generate_data.py --N 100000 --K 8 --output dados_medio --seed 43
!python3 generate_data.py --N 1000000 --K 16 --output dados_grande --seed 44

# Confirmar que foram criados
print("\nDatasets criados:")
!ls -lh *.csv
%cd ..

## 3ï¸âƒ£ Compilar CUDA

In [None]:
%%bash
cd cuda
nvcc -O2 -arch=sm_75 kmeans_1d_cuda.cu -o kmeans_1d_cuda
echo "âœ“ CUDA compilado com sucesso"
ls -lh kmeans_1d_cuda

---

# ðŸ“Š PARTE 1: CUDA PURO

## Benchmark CUDA - 3 Datasets

In [None]:
%%bash
echo "========================================="
echo "BENCHMARK: CUDA"
echo "========================================="

echo ""
echo "--- Dataset PEQUENO (10K, K=4) ---"
cuda/kmeans_1d_cuda data/dados_pequeno.csv data/dados_pequeno_centroides_init.csv 50 1e-6 256

echo ""
echo "--- Dataset MÃ‰DIO (100K, K=8) ---"
cuda/kmeans_1d_cuda data/dados_medio.csv data/dados_medio_centroides_init.csv 50 1e-6 256

echo ""
echo "--- Dataset GRANDE (1M, K=16) ---"
cuda/kmeans_1d_cuda data/dados_grande.csv data/dados_grande_centroides_init.csv 50 1e-6 256

## Testar Diferentes ConfiguraÃ§Ãµes (Threads per Block)

In [None]:
%%bash
echo "=== Variando Threads per Block (Dataset Grande) ==="
for TPB in 128 256 512 1024; do
    echo ""
    echo "Threads/Block: $TPB"
    cuda/kmeans_1d_cuda data/dados_grande.csv data/dados_grande_centroides_init.csv 50 1e-6 $TPB | grep "Tempo"
done

## ðŸ“Š AnÃ¡lise Detalhada: Impacto do Block Size

Testa sistematicamente diferentes block sizes para anÃ¡lise acadÃªmica.

In [None]:
import subprocess
import re
import csv
import os

print("="*60)
print("ANÃLISE: IMPACTO DO BLOCK SIZE NO CUDA")
print("="*60)

# Verificar se o executÃ¡vel existe
if not os.path.exists('cuda/kmeans_1d_cuda'):
    print("\nâŒ ERRO: ExecutÃ¡vel cuda/kmeans_1d_cuda nÃ£o encontrado!")
    print("\nðŸ“‹ Execute a cÃ©lula de compilaÃ§Ã£o CUDA primeiro:")
    print("   %%bash")
    print("   cd cuda")
    print("   nvcc -O2 -arch=sm_75 kmeans_1d_cuda.cu -o kmeans_1d_cuda")
    print("\nâš ï¸  IMPORTANTE: Esta cÃ©lula deve ser executada no Google Colab com GPU!")
else:
    block_sizes = [64, 128, 256, 512, 1024]
    results = []

    for bs in block_sizes:
        print(f"\nTestando block size {bs}...", end=" ", flush=True)
        
        cmd = f"cuda/kmeans_1d_cuda data/dados_grande.csv data/dados_grande_centroides_init.csv 50 1e-6 {bs}"
        result = subprocess.run(cmd, shell=True, capture_output=True, text=True)
        
        # Mostrar erros se houver
        if result.returncode != 0:
            print(f"ERRO (cÃ³digo {result.returncode})")
            if result.stderr:
                print(f"   Stderr: {result.stderr[:100]}")
            continue
        
        match = re.search(r'Tempo(?:\s+total)?:\s*([\d.]+)\s*ms', result.stdout)
        sse_match = re.search(r'SSE final:\s*([\d.]+)', result.stdout)
        
        if match:
            tempo = float(match.group(1))
            sse = float(sse_match.group(1)) if sse_match else 0.0
            print(f"{tempo:.2f} ms")
            results.append({'blocksize': bs, 'tempo_ms': tempo, 'sse': sse})
        else:
            print("ERRO: nÃ£o encontrou tempo no output")
            print(f"   Output: {result.stdout[:200]}")

    # Salvar resultados
    if results:
        os.makedirs('results', exist_ok=True)
        with open('results/cuda_blocksize.csv', 'w', newline='') as f:
            writer = csv.DictWriter(f, fieldnames=['blocksize', 'tempo_ms', 'sse'])
            writer.writeheader()
            writer.writerows(results)
        
        # Mostrar resumo
        print("\n" + "="*60)
        print("RESUMO:")
        print("="*60)
        print(f"{'Block Size':<15} {'Tempo (ms)':<15} {'SSE':<20}")
        print("-"*60)
        for r in results:
            print(f"{r['blocksize']:<15} {r['tempo_ms']:<15.2f} {r['sse']:<20.2f}")
        
        best = min(results, key=lambda x: x['tempo_ms'])
        print("="*60)
        print(f"âœ“ Melhor: {best['blocksize']} threads/block ({best['tempo_ms']:.2f} ms)")
        print(f"âœ“ Salvo em: results/cuda_blocksize.csv")
    else:
        print("\nâš ï¸  Nenhum resultado coletado!")
        print("Verifique se o executÃ¡vel foi compilado e se estÃ¡ no Colab.")

---

# ðŸ“Š PARTE 2: HYBRID (OpenMP + CUDA)

## Compilar OpenMP + CUDA

In [None]:
%%bash
cd hybrid
nvcc -O2 -arch=sm_75 -Xcompiler -fopenmp kmeans_1d_omp_cuda.cu -o kmeans_1d_omp_cuda
echo "âœ“ OpenMP + CUDA compilado"
ls -lh kmeans_1d_omp_cuda

## Benchmark OpenMP + CUDA

In [None]:
%%bash
echo "========================================="
echo "BENCHMARK: HYBRID (OpenMP + CUDA)"
echo "========================================="

datasets=("pequeno:10K:4" "medio:100K:8" "grande:1M:16")

for ds in "${datasets[@]}"; do
    IFS=':' read -r name N K <<< "$ds"
    echo ""
    echo "=== Dataset: ${name^^} (N=$N, K=$K) ==="
    
    for THREADS in 1 2 4 8; do
        echo "  OpenMP $THREADS threads + CUDA:"
        OMP_NUM_THREADS=$THREADS hybrid/kmeans_1d_omp_cuda \
            data/dados_$name.csv data/dados_${name}_centroides_init.csv \
            50 1e-6 256 | grep "Tempo"
    done
done

---

# ðŸ“Š PARTE 4: HYBRID (MPI + CUDA)

In [None]:
%%bash
echo "========================================="
echo "BENCHMARK: HYBRID (OpenMP + MPI)"
echo "========================================="

datasets=("pequeno:10K:4" "medio:100K:8" "grande:1M:16")

for ds in "${datasets[@]}"; do
    IFS=':' read -r name N K <<< "$ds"
    echo ""
    echo "=== Dataset: ${name^^} (N=$N, K=$K) ==="
    
    echo "  1 processo MPI x 2 threads OpenMP:"
    OMP_NUM_THREADS=2 mpirun -np 1 --allow-run-as-root --oversubscribe \
        hybrid/kmeans_1d_omp_mpi \
        data/dados_$name.csv data/dados_${name}_centroides_init.csv \
        50 1e-6 | grep "Tempo"
    
    echo "  2 processos MPI x 1 thread OpenMP:"
    OMP_NUM_THREADS=1 mpirun -np 2 --allow-run-as-root --oversubscribe \
        hybrid/kmeans_1d_omp_mpi \
        data/dados_$name.csv data/dados_${name}_centroides_init.csv \
        50 1e-6 | grep "Tempo"
    
    echo "  2 processos MPI x 2 threads OpenMP:"
    OMP_NUM_THREADS=2 mpirun -np 2 --allow-run-as-root --oversubscribe \
        hybrid/kmeans_1d_omp_mpi \
        data/dados_$name.csv data/dados_${name}_centroides_init.csv \
        50 1e-6 | grep "Tempo"
done

## 3. Benchmark OpenMP + MPI (automÃ¡tico com salvamento)

In [None]:
%%bash
cd hybrid
mpicc -O2 -fopenmp kmeans_1d_omp_mpi.c -o kmeans_1d_omp_mpi -lm
echo "âœ“ OpenMP + MPI compilado"
ls -lh kmeans_1d_omp_mpi

## 2. Compilar OpenMP + MPI

---

# ðŸ“Š PARTE 3: HYBRID (OpenMP + MPI) - CPU apenas

## 1. Instalar OpenMPI

In [None]:
%%bash
echo "========================================="
echo "BENCHMARK: HYBRID (OpenMP + MPI)"
echo "========================================="

datasets=("pequeno:10K:4" "medio:100K:8" "grande:1M:16")

for ds in "${datasets[@]}"; do
    IFS=':' read -r name N K <<< "$ds"
    echo ""
    echo "=== Dataset: ${name^^} (N=$N, K=$K) ==="
    
    # Teste com diferentes combinaÃ§Ãµes MPI x OpenMP
    echo ""
    echo "  1 processo MPI x 2 threads OpenMP:"
    OMP_NUM_THREADS=2 mpirun -np 1 --allow-run-as-root --oversubscribe \
        hybrid/kmeans_1d_omp_mpi \
        data/dados_$name.csv data/dados_${name}_centroides_init.csv \
        50 1e-6 | grep "Tempo"
    
    echo "  2 processos MPI x 1 thread OpenMP:"
    OMP_NUM_THREADS=1 mpirun -np 2 --allow-run-as-root --oversubscribe \
        hybrid/kmeans_1d_omp_mpi \
        data/dados_$name.csv data/dados_${name}_centroides_init.csv \
        50 1e-6 | grep "Tempo"
    
    echo "  2 processos MPI x 2 threads OpenMP:"
    OMP_NUM_THREADS=2 mpirun -np 2 --allow-run-as-root --oversubscribe \
        hybrid/kmeans_1d_omp_mpi \
        data/dados_$name.csv data/dados_${name}_centroides_init.csv \
        50 1e-6 | grep "Tempo"
done

In [None]:
import subprocess
import re
import csv
import os

print("========================================")
print("EXECUTANDO BENCHMARKS: OpenMP+MPI")
print("========================================")

# Criar diretÃ³rio de resultados se nÃ£o existir
os.makedirs('results', exist_ok=True)

# Armazenar resultados
resultados = []

datasets = [
    ("pequeno", "10K", "4"),
    ("medio", "100K", "8"),
    ("grande", "1M", "16")
]

configs = [
    ("2t1p", 1, 2),  # 1 processo, 2 threads
    ("1t2p", 2, 1),  # 2 processos, 1 thread
    ("2t2p", 2, 2),  # 2 processos, 2 threads
]

for name, N, K in datasets:
    print(f"\n=== Dataset: {name.upper()} (N={N}, K={K}) ===")
    
    for config_name, nprocs, nthreads in configs:
        print(f"  Config {config_name} ({nprocs}p x {nthreads}t): ", end="", flush=True)
        
        cmd = [
            "mpirun", "-np", str(nprocs), 
            "--allow-run-as-root", "--oversubscribe",
            "hybrid/kmeans_1d_omp_mpi",
            f"data/dados_{name}.csv",
            f"data/dados_{name}_centroides_init.csv",
            "50", "1e-6"
        ]
        
        env = os.environ.copy()
        env["OMP_NUM_THREADS"] = str(nthreads)
        
        try:
            result = subprocess.run(cmd, capture_output=True, text=True, env=env, timeout=60)
            
            # Extrair tempo do output (flexÃ­vel: aceita "Tempo:" ou "Tempo total:")
            match = re.search(r'Tempo(?:\s+total)?:\s*([\d.]+)\s*ms', result.stdout)
            if match:
                tempo = float(match.group(1))
                print(f"{tempo:.2f} ms")
                
                # Extrair SSE
                sse_match = re.search(r'SSE final:\s*([\d.]+)', result.stdout)
                sse = float(sse_match.group(1)) if sse_match else 0.0
                
                resultados.append({
                    'dataset': name,
                    'implementacao': 'OpenMP+MPI',
                    'config': config_name,
                    'tempo_ms': tempo,
                    'sse': sse
                })
            else:
                print("ERRO: nÃ£o encontrou tempo no output")
                print(result.stdout)
        except Exception as e:
            print(f"ERRO: {e}")

# Salvar resultados em CSV
if resultados:
    csv_file = 'results/resultados_openmp_mpi.csv'
    with open(csv_file, 'w', newline='') as f:
        writer = csv.DictWriter(f, fieldnames=['dataset', 'implementacao', 'config', 'tempo_ms', 'sse'])
        writer.writeheader()
        writer.writerows(resultados)
    
    print(f"\nâœ“ Resultados salvos em: {csv_file}")
    print(f"âœ“ Total de {len(resultados)} mediÃ§Ãµes coletadas")
else:
    print("\nâš ï¸  Nenhum resultado foi coletado!")

In [None]:
!apt-get update -qq
!apt-get install -y openmpi-bin libopenmpi-dev -qq
print("âœ“ OpenMPI instalado")

## Compilar MPI + CUDA

In [None]:
%%bash
cd hybrid
nvcc -O2 -arch=sm_75 -I/usr/lib/x86_64-linux-gnu/openmpi/include \
    kmeans_1d_mpi_cuda.cu -o kmeans_1d_mpi_cuda \
    -L/usr/lib/x86_64-linux-gnu/openmpi/lib -lmpi
echo "âœ“ MPI + CUDA compilado"
ls -lh kmeans_1d_mpi_cuda

## Benchmark MPI + CUDA

In [None]:
%%bash
echo "========================================="
echo "BENCHMARK: HYBRID (MPI + CUDA)"
echo "========================================="

datasets=("pequeno:10K:4" "medio:100K:8" "grande:1M:16")

for ds in "${datasets[@]}"; do
    IFS=':' read -r name N K <<< "$ds"
    echo ""
    echo "=== Dataset: ${name^^} (N=$N, K=$K) ==="
    
    for PROCS in 1 2 4; do
        echo "  MPI $PROCS processos + CUDA:"
        mpirun -np $PROCS --allow-run-as-root --oversubscribe hybrid/kmeans_1d_mpi_cuda \
            data/dados_$name.csv data/dados_${name}_centroides_init.csv \
            50 1e-6 256 | grep "Tempo"
    done
done

---

# ðŸ“Š COMPARAÃ‡ÃƒO FINAL

In [None]:
import subprocess
import re
import pandas as pd

def extract_time(cmd):
    result = subprocess.run(cmd, shell=True, capture_output=True, text=True)
    match = re.search(r'Tempo.*?:\s*([\d.]+)\s*ms', result.stdout)
    return float(match.group(1)) if match else None

print("="*70)
print("RESUMO COMPARATIVO - Dataset GRANDE (1M pontos, K=16)")
print("="*70 + "\n")

results = []

# CUDA Puro
print("Testando CUDA...")
time_cuda = extract_time("cuda/kmeans_1d_cuda data/dados_grande.csv data/dados_grande_centroides_init.csv 50 1e-6 256")
results.append(('CUDA (256 TPB)', time_cuda))

# OpenMP + CUDA
for t in [1, 2, 4, 8]:
    print(f"Testando OpenMP({t}t) + CUDA...")
    time_hybrid = extract_time(
        f"OMP_NUM_THREADS={t} hybrid/kmeans_1d_omp_cuda "
        f"data/dados_grande.csv data/dados_grande_centroides_init.csv "
        f"50 1e-6 {t} 256"
    )
    results.append((f'OpenMP({t}t) + CUDA', time_hybrid))

# OpenMP + MPI (CPU apenas)
print("Testando OpenMP(2t) + MPI(1p)...")
time_hybrid = extract_time(
    "OMP_NUM_THREADS=2 mpirun -np 1 --allow-run-as-root --oversubscribe "
    "hybrid/kmeans_1d_omp_mpi "
    "data/dados_grande.csv data/dados_grande_centroides_init.csv 50 1e-6"
)
results.append(('OpenMP(2t) + MPI(1p)', time_hybrid))

print("Testando OpenMP(1t) + MPI(2p)...")
time_hybrid = extract_time(
    "OMP_NUM_THREADS=1 mpirun -np 2 --allow-run-as-root --oversubscribe "
    "hybrid/kmeans_1d_omp_mpi "
    "data/dados_grande.csv data/dados_grande_centroides_init.csv 50 1e-6"
)
results.append(('OpenMP(1t) + MPI(2p)', time_hybrid))

print("Testando OpenMP(2t) + MPI(2p)...")
time_hybrid = extract_time(
    "OMP_NUM_THREADS=2 mpirun -np 2 --allow-run-as-root --oversubscribe "
    "hybrid/kmeans_1d_omp_mpi "
    "data/dados_grande.csv data/dados_grande_centroides_init.csv 50 1e-6"
)
results.append(('OpenMP(2t) + MPI(2p)', time_hybrid))

# MPI + CUDA
for p in [1, 2, 4]:
    print(f"Testando MPI({p}p) + CUDA...")
    time_hybrid = extract_time(
        f"mpirun -np {p} --allow-run-as-root --oversubscribe "
        f"hybrid/kmeans_1d_mpi_cuda "
        f"data/dados_grande.csv data/dados_grande_centroides_init.csv 50 1e-6 256"
    )
    results.append((f'MPI({p}p) + CUDA', time_hybrid))

# Criar tabela
df = pd.DataFrame(results, columns=['ImplementaÃ§Ã£o', 'Tempo (ms)'])
df = df[df['Tempo (ms)'].notna()]

print("\n" + "="*70)
print(df.to_string(index=False))
print("="*70)

# Encontrar o mais rÃ¡pido
if not df.empty:
    fastest = df.loc[df['Tempo (ms)'].idxmin()]
    print(f"\nðŸ† Mais rÃ¡pido: {fastest['ImplementaÃ§Ã£o']} com {fastest['Tempo (ms)']:.2f} ms")

---

## âœ… Benchmark Completo!

Todos os testes foram executados com:
- âœ… CUDA puro (GPU)
- âœ… OpenMP + CUDA (CPU multi-thread + GPU)
- âœ… MPI + CUDA (DistribuÃ­do + GPU)

**PrÃ³ximos passos:**
1. Analisar os resultados
2. Comparar com resultados do Windows (Serial, OpenMP, MPI)
3. Gerar grÃ¡ficos de speedup
4. Documentar no relatÃ³rio

---

# ðŸ’¾ SALVAR TODOS OS RESULTADOS

Execute esta cÃ©lula para consolidar todos os resultados em um Ãºnico arquivo CSV que o script de anÃ¡lise irÃ¡ usar automaticamente.

---

# âœ… VALIDAÃ‡ÃƒO DE RESULTADOS

Verifica a consistÃªncia do SSE entre todas as implementaÃ§Ãµes.

In [None]:
import pandas as pd
import numpy as np
import os

print("="*70)
print("VALIDAÃ‡ÃƒO: CONSISTÃŠNCIA DE SSE ENTRE IMPLEMENTAÃ‡Ã•ES")
print("="*70)

# Verificar se existem resultados consolidados
results_files = []
if os.path.exists('results/resultados_colab.csv'):
    results_files.append('results/resultados_colab.csv')
if os.path.exists('results/resultados_windows.csv'):
    results_files.append('results/resultados_windows.csv')
if os.path.exists('results/resultados_openmp_mpi.csv'):
    results_files.append('results/resultados_openmp_mpi.csv')

if not results_files:
    print("\nâš ï¸  Nenhum arquivo de resultados encontrado!")
    print("Execute as cÃ©lulas de benchmark antes da validaÃ§Ã£o.")
else:
    # Carregar todos os resultados
    dfs = []
    for f in results_files:
        df = pd.read_csv(f)
        dfs.append(df)
    
    df_all = pd.concat(dfs, ignore_index=True)
    
    # Validar por dataset
    for dataset in ['pequeno', 'medio', 'grande']:
        df_ds = df_all[df_all['dataset'] == dataset].copy()
        
        if df_ds.empty:
            continue
        
        # Filtrar SSE vÃ¡lidos (> 0)
        df_ds = df_ds[df_ds['sse'] > 0]
        
        if df_ds.empty:
            continue
        
        print(f"\n{'='*70}")
        print(f"Dataset: {dataset.upper()}")
        print('='*70)
        
        # Agrupar por implementaÃ§Ã£o
        sse_summary = df_ds.groupby('implementacao')['sse'].agg(['mean', 'std', 'min', 'max']).reset_index()
        
        print(f"\n{'ImplementaÃ§Ã£o':<20} {'SSE MÃ©dio':<15} {'Desvio PadrÃ£o':<15}")
        print('-'*70)
        for _, row in sse_summary.iterrows():
            print(f"{row['implementacao']:<20} {row['mean']:<15.2f} {row['std']:<15.6f}")
        
        # Calcular variaÃ§Ã£o percentual
        sse_min = sse_summary['mean'].min()
        sse_max = sse_summary['mean'].max()
        variacao = ((sse_max - sse_min) / sse_min) * 100
        
        print(f"\n{'='*70}")
        print(f"VariaÃ§Ã£o entre implementaÃ§Ãµes: {variacao:.6f}%")
        
        if variacao < 0.001:
            print("âœ… VALIDADO: Todas implementaÃ§Ãµes convergem para mesmo resultado")
        elif variacao < 0.1:
            print("âš ï¸  ACEITÃVEL: Pequenas diferenÃ§as numÃ©ricas (tolerÃ¢ncia OK)")
        else:
            print("âŒ ATENÃ‡ÃƒO: DiferenÃ§as significativas detectadas!")

print(f"\n{'='*70}")
print("âœ“ ValidaÃ§Ã£o completa")

In [None]:
import subprocess
import re
import csv
import os
import pandas as pd

print("="*60)
print("EXECUTAR E CONSOLIDAR TODOS OS BENCHMARKS")
print("="*60)

# Criar diretÃ³rio de resultados
os.makedirs('results', exist_ok=True)

all_results = []

datasets = [
    ("pequeno", "10K", "4"),
    ("medio", "100K", "8"),
    ("grande", "1M", "16")
]

# ============================================
# 1. CUDA PURO
# ============================================
print("\n[1/4] CUDA...")
for name, N, K in datasets:
    print(f"  {name.upper()}: ", end="", flush=True)
    cmd = f"cuda/kmeans_1d_cuda data/dados_{name}.csv data/dados_{name}_centroides_init.csv 50 1e-6 256"
    result = subprocess.run(cmd, shell=True, capture_output=True, text=True)
    
    match = re.search(r'Tempo(?:\s+total)?:\s*([\d.]+)\s*ms', result.stdout)
    sse_match = re.search(r'SSE final:\s*([\d.]+)', result.stdout)
    
    if match:
        tempo = float(match.group(1))
        sse = float(sse_match.group(1)) if sse_match else 0.0
        print(f"{tempo:.2f} ms")
        all_results.append({'dataset': name, 'implementacao': 'CUDA', 'config': '-', 'tempo_ms': tempo, 'sse': sse})
    else:
        print("ERRO")

# ============================================
# 2. OpenMP + CUDA
# ============================================
print("\n[2/4] OpenMP+CUDA...")
for name, N, K in datasets:
    print(f"  {name.upper()}")
    for threads in [1, 2, 4, 8]:
        print(f"    {threads}t: ", end="", flush=True)
        env = os.environ.copy()
        env['OMP_NUM_THREADS'] = str(threads)
        cmd = f"hybrid/kmeans_1d_omp_cuda data/dados_{name}.csv data/dados_{name}_centroides_init.csv 50 1e-6 256"
        result = subprocess.run(cmd, shell=True, capture_output=True, text=True, env=env)
        
        match = re.search(r'Tempo(?:\s+total)?:\s*([\d.]+)\s*ms', result.stdout)
        sse_match = re.search(r'SSE final:\s*([\d.]+)', result.stdout)
        
        if match:
            tempo = float(match.group(1))
            sse = float(sse_match.group(1)) if sse_match else 0.0
            print(f"{tempo:.2f} ms")
            all_results.append({'dataset': name, 'implementacao': 'OpenMP+CUDA', 'config': f'{threads}t', 'tempo_ms': tempo, 'sse': sse})
        else:
            print("ERRO")

# ============================================
# 3. MPI + CUDA
# ============================================
print("\n[3/4] MPI+CUDA...")
for name, N, K in datasets:
    print(f"  {name.upper()}: ", end="", flush=True)
    cmd = f"mpirun -np 1 --allow-run-as-root hybrid/kmeans_1d_mpi_cuda data/dados_{name}.csv data/dados_{name}_centroides_init.csv 50 1e-6 256"
    result = subprocess.run(cmd, shell=True, capture_output=True, text=True)
    
    match = re.search(r'Tempo(?:\s+total)?:\s*([\d.]+)\s*ms', result.stdout)
    sse_match = re.search(r'SSE final:\s*([\d.]+)', result.stdout)
    
    if match:
        tempo = float(match.group(1))
        sse = float(sse_match.group(1)) if sse_match else 0.0
        print(f"{tempo:.2f} ms")
        all_results.append({'dataset': name, 'implementacao': 'MPI+CUDA', 'config': '1p', 'tempo_ms': tempo, 'sse': sse})
    else:
        print("ERRO")

# ============================================
# 4. Carregar OpenMP+MPI (se existir)
# ============================================
print("\n[4/4] OpenMP+MPI...")
if os.path.exists('results/resultados_openmp_mpi.csv'):
    df_omp_mpi = pd.read_csv('results/resultados_openmp_mpi.csv')
    print(f"  âœ“ Carregado: {len(df_omp_mpi)} mediÃ§Ãµes")
    all_results.extend(df_omp_mpi.to_dict('records'))
else:
    print("  âš ï¸  Arquivo nÃ£o encontrado. Execute a cÃ©lula de OpenMP+MPI primeiro!")

# ============================================
# SALVAR RESULTADOS
# ============================================
if all_results:
    df_final = pd.DataFrame(all_results)
    output_file = 'results/resultados_colab.csv'
    df_final.to_csv(output_file, index=False)
    
    print(f"\n{'='*60}")
    print(f"âœ… RESULTADOS CONSOLIDADOS")
    print(f"{'='*60}")
    print(f"Arquivo: {output_file}")
    print(f"Total: {len(df_final)} mediÃ§Ãµes")
    print(f"\nResumo por implementaÃ§Ã£o:")
    print(df_final.groupby('implementacao').size())
    print(f"\n{'='*60}")
    print("âœ… Agora execute a prÃ³xima cÃ©lula para anÃ¡lise completa")
    print(f"{'='*60}")
else:
    print("\nâš ï¸  NENHUM RESULTADO COLETADO!")


---

# ðŸ“ˆ ANÃLISE ACADÃŠMICA COMPLETA

Executa o script de anÃ¡lise completa que gera todos os grÃ¡ficos e relatÃ³rio detalhado.

In [None]:
!python scripts/analise_academica.py

---

# ðŸ“Š VISUALIZAR RESULTADOS NO COLAB

Visualize todos os grÃ¡ficos e o relatÃ³rio diretamente no notebook.

In [None]:
from IPython.display import Image, display, Markdown
import os

print("="*70)
print("VISUALIZANDO GRÃFICOS GERADOS")
print("="*70)

# Lista de grÃ¡ficos
graficos = [
    ('01_speedup_comparativo.png', 'ðŸ“Š Speedup Comparativo - Todas ImplementaÃ§Ãµes'),
    ('02_throughput.png', 'âš¡ Throughput (MilhÃµes de Pontos/Segundo)'),
    ('03_openmp_scaling.png', 'ðŸ”„ Escalabilidade OpenMP'),
    ('04_mpi_scaling.png', 'ðŸŒ Escalabilidade MPI'),
    ('05_cuda_blocksize.png', 'ðŸŽ¯ CUDA: Impacto do Block Size'),
    ('06_hibridas_comparacao.png', 'ðŸ”€ ComparaÃ§Ã£o de ImplementaÃ§Ãµes HÃ­bridas')
]

# Mostrar cada grÃ¡fico
for arquivo, titulo in graficos:
    caminho = f'results/{arquivo}'
    if os.path.exists(caminho):
        print(f"\n{'='*70}")
        print(f"{titulo}")
        print('='*70)
        display(Image(filename=caminho, width=900))
    else:
        print(f"\nâš ï¸  GrÃ¡fico nÃ£o encontrado: {arquivo}")

print("\n" + "="*70)
print("âœ“ VisualizaÃ§Ã£o completa!")
print("="*70)

## ðŸ“„ Visualizar RelatÃ³rio Completo

In [None]:
from IPython.display import Markdown, display
import os

# Ler e exibir o relatÃ³rio
relatorio_path = 'results/RELATORIO_COMPLETO.md'

if os.path.exists(relatorio_path):
    print("="*70)
    print("RELATÃ“RIO COMPLETO - K-MEANS 1D PARALELO")
    print("="*70)
    print()
    
    with open(relatorio_path, 'r', encoding='utf-8') as f:
        conteudo = f.read()
    
    # Exibir como Markdown formatado
    display(Markdown(conteudo))
    
    print("\n" + "="*70)
    print("âœ“ RelatÃ³rio exibido com sucesso!")
    print("="*70)
else:
    print("âš ï¸  RelatÃ³rio nÃ£o encontrado!")
    print("Execute a cÃ©lula de anÃ¡lise completa primeiro.")

## ðŸ“Š Resumo RÃ¡pido dos Resultados

In [None]:
import pandas as pd
import os

print("="*70)
print("RESUMO RÃPIDO - MELHORES RESULTADOS")
print("="*70)

# Carregar resultados
results_files = []
if os.path.exists('results/resultados_colab.csv'):
    results_files.append(pd.read_csv('results/resultados_colab.csv'))
if os.path.exists('results/resultados_windows.csv'):
    results_files.append(pd.read_csv('results/resultados_windows.csv'))

if results_files:
    df = pd.concat(results_files, ignore_index=True)
    
    # Dataset grande
    df_grande = df[df['dataset'] == 'grande'].copy()
    
    if not df_grande.empty:
        # Melhor de cada implementaÃ§Ã£o
        print("\nðŸ† DATASET GRANDE (1M pontos) - Melhor configuraÃ§Ã£o:")
        print("="*70)
        
        for impl in ['Serial', 'OpenMP', 'MPI', 'OpenMP+MPI', 'CUDA', 'OpenMP+CUDA', 'MPI+CUDA']:
            df_impl = df_grande[df_grande['implementacao'] == impl]
            if not df_impl.empty:
                best_idx = df_impl['tempo_ms'].idxmin()
                tempo = df_impl.loc[best_idx, 'tempo_ms']
                config = df_impl.loc[best_idx, 'config']
                sse = df_impl.loc[best_idx, 'sse']
                
                # Calcular speedup
                t_serial = df_grande[df_grande['implementacao'] == 'Serial']['tempo_ms'].min()
                if pd.notna(t_serial) and t_serial > 0:
                    speedup = t_serial / tempo
                    print(f"{impl:15s} | {config:8s} | {tempo:8.2f} ms | {speedup:5.2f}x | SSE: {sse:,.0f}")
                else:
                    print(f"{impl:15s} | {config:8s} | {tempo:8.2f} ms | SSE: {sse:,.0f}")
        
        # CampeÃ£o absoluto
        best_overall = df_grande.loc[df_grande['tempo_ms'].idxmin()]
        print("\n" + "="*70)
        print(f"ðŸ¥‡ CAMPEÃƒO ABSOLUTO: {best_overall['implementacao']} ({best_overall['config']})")
        print(f"   Tempo: {best_overall['tempo_ms']:.2f} ms")
        if pd.notna(t_serial) and t_serial > 0:
            print(f"   Speedup: {t_serial/best_overall['tempo_ms']:.2f}x vs Serial")
        print("="*70)
    
    # InformaÃ§Ãµes do ambiente
    if os.path.exists('results/ambiente.json'):
        import json
        with open('results/ambiente.json', 'r') as f:
            env = json.load(f)
        
        print("\nðŸ“‹ AMBIENTE:")
        print("="*70)
        print(f"GPU:  {env.get('gpu_name', 'N/A')} ({env.get('gpu_memory', 'N/A')})")
        print(f"CPU:  {env.get('cpu_model', 'N/A')[:50]}...")
        print(f"CUDA: {env.get('cuda_version', 'N/A')}")
        print("="*70)
    
else:
    print("\nâš ï¸  Nenhum arquivo de resultados encontrado!")
    print("Execute os benchmarks primeiro.")

print("\nâœ“ AnÃ¡lise rÃ¡pida concluÃ­da!")

---

# ðŸ“¥ DOWNLOAD DOS RESULTADOS

Use esta cÃ©lula para baixar todos os grÃ¡ficos e o relatÃ³rio completo para seu computador.

In [None]:
from google.colab import files

# Download dos grÃ¡ficos
print("Baixando grÃ¡ficos...")
files.download('results/01_speedup_comparativo.png')
files.download('results/02_throughput.png')
files.download('results/03_openmp_scaling.png')
files.download('results/04_mpi_scaling.png')
files.download('results/05_cuda_blocksize.png')
files.download('results/06_hibridas_comparacao.png')

# Download do relatÃ³rio
print("\nBaixando relatÃ³rio...")
files.download('results/RELATORIO_COMPLETO.md')

# Download dos CSVs
print("\nBaixando dados brutos...")
files.download('results/resultados_colab.csv')
files.download('results/ambiente.json')
files.download('results/cuda_blocksize.csv')

print("\nâœ… Download completo! Arquivos prontos para o trabalho acadÃªmico.")