# Loading Datasets

In [2]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


# Extract results

In [3]:
import zipfile
import os

zip_path = '/content/drive/MyDrive/Arquivos_Mestrado_Arthur_Ramires/Metodologia/ExtractionResults.zip'
extract_to = '/content/drive/MyDrive/Arquivos_Mestrado_Arthur_Ramires/Metodologia/ExtractionResults'

# Extraindo
with zipfile.ZipFile(zip_path, 'r') as zip_ref:
    zip_ref.extractall(extract_to)

KeyboardInterrupt: 

# Select Community results

In [None]:
import os
import shutil

# Caminhos
community_root_path = '/content/drive/MyDrive/Arquivos_Mestrado_Arthur_Ramires/Metodologia/ExtractionResults/ExtractionResults/Community'
output_path = '/content/drive/MyDrive/Arquivos_Mestrado_Arthur_Ramires/Metodologia/AnalysisData_Community'

# Criar a pasta de saída
os.makedirs(output_path, exist_ok=True)

# Função para copiar o arquivo `results_0.csv`
def copy_results_file(project_name, year, results_path):
    output_year_path = os.path.join(output_path, project_name, year)
    os.makedirs(output_year_path, exist_ok=True)

    source_file = os.path.join(results_path, "results_0.csv")
    if os.path.exists(source_file):
        destination_file = os.path.join(output_year_path, f"{project_name}_{year}_results_0.csv")
        shutil.copy2(source_file, destination_file)
        print(f"Arquivo results_0.csv copiado para {destination_file}")
    else:
        print(f"Arquivo results_0.csv não encontrado em {source_file}")

# Percorrer diretórios
for project_folder in os.listdir(community_root_path):
    project_path = os.path.join(community_root_path, project_folder)
    if not os.path.isdir(project_path):
        continue

    project_name = project_folder

    for year_folder in os.listdir(project_path):
        year_path = os.path.join(project_path, year_folder)
        if not os.path.isdir(year_path):
            continue

        # Procurar automaticamente pela pasta `results` descendo duas subpastas após o ano
        found_results_path = None
        for first_level_folder in os.listdir(year_path):
            first_level_path = os.path.join(year_path, first_level_folder)
            if not os.path.isdir(first_level_path):
                continue
            for second_level_folder in os.listdir(first_level_path):
                second_level_path = os.path.join(first_level_path, second_level_folder)
                if not os.path.isdir(second_level_path):
                    continue

                # Verifica se a pasta `results` está no segundo nível
                results_path = os.path.join(second_level_path, "results")
                if os.path.exists(results_path):
                    found_results_path = results_path
                    break
            if found_results_path:
                break

        # Se encontramos a pasta `results`, copiamos o arquivo `results_0.csv`
        if found_results_path:
            print(f"Processando {project_name} para o ano {year_folder}...")
            copy_results_file(project_name, year_folder, found_results_path)
        else:
            print(f"Pasta 'results' não encontrada para {project_name} no ano {year_folder}")

print("Processo de extração de dados concluído com sucesso!")


# Select Code results

In [5]:
import os
import shutil
import csv

# Caminhos
code_root_path = '/content/drive/MyDrive/Arquivos_Mestrado_Arthur_Ramires/Metodologia/ExtractionResults/ExtractionResults/Code'
output_path_code = '/content/drive/MyDrive/Arquivos_Mestrado_Arthur_Ramires/Metodologia/AnalysisData_Code'

# Criar a pasta de saída
os.makedirs(output_path_code, exist_ok=True)

# Função para copiar o arquivo `typeMetrics.csv`
def copy_type_metrics_file(project_name, year, type_metrics_path):
    output_year_path = os.path.join(output_path_code, project_name, year)
    os.makedirs(output_year_path, exist_ok=True)

    source_file = os.path.join(type_metrics_path, "typeMetrics.csv")

    # Validar se o arquivo tem mais de uma linha
    with open(source_file, 'r') as csv_file:
        reader = csv.reader(csv_file)
        row_count = sum(1 for row in reader)

    if row_count > 1:
        destination_file = os.path.join(output_year_path, f"{project_name}_{year}_typeMetrics.csv")
        shutil.copy2(source_file, destination_file)
        print(f"Arquivo typeMetrics.csv copiado para {destination_file}")
    else:
        print(f"Arquivo typeMetrics.csv em {source_file} não contém mais de uma linha. Ignorado.")

# Percorrer diretórios
for project_folder in os.listdir(code_root_path):
    project_path = os.path.join(code_root_path, project_folder)
    if not os.path.isdir(project_path):
        continue

    project_name = project_folder

    for year_folder in os.listdir(project_path):
        year_path = os.path.join(project_path, year_folder)
        if not os.path.isdir(year_path):
            continue

        # Verificar se o arquivo `typeMetrics.csv` existe na pasta do ano
        type_metrics_file = os.path.join(year_path, "typeMetrics.csv")

        if os.path.exists(type_metrics_file):
            print(f"Processando {project_name} para o ano {year_folder}...")
            copy_type_metrics_file(project_name, year_folder, year_path)
        else:
            print(f"Arquivo 'typeMetrics.csv' não encontrado para {project_name} no ano {year_folder}")

print("Processo de extração de dados concluído com sucesso!")


Processando traffic-manager-dotnet-manage-profiles para o ano 2020...
Arquivo typeMetrics.csv em /content/drive/MyDrive/Arquivos_Mestrado_Arthur_Ramires/Metodologia/ExtractionResults/ExtractionResults/Code/traffic-manager-dotnet-manage-profiles/2020/typeMetrics.csv não contém mais de uma linha. Ignorado.
Processando traffic-manager-dotnet-manage-profiles para o ano 2019...
Arquivo typeMetrics.csv em /content/drive/MyDrive/Arquivos_Mestrado_Arthur_Ramires/Metodologia/ExtractionResults/ExtractionResults/Code/traffic-manager-dotnet-manage-profiles/2019/typeMetrics.csv não contém mais de uma linha. Ignorado.
Processando acr-dotnet-manage-azure-container-registry para o ano 2019...
Arquivo typeMetrics.csv em /content/drive/MyDrive/Arquivos_Mestrado_Arthur_Ramires/Metodologia/ExtractionResults/ExtractionResults/Code/acr-dotnet-manage-azure-container-registry/2019/typeMetrics.csv não contém mais de uma linha. Ignorado.
Processando acr-dotnet-manage-azure-container-registry para o ano 2020...
