In [None]:
import pandas as pd

def get_column_data(csv_file, column_name):
    try:
        df = pd.read_csv(csv_file)
        if column_name in df.columns:
            return df[column_name].tolist()
        else:
            return None  # Retorna None se a coluna não existir
    except Exception as e:
        print(f"Erro ao ler o arquivo CSV: {e}")
        return None

csv_file = "stats/metricas_repo_combined.csv"

In [None]:
import matplotlib.pyplot as plt
import os

def plot_scatter(x_data, y_data, x_label, y_label, save_plot=False):
    """
    Plota um gráfico de dispersão (scatter plot) com os dados fornecidos e opcionalmente o salva como um arquivo PNG.

    Args:
        x_data (list or array): Os dados para o eixo X.
        y_data (list or array): Os dados para o eixo Y.
        x_label (str): Rótulo do eixo X.
        y_label (str): Rótulo do eixo Y.
        save_plot (bool): Se True, o gráfico será salvo como um arquivo PNG no diretório '/graficos'.
    """
    plt.scatter(x_data, y_data)
    plt.ticklabel_format(style='plain', useOffset=False)
    plt.xlabel(x_label)
    plt.ylabel(y_label)
    plt.title(f'Gráfico de Dispersão: {x_label} vs {y_label}')
    plt.grid(True)
    
    if save_plot:
        os.makedirs('graficos', exist_ok=True)
        file_name = f'grafico_{x_label}_{y_label}.png'
        plt.savefig(os.path.join('graficos', file_name))
    
    plt.show()

## Popularidade

In [None]:
plot_scatter(get_column_data(csv_file, "estrelas"), get_column_data(csv_file, "DIT"), "Estrelas", "DIT", True)
plot_scatter(get_column_data(csv_file, "estrelas"), get_column_data(csv_file, "CBO"), "Estrelas", "CBO", True)
plot_scatter(get_column_data(csv_file, "estrelas"), get_column_data(csv_file, "LCOM"), "Estrelas", "LCOM", True)

## Tamanho

In [None]:
plot_scatter(get_column_data(csv_file, "LOC"), get_column_data(csv_file, "DIT"), "LOC", "DIT", True)
plot_scatter(get_column_data(csv_file, "LOC"), get_column_data(csv_file, "CBO"), "LOC", "CBO", True)
plot_scatter(get_column_data(csv_file, "LOC"), get_column_data(csv_file, "LCOM"), "LOC", "LCOM", True)

## Atividade

In [None]:
plot_scatter(get_column_data(csv_file, "releases"), get_column_data(csv_file, "DIT"), "releases", "DIT", True)
plot_scatter(get_column_data(csv_file, "releases"), get_column_data(csv_file, "CBO"), "releases", "CBO", True)
plot_scatter(get_column_data(csv_file, "releases"), get_column_data(csv_file, "LCOM"), "releases", "LCOM", True)

## Maturidade

In [None]:
plot_scatter(get_column_data(csv_file, "idade"), get_column_data(csv_file, "DIT"), "Idade", "DIT", True)
plot_scatter(get_column_data(csv_file, "idade"), get_column_data(csv_file, "CBO"), "Idade", "CBO", True)
plot_scatter(get_column_data(csv_file, "idade"), get_column_data(csv_file, "LCOM"), "Idade", "LCOM", True)