In [59]:
import pandas as pd
import glob


In [60]:
siglas = ["CBO", "LCO", "LOC", "WMC"]

In [61]:
def agrupar_df(df_lista: list, coluna="COL1") -> pd.DataFrame:
    """Concatena diversos dataframes de uma lista de dataframes agrupando as linhas"""
    serie_temporal_metrica = pd.concat(df_lista)
    serie_temporal_metrica = serie_temporal_metrica.groupby(serie_temporal_metrica[coluna]).sum()
    return serie_temporal_metrica


def create_serie_temporal(metrica: str) -> pd.DataFrame:
    """Recebe a sigla de uma das métricas utilizadas e combina todos os arquivos relacionados para montar uma série temporal"""
    dados = []

    def normalizar_2010_2011() -> None:
        # Aparentemente para os anos de 2010 e 2011 a coluna dos índices segue uma convenção diferente para os nomes,
        # o código abaixo normaliza estes nomes segundo o padrão observado nos dataframes para os anos posteriores.
        for i in dados[:2]:
            i["COL1"] = i["COL1"].str.replace("org.springframework.", "spring-", regex=False)

    for csv in glob.iglob(f"D:\OneDrive\Documentos\ciencia_da_computacao\segundo_semestre\programacao_de_computadores\desafio_pandas2\spring-framework\{metrica}*.csv"):
        temp_df = pd.read_csv(csv)
        dados.append(temp_df)

    normalizar_2010_2011()    # Comentar esta linha caso esse passo seja desnecessário

    serie_temporal = agrupar_df(dados)
    return serie_temporal


In [62]:
solucao_agg = [create_serie_temporal(metrica) for metrica in siglas]

In [63]:
solucao = pd.concat(solucao_agg).groupby("COL1").sum().drop_duplicates()
solucao.to_csv("desafioPandas2.csv")

In [64]:
solucao_alt = solucao.groupby("COL1").sum().stack().drop_duplicates()
solucao_alt.to_csv("desafioPandas2alt.csv")

In [65]:
print(solucao)

                                                    CBO2010  CBO2011  CBO2012  \
COL1                                                                            
/mnt/dados/projetopydriller/spring-framework/bu...      0.0      0.0      0.0   
/mnt/dados/projetopydriller/spring-framework/bu...      0.0      0.0      0.0   
/mnt/dados/projetopydriller/spring-framework/bu...      0.0      0.0      0.0   
/mnt/dados/projetopydriller/spring-framework/bu...      0.0      0.0      0.0   
/mnt/dados/projetopydriller/spring-framework/gr...      0.0      0.0      0.0   
...                                                     ...      ...      ...   
/mnt/dados/projetopydriller/spring-framework/sr...      0.0      0.0      2.0   
/mnt/dados/projetopydriller/spring-framework/sr...      0.0      0.0    235.0   
/mnt/dados/projetopydriller/spring-framework/sr...      0.0      0.0     15.0   
/mnt/dados/projetopydriller/spring-framework/sr...      0.0      0.0      2.0   
/mnt/dados/projetopydriller/