In [11]:
import pandas as pd
import os

In [12]:
# Configurações
work_directory = "../../combustiveis/"
final_dataset_name = "dataset_etanol_gasolina_gnv_guarulhos.csv"

In [13]:
# Adquire os nomes dos arquivos existentes no diretório
# Cada nome de arquivo representa uma entrada semestral do dataset
filenames = next(os.walk(work_directory), (None, None, []))[2]

In [14]:
# Cria um dataframe para unificar todas as entradas semestrais
final_df = pd.DataFrame()

In [15]:
# Primeiro, remover arquivo existente de dataset final
# Isso é necessário pois se o arquivo já existir, iremos escrever mais dados sobre ele
# Dessa maneira, a fidelidade dos dados do dataset será prejudicada
try:
    os.remove(work_directory + final_dataset_name)
except OSError as e:
    print ("Nenhum arquivo existente de dataset final")

# Realiza leitura de cada um dos datasets semestrais e concatena em um único dataframe
i = 1

for filename in filenames:
    # Ignora arquivo de dataset final, ler apenas entradas semestrais
    if not "ca-" in filename:
        continue
        
    # Realiza leitura do dataset
    df = pd.read_csv(work_directory + filename, sep=";", decimal=",", encoding="cp860")
    
     
    # Aplicar filtros desejados para o dataset
    df = df[((df["Produto"] == "ETANOL") | (df["Produto"] == "GASOLINA") | (df["Produto"] == "GNV")) & (df["Municipio"] == "GUARULHOS")]

    
    # Acrescenta coluna com o identificador do semestre
    df.insert(0, "Semestre", filename[3:10], True)

    # Para concatenar o dataframe no arquivo CSV, considerar o header apenas para a primeira entrada
    save_header = True if i == 1 else False
    
    # Concatena o dataframe lido com o dataframe geral
    df.to_csv(work_directory + final_dataset_name, mode="a", index=False, header=save_header)
    
    print(f'Leitura finalizada da entrada {i}')
    i += 1

print("Concatenação finalizada")

Leitura finalizada da entrada 1
Leitura finalizada da entrada 2
Leitura finalizada da entrada 3
Leitura finalizada da entrada 4
Leitura finalizada da entrada 5
Leitura finalizada da entrada 6
Leitura finalizada da entrada 7
Leitura finalizada da entrada 8
Leitura finalizada da entrada 9
Leitura finalizada da entrada 10
Leitura finalizada da entrada 11
Leitura finalizada da entrada 12
Leitura finalizada da entrada 13
Leitura finalizada da entrada 14
Leitura finalizada da entrada 15
Leitura finalizada da entrada 16
Leitura finalizada da entrada 17
Leitura finalizada da entrada 18
Leitura finalizada da entrada 19
Leitura finalizada da entrada 20
Leitura finalizada da entrada 21
Leitura finalizada da entrada 22
Leitura finalizada da entrada 23
Leitura finalizada da entrada 24
Leitura finalizada da entrada 25
Leitura finalizada da entrada 26
Leitura finalizada da entrada 27
Leitura finalizada da entrada 28
Leitura finalizada da entrada 29
Leitura finalizada da entrada 30
Leitura finalizada 