In [8]:
import pandas as pd
import os
import sys
from pathlib import Path  # Melhor forma para trabalhar com caminhos

def clean_currency(value):
    """Função para limpar valores monetários com formatos diversos"""
    if isinstance(value, str):
        # Remove pontos como separador de milhar e substitui vírgula por ponto decimal
        value = value.replace('.', '').replace(',', '.')
        # Remove caracteres não numéricos (exceto ponto e sinal negativo)
        value = ''.join(c for c in value if c.isdigit() or c in '.-')
    try:
        return float(value) if value else None
    except (ValueError, TypeError):
        return None

def process_files(input_folder, output_folder):
    """Processa todos os arquivos CSV na pasta de entrada e salva na pasta de saída"""
    # Garante que a pasta de saída existe
    Path(output_folder).mkdir(parents=True, exist_ok=True)
    
    dataframes = {}
    
    for arquivo in os.listdir(input_folder):
        if arquivo.endswith('.csv'):
            try:
                nome = os.path.splitext(arquivo)[0]
                file_path = os.path.join(input_folder, arquivo)
                
                # Ler o CSV
                df = pd.read_csv(file_path, encoding='utf-8')
                dataframes[nome] = df
                
                # Transformar de wide para long
                df_long = df.melt(
                    id_vars=['Produto/Unidade', 'Nível de Comercialização', 'U.F.'],
                    var_name='data',
                    value_name='valor'
                )
                
                # Limpeza dos valores
                df_long['valor'] = df_long['valor'].apply(clean_currency)
                
                # Tratamento de nulos
                df_long['valor'].fillna(0, inplace=True)
                
                # Ordenação
                df_long = df_long.sort_values(['Produto/Unidade', 'U.F.', 'data'])
                
                # Salvar arquivo processado
                output_file = f"{nome}_rotacionado.csv"
                output_path = os.path.join(output_folder, output_file)
                df_long.to_csv(output_path, index=False, encoding='utf-8')
                
                print(f"Arquivo {arquivo} processado com sucesso! Salvo como {output_file}")
                print(df_long.head())
                
            except Exception as e:
                print(f"Erro ao processar o arquivo {arquivo}: {str(e)}")

# Configuração dos caminhos (usando Path para compatibilidade entre sistemas)
base_dir = Path("C:/digital college/DA18/PYTHON/Projeto_Unidade_3/_4_Etapa_ETL")
input_folder = base_dir / "datasets_tratados"
output_folder = base_dir / "datasets_rotacionados"

# Executar o processamento
process_files(input_folder, output_folder)

The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_long['valor'].fillna(0, inplace=True)


Arquivo relatorio_preco_medio_mensal_2014_tratado.csv processado com sucesso! Salvo como relatorio_preco_medio_mensal_2014_tratado_rotacionado.csv
     Produto/Unidade Nível de Comercialização U.F.     data  valor
18      ABACAXI (un)                  ATACADO   AL  01/2014   2.68
1255    ABACAXI (un)                  ATACADO   AL  02/2014   3.03
2492    ABACAXI (un)                  ATACADO   AL  03/2014   3.25
3729    ABACAXI (un)                  ATACADO   AL  04/2014   3.25
4966    ABACAXI (un)                  ATACADO   AL  05/2014   1.51


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_long['valor'].fillna(0, inplace=True)


Arquivo relatorio_preco_medio_mensal_2015_tratado.csv processado com sucesso! Salvo como relatorio_preco_medio_mensal_2015_tratado_rotacionado.csv
     Produto/Unidade Nível de Comercialização U.F.     data  valor
20      ABACAXI (un)                  ATACADO   AL  01/2015   1.48
2021    ABACAXI (un)                  ATACADO   AL  02/2015   1.48
4022    ABACAXI (un)                  ATACADO   AL  03/2015   2.04
6023    ABACAXI (un)                  ATACADO   AL  04/2015   2.04
8024    ABACAXI (un)                  ATACADO   AL  05/2015   1.67


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_long['valor'].fillna(0, inplace=True)


Arquivo relatorio_preco_medio_mensal_2016_tratado.csv processado com sucesso! Salvo como relatorio_preco_medio_mensal_2016_tratado_rotacionado.csv
     Produto/Unidade Nível de Comercialização U.F.     data  valor
26      ABACAXI (un)                  ATACADO   AL  01/2016   2.50
2468    ABACAXI (un)                  ATACADO   AL  02/2016   3.75
4910    ABACAXI (un)                  ATACADO   AL  03/2016   4.00
7352    ABACAXI (un)                  ATACADO   AL  04/2016   4.20
9794    ABACAXI (un)                  ATACADO   AL  05/2016   4.00


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_long['valor'].fillna(0, inplace=True)


Arquivo relatorio_preco_medio_mensal_2017_tratado.csv processado com sucesso! Salvo como relatorio_preco_medio_mensal_2017_tratado_rotacionado.csv
     Produto/Unidade Nível de Comercialização U.F.     data  valor
22      ABACAXI (un)                  ATACADO   AL  01/2017   3.33
2216    ABACAXI (un)                  ATACADO   AL  02/2017   3.50
4410    ABACAXI (un)                  ATACADO   AL  03/2017   3.54
6604    ABACAXI (un)                  ATACADO   AL  04/2017   3.00
8798    ABACAXI (un)                  ATACADO   AL  05/2017   2.83


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_long['valor'].fillna(0, inplace=True)


Arquivo relatorio_preco_medio_mensal_2018_tratado.csv processado com sucesso! Salvo como relatorio_preco_medio_mensal_2018_tratado_rotacionado.csv
       Produto/Unidade Nível de Comercialização U.F.     data  valor
0     10-30-15 (50 kg)                 PRODUTOR   AL  01/2018   1.06
2139  10-30-15 (50 kg)                 PRODUTOR   AL  02/2018   1.15
4278  10-30-15 (50 kg)                 PRODUTOR   AL  03/2018   1.47
6417  10-30-15 (50 kg)                 PRODUTOR   AL  04/2018   1.30
8556  10-30-15 (50 kg)                 PRODUTOR   AL  05/2018   1.30


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_long['valor'].fillna(0, inplace=True)


Arquivo relatorio_preco_medio_mensal_2019_tratado.csv processado com sucesso! Salvo como relatorio_preco_medio_mensal_2019_tratado_rotacionado.csv
     Produto/Unidade Nível de Comercialização U.F.     data  valor
26      ABACAXI (un)                  ATACADO   AL  01/2019   1.50
2106    ABACAXI (un)                  ATACADO   AL  02/2019  12.00
4186    ABACAXI (un)                  ATACADO   AL  03/2019  12.00
6266    ABACAXI (un)                  ATACADO   AL  04/2019  14.75
8346    ABACAXI (un)                  ATACADO   AL  05/2019   2.30


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_long['valor'].fillna(0, inplace=True)


Arquivo relatorio_preco_medio_mensal_2020_tratado.csv processado com sucesso! Salvo como relatorio_preco_medio_mensal_2020_tratado_rotacionado.csv
         Produto/Unidade Nível de Comercialização U.F.     data  valor
0     ABACAXI HAVAÍ (kg)                 PRODUTOR   PR  01/2020   1.35
1968  ABACAXI HAVAÍ (kg)                 PRODUTOR   PR  02/2020   1.35
3936  ABACAXI HAVAÍ (kg)                 PRODUTOR   PR  03/2020   1.35
5904  ABACAXI HAVAÍ (kg)                 PRODUTOR   PR  04/2020  18.21
7872  ABACAXI HAVAÍ (kg)                 PRODUTOR   PR  05/2020  16.58


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_long['valor'].fillna(0, inplace=True)


Arquivo relatorio_preco_medio_mensal_2021_tratado.csv processado com sucesso! Salvo como relatorio_preco_medio_mensal_2021_tratado_rotacionado.csv
     Produto/Unidade Nível de Comercialização U.F.     data  valor
1       ABACAXI (kg)                  ATACADO   RR  01/2021   1.92
1986    ABACAXI (kg)                  ATACADO   RR  02/2021   1.92
3971    ABACAXI (kg)                  ATACADO   RR  03/2021   1.86
5956    ABACAXI (kg)                  ATACADO   RR  04/2021   1.60
7941    ABACAXI (kg)                  ATACADO   RR  05/2021   1.46


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_long['valor'].fillna(0, inplace=True)


Arquivo relatorio_preco_medio_mensal_2022_tratado.csv processado com sucesso! Salvo como relatorio_preco_medio_mensal_2022_tratado_rotacionado.csv
     Produto/Unidade Nível de Comercialização U.F.     data  valor
0       ABACATE (kg)                  ATACADO   RR  01/2022   6.00
1977    ABACATE (kg)                  ATACADO   RR  02/2022   5.33
3954    ABACATE (kg)                  ATACADO   RR  03/2022   6.50
5931    ABACATE (kg)                  ATACADO   RR  04/2022   5.67
7908    ABACATE (kg)                  ATACADO   RR  05/2022   5.33


The behavior will change in pandas 3.0. This inplace method will never work because the intermediate object on which we are setting values always behaves as a copy.

For example, when doing 'df[col].method(value, inplace=True)', try using 'df.method({col: value}, inplace=True)' or df[col] = df[col].method(value) instead, to perform the operation inplace on the original object.


  df_long['valor'].fillna(0, inplace=True)


Arquivo relatorio_preco_medio_mensal_2023_tratado.csv processado com sucesso! Salvo como relatorio_preco_medio_mensal_2023_tratado_rotacionado.csv
     Produto/Unidade Nível de Comercialização U.F.     data  valor
0       ABACATE (kg)                  ATACADO   RR  01/2023   6.83
2021    ABACATE (kg)                  ATACADO   RR  02/2023   6.67
4042    ABACATE (kg)                  ATACADO   RR  03/2023   6.83
6063    ABACATE (kg)                  ATACADO   RR  04/2023   7.00
8084    ABACATE (kg)                  ATACADO   RR  05/2023   7.00
