In [1]:
import pandas as pd
import s3fs
from dotenv import load_dotenv
import os

In [2]:
# --- Início da Configuração ---
load_dotenv()  # Isso carrega as variáveis do arquivo .env

# 1. Definimos as credenciais e o endpoint para o MinIO
#    Lembre-se que, como estamos rodando localmente (e não de um container para outro),
#    usamos 'localhost' e a porta que mapeamos no docker-compose.yml.
MINIO_ENDPOINT = os.getenv("MINIO_ENDPOINT")
MINIO_ACCESS_KEY = os.getenv("MINIO_ACCESS_KEY")
MINIO_SECRET_KEY = os.getenv("MINIO_SECRET_KEY")

# 2. Criamos o objeto de conexão com o MinIO explicitamente
s3 = s3fs.S3FileSystem(
    key=MINIO_ACCESS_KEY,
    secret=MINIO_SECRET_KEY,
    client_kwargs={
        'endpoint_url': MINIO_ENDPOINT,
        'use_ssl': False # Desabilita SSL para conexões HTTP}
        } 
)

# 3. Definimos o caminho completo (bucket + nome do arquivo) para o nosso Parquet
parquet_s3_path = 'processed-parquet/dados_tratados.parquet'

# --- Fim da Configuração ---

In [8]:
print(f">>> Lendo o arquivo Parquet de: s3://{parquet_s3_path}")

try:
    # 4. ABRIMOS o arquivo usando o nosso objeto de conexão 's3'
    # e passamos o arquivo aberto para o pandas ler.
    with s3.open(parquet_s3_path, 'rb') as f:
        df = pd.read_parquet(f)

    # Mostra as 5 primeiras linhas do arquivo para confirmar que a leitura funcionou
    print("\nArquivo Parquet lido com sucesso! As 5 primeiras linhas são:")
    print(df.head())

except Exception as e:
    print(f"\nERRO: Não foi possível ler o arquivo. Verifique o caminho, as credenciais e o endpoint.")
    print(f"Detalhe do erro: {e}")

>>> Lendo o arquivo Parquet de: s3://processed-parquet/dados_tratados.parquet

Arquivo Parquet lido com sucesso! As 5 primeiras linhas são:
       NOME SOBRENOME  IDADE                      EMAIL          CPF  \
0     Luiza   Correia     36           luigi32@viana.br  10000000000   
1  Bernardo    Araújo     32  lucas-gabrielsantos@da.br  10000000001   
2  Leonardo     Porto     26    da-cruzmaria@uol.com.br  10000000002   
3   Rodrigo   Freitas     65   sarahmendes@carvalho.com  10000000003   
4      Theo  Monteiro     40      ramosesther@gmail.com  10000000004   

                                     ID                  CRIADO EM  
0  3e3fdb22-6db1-4c00-8742-dfef97a07c06 2025-07-07 17:57:31.005038  
1  c86de79c-f2dc-4af5-9d3a-ea91f3f08808 2025-07-07 17:57:31.005038  
2  ec6b41e2-5d69-425a-83b6-945d5bb559ce 2025-07-07 17:57:31.005038  
3  07fb0d8d-f42a-4788-8ebd-9dc08d9888e1 2025-07-07 17:57:31.005038  
4  c3b672db-481d-4a56-8510-9bef2ff6bced 2025-07-07 17:57:31.005038  
