# AnotaÃ§Ã£o aos professores e avaliadores:
Para o funcionamento adequado do cÃ³digo, Ã© necessÃ¡rio que a variÃ¡vel `AZURE_ACCOUNT_KEY` na cÃ©lula abaixo seja preenchida com a **secret key** enviada junto ao PDF do projeto, ou que essa chave seja configurada como variÃ¡vel de ambiente `export AZURE_ACCOUNT_KEY="secret_key_aqui"`.
Essa medida foi adotada por questÃµes de seguranÃ§a, uma vez que o repositÃ³rio Ã© pÃºblico.
Agradecemos desde jÃ¡ pela compreensÃ£o e colaboraÃ§Ã£o.

In [None]:
# Coloque aqui sua chave de conta do Azure
AZURE_ACCOUNT_KEY = ""  # <-- INSIRA AQUI SUA CHAVE DO AZURE Entre as aspas duplas

# Pipeline de Tratamento & Upload para Azure



> Caso instalar dependÃªncias seja necessÃ¡rio, use a cÃ©lula abaixo. **Opcional**.


In [11]:

# InstalaÃ§Ã£o de dependÃªncias (execute se necessÃ¡rio)
# - azure-storage-blob
# - pandas (opcional, caso use o bloco de tratamento)
#
# Dica: em ambientes corporativos, prefira instalar via conda/anaconda.
# !pip install --quiet azure-storage-blob pandas


## Imports

In [12]:
import os
from datetime import datetime
from io import BytesIO, StringIO

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sns
from azure.storage.blob import BlobServiceClient
from azure.core.exceptions import ResourceExistsError
from mpl_toolkits.mplot3d import Axes3D
from sklearn.cluster import KMeans
from sklearn.decomposition import PCA
from sklearn.manifold import TSNE
from sklearn.metrics import silhouette_score
from sklearn.preprocessing import StandardScaler

from tratamento import *

## ConfiguraÃ§Ã£o e VerificaÃ§Ã£o de arquivos CSV

In [13]:
AZURE_ACCOUNT_KEY = os.environ.get("AZURE_ACCOUNT_KEY", AZURE_ACCOUNT_KEY)
if not AZURE_ACCOUNT_KEY:
    raise ValueError("A chave da conta do Azure nÃ£o foi definida. Por favor, defina a variÃ¡vel AZURE_ACCOUNT_KEY.")

AZURE_CONNECTION_STRING = f"DefaultEndpointsProtocol=https;AccountName=totsvisiodb;AccountKey={AZURE_ACCOUNT_KEY};EndpointSuffix=core.windows.net"

# Inicializa o cliente do Blob
blob_service_client = BlobServiceClient.from_connection_string(AZURE_CONNECTION_STRING)

In [14]:
CONTAINER_NAME = "csvs-brutos-totvs"
container_client = blob_service_client.get_container_client(CONTAINER_NAME)

In [15]:
# Listar arquivos
print("ðŸ“‚ Listando arquivos presentes no container:")
blobs = list(container_client.list_blobs())

if blobs:
    for blob in blobs:
        print(f" - {blob.name}")
else:
    print("âš  Nenhum arquivo encontrado no container.")


ðŸ“‚ Listando arquivos presentes no container:
 - clientes_desde.csv
 - contratacoes_ultimos_12_meses.csv
 - dados_clientes.csv
 - dicionario.xlsx
 - historico.csv
 - mrr.csv
 - nps_relacional.csv
 - nps_transacional_aquisicao.csv
 - nps_transacional_implantacao.csv
 - nps_transacional_onboarding.csv
 - nps_transacional_produto.csv
 - nps_transacional_suporte.csv
 - telemetria_1.csv
 - telemetria_10.csv
 - telemetria_11.csv
 - telemetria_2.csv
 - telemetria_3.csv
 - telemetria_4.csv
 - telemetria_5.csv
 - telemetria_6.csv
 - telemetria_7.csv
 - telemetria_8.csv
 - telemetria_9.csv
 - tickets.csv


In [16]:
tratamentos = {
    'clientes_desde.csv': tratar_clientes_desde,
    'contratacoes_ultimos_12_meses.csv': tratar_contratacoes_12m,
    'dados_clientes.csv': tratar_dados_clientes,
    'historico.csv': tratar_historico,
    'mrr.csv': tratar_mrr,
    'nps_relacional.csv': tratar_nps_relacional,
    'nps_transacional_aquisicao.csv': tratar_nps_aquisicao,
    'nps_transacional_implantacao.csv': tratar_nps_implantacao,
    'nps_transacional_onboarding.csv': tratar_nps_onboarding,
    'nps_transacional_produto.csv': tratar_nps_produto,
    'nps_transacional_suporte.csv': tratar_nps_suporte,
    'tickets.csv': tratar_tickets,
    'telemetria_1.csv': tratar_telemetria,
    'telemetria_2.csv': tratar_telemetria,
    'telemetria_3.csv': tratar_telemetria,
    'telemetria_4.csv': tratar_telemetria,
    'telemetria_5.csv': tratar_telemetria,
    'telemetria_6.csv': tratar_telemetria,
    'telemetria_7.csv': tratar_telemetria,
    'telemetria_8.csv': tratar_telemetria,
    'telemetria_9.csv': tratar_telemetria,
    'telemetria_10.csv': tratar_telemetria,
    'telemetria_11.csv': tratar_telemetria
}

In [17]:
CONTAINER_PROCESSADOS = "csvs-tratados-gpt"

In [None]:
for nome_arquivo, funcao in tratamentos.items():
    print(f"ðŸ”„ Processando arquivo: {nome_arquivo}")
    blob_client = blob_service_client.get_blob_client(container=CONTAINER_NAME, blob=nome_arquivo)
    downloaded_blob = BytesIO(blob_client.download_blob().readall())
    df_tratado = funcao(downloaded_blob)
    csv_buffer = StringIO()
    df_tratado.to_csv(csv_buffer, index=False, encoding="utf-8-sig")

    # Cria o container se ainda nÃ£o existir
    #blob_service_client.create_container(container_name) # Comentamos para nÃ£o ocasionar erro ao tentar criar um container jÃ¡ existente

    # 3. Criamos client do blob no novo container
    blob_client = blob_service_client.get_blob_client(
        container=CONTAINER_PROCESSADOS,
        blob=nome_arquivo
    )

    # 4. Upload do CSV
    blob_client.upload_blob(csv_buffer.getvalue(), overwrite=True)

    print(f"âœ… Arquivo {nome_arquivo} exportado para o container 'clusters' com sucesso!")
    print("\n---\n")


ðŸ”„ Processando arquivo: clientes_desde.csv
âœ… Arquivo clientes_desde tratado
âœ… Arquivo clientes_desde.csv exportado para o container 'clusters' com sucesso!

---

ðŸ”„ Processando arquivo: contratacoes_ultimos_12_meses.csv
âœ… Arquivo contratacoes_12m tratado
âœ… Arquivo contratacoes_ultimos_12_meses.csv exportado para o container 'clusters' com sucesso!

---

ðŸ”„ Processando arquivo: dados_clientes.csv
âœ… Arquivo dados_clientes tratado
âœ… Arquivo dados_clientes.csv exportado para o container 'clusters' com sucesso!

---

ðŸ”„ Processando arquivo: historico.csv
âœ… Arquivo historico tratado
âœ… Arquivo historico.csv exportado para o container 'clusters' com sucesso!

---

ðŸ”„ Processando arquivo: mrr.csv
âœ… Arquivo mrr tratado
âœ… Arquivo mrr.csv exportado para o container 'clusters' com sucesso!

---

ðŸ”„ Processando arquivo: nps_relacional.csv
âœ… Arquivo nps_relacional tratado
âœ… Arquivo nps_relacional.csv exportado para o container 'clusters' com sucesso!

---

ðŸ”„ Pro

  df['DATA_RESPOSTA'] = pd.to_datetime(df['DATA_RESPOSTA'], errors='coerce')


âœ… Arquivo nps_produto tratado
âœ… Arquivo nps_transacional_produto.csv exportado para o container 'clusters' com sucesso!

---

ðŸ”„ Processando arquivo: nps_transacional_suporte.csv
âœ… Arquivo nps_suporte tratado
âœ… Arquivo nps_transacional_suporte.csv exportado para o container 'clusters' com sucesso!

---

ðŸ”„ Processando arquivo: tickets.csv
âœ… Arquivo tickets tratado
âœ… Arquivo tickets.csv exportado para o container 'clusters' com sucesso!

---

ðŸ”„ Processando arquivo: telemetria_1.csv
âœ… Arquivo telemetria tratado
âœ… Arquivo telemetria_1.csv exportado para o container 'clusters' com sucesso!

---

ðŸ”„ Processando arquivo: telemetria_2.csv
âœ… Arquivo telemetria tratado
âœ… Arquivo telemetria_2.csv exportado para o container 'clusters' com sucesso!

---

yeah
