## Criar o Bucket

In [None]:
# Importação das bibliotecas necessárias
from google.cloud import storage
import os

# Certifique-se de que a variável de ambiente GOOGLE_APPLICATION_CREDENTIALS está definida
os.environ["GOOGLE_APPLICATION_CREDENTIALS"] = "/content/gothic-airlock-438618-i2-13df727a6a2d.json"

def criar_bucket(nome_bucket, location="US", storage_class="STANDARD"):
    """Cria um bucket no Google Cloud Storage."""

    # Inicializa o cliente de storage
    storage_client = storage.Client()

    # Verifica se o bucket já existe
    bucket_exists = storage_client.lookup_bucket(nome_bucket)
    if bucket_exists:
        print(f'O bucket "{nome_bucket}" já existe.')
        return bucket_exists

    # Cria o bucket
    bucket = storage_client.bucket(nome_bucket)
    new_bucket = storage_client.create_bucket(bucket, location=location)

    # Define a classe de armazenamento após a criação do bucket
    new_bucket.storage_class = storage_class
    new_bucket.patch()

    print(f'Bucket "{new_bucket.name}" criado com sucesso na localização "{location}" com a classe de armazenamento "{storage_class}".')

    return new_bucket

# Defina o nome do bucket que deseja criar
nome_bucket = 'dados-unico'

# Chame a função para criar o bucket
bucket = criar_bucket(nome_bucket)


O bucket "dados-unico" já existe.


## Criar a pasta e inserir as planilhas no bucket

In [None]:
# Importação das bibliotecas necessárias
import gspread  # Biblioteca para interagir com o Google Sheets
import pandas as pd  # Biblioteca para manipulação de dados
import os  # Biblioteca para operações de sistema (como verificação de arquivos)
from google.cloud import storage  # Biblioteca para interagir com o Google Cloud Storage

# Função para extrair dados do Google Sheets e salvar como CSV
def puxar_dados_google_sheets(sheet_id, service_account_file, csv_path_prefix):
    """
    Conecta ao Google Sheets usando credenciais de uma conta de serviço e
    baixa os dados de cada aba da planilha, salvando-os como arquivos CSV.
    """
    gc = gspread.service_account(filename=service_account_file)  # Autentica com a conta de serviço
    sh = gc.open_by_key(sheet_id)  # Abre a planilha usando o ID fornecido

    # Itera sobre todas as planilhas (abas) no Google Sheets
    for i, worksheet in enumerate(sh.worksheets()):
        dados = worksheet.get_all_values()  # Extrai todos os dados da aba
        df = pd.DataFrame(dados)  # Converte os dados em um DataFrame do pandas

        # Define o caminho para salvar o CSV com o índice da aba
        csv_path = f'{csv_path_prefix}_sheet_{i}.csv'

        # Salva o DataFrame como um arquivo CSV sem cabeçalhos e índices
        df.to_csv(csv_path, index=False, header=False)

        print(f'Salvou a aba "{worksheet.title}" como {csv_path}')  # Exibe o status de cada aba salva

# Função para fazer upload do CSV para o Google Cloud Storage
def upload_gcp(bucket_nome, arquivo_caminho, blob_nome):
    """
    Faz upload de um arquivo CSV para um bucket do Google Cloud Storage.
    """
    storage_client = storage.Client()  # Cria o cliente do Google Cloud Storage
    bucket = storage_client.get_bucket(bucket_nome)  # Seleciona o bucket pelo nome

    blob = bucket.blob(blob_nome)  # Cria um blob (arquivo) no bucket
    blob.upload_from_filename(arquivo_caminho)  # Faz o upload do arquivo CSV

    print(f'Arquivo {arquivo_caminho} enviado para o bucket {bucket_nome} como {blob_nome}')  # Confirma o upload

# Função para verificar se o arquivo existe antes de fazer o upload
def upload_gcp_com_verificacao(bucket_nome, arquivo_caminho, blob_nome):
    """
    Verifica se o arquivo CSV existe no caminho especificado e faz o upload para o GCP.
    """
    if os.path.exists(arquivo_caminho):  # Verifica se o arquivo CSV existe
        upload_gcp(bucket_nome, arquivo_caminho, blob_nome)  # Faz o upload se o arquivo for encontrado
    else:
        print(f'Arquivo {arquivo_caminho} não encontrado. Verifique se ele foi salvo corretamente.')  # Exibe erro se o arquivo não for encontrado

# Definir parâmetros
sheet_id = '1BnX32ZWov03-_eolJ_PmWC5Lnd0FOOrJoguwpYgxWLQ'  # ID da planilha do Google Sheets
service_account_file = '/content/gothic-airlock-438618-i2-b5dbc5ad11a0.json'
csv_path_prefix = '/content/dados'
bucket_nome = 'dados-unico'
destino_blob_prefix = 'dados-unico/dados_brutos'

# Puxar dados do Google Sheets e salvar como CSV
puxar_dados_google_sheets(sheet_id, service_account_file, csv_path_prefix)

# Fazer upload de todos os arquivos CSV gerados para o GCP
# Agora iteramos sobre todas as abas
for i in range(4):
    csv_path = f'{csv_path_prefix}_sheet_{i}.csv'
    destino_blob_nome = f'{destino_blob_prefix}_sheet_{i}.csv'

    # Verificação e upload
    upload_gcp_com_verificacao(bucket_nome, csv_path, destino_blob_nome)

Salvou a aba "dCliente" como /content/dados_sheet_0.csv
Salvou a aba "dVeiculo" como /content/dados_sheet_1.csv
Salvou a aba "fFrete" como /content/dados_sheet_2.csv
Salvou a aba "fKmRodado" como /content/dados_sheet_3.csv
Arquivo /content/dados_sheet_0.csv enviado para o bucket dados-unico como dados-unico/dados_brutos_sheet_0.csv
Arquivo /content/dados_sheet_1.csv enviado para o bucket dados-unico como dados-unico/dados_brutos_sheet_1.csv
Arquivo /content/dados_sheet_2.csv enviado para o bucket dados-unico como dados-unico/dados_brutos_sheet_2.csv
Arquivo /content/dados_sheet_3.csv enviado para o bucket dados-unico como dados-unico/dados_brutos_sheet_3.csv


##Upload do bucket para o DF Pandas##

In [None]:
# Importação da bibliote necessária
import pandas as pd

# URLs públicas dos arquivos CSV
file_urls = [
    'https://storage.googleapis.com/dados-unico/dados-unico/dados_brutos_sheet_0.csv',
    'https://storage.googleapis.com/dados-unico/dados-unico/dados_brutos_sheet_1.csv',
    'https://storage.googleapis.com/dados-unico/dados-unico/dados_brutos_sheet_2.csv',
    'https://storage.googleapis.com/dados-unico/dados-unico/dados_brutos_sheet_3.csv'
]

# Ler os arquivos CSV e armazená-los em variáveis
df1 = pd.read_csv(file_urls[0])
df2 = pd.read_csv(file_urls[1])
df3 = pd.read_csv(file_urls[2])
df4 = pd.read_csv(file_urls[3])

# Exibir os DataFrames
print(df1.head())
print(df2.head())
print(df3.head())
print(df4.head())

   ID Cliente           Cidade  UF
0           1  Duque de Caxias  RJ
1           2         Contagem  MG
2           3      Barra Mansa  RJ
3           4    Nova Friburgo  RJ
4           5         Contagem  MG
   ID Veiculo     Placa          Marca Tipo Veículo       Baú
0           1  REQ-1358     Volkswagen        TRUCK  Alumínio
1           2  SKY-3175  Mercedes-Benz         TOCO     Sider
2           3  THU-9587           Ford      CARRETA     Sider
3           4  TGM-4422          Iveco         TOCO     Sider
4           5  RDP-3433          Iveco        TRUCK  Alumínio
       Data  ID Cliente  ID Veiculo  Numero Documento Fiscal  \
0  1/1/2018         159          11                   945693   
1  1/2/2018         292          12                   161542   
2  1/3/2018         543           6                   357544   
3  1/4/2018          53          12                   498247   
4  1/5/2018         166          23                   770040   

                Viagem Valor do F

##Tratamento dos dados

##Mudança do tipo de dado



In [None]:
# Converte a coluna 'Data' de df3 para o formato datetime.

df3['Data'] = pd.to_datetime(df3['Data'])

##Mudança de nomes das colunas


In [None]:
# Renomeia as colunas de 'df1' para seguir um padrão consistente.
df1.rename(columns={
    'ID Cliente': 'id_cliente',
    'Cidade': 'cidade',
    'UF': 'uf'
}, inplace=True)
df1.head(1)  # Exibe a primeira linha para verificar.

# Renomeia as colunas de 'df2' para manter consistência.
df2.rename(columns={
    'ID Veiculo': 'id_veiculo',
    'Placa': 'placa',
    'Marca': 'marca',
    'Tipo Veículo': 'tipo_veiculo',
    'Baú': 'bau'
}, inplace=True)
df2.head(1)  # Verificação.

# Ajusta os nomes das colunas de 'df3' para inserção no banco.
df3.rename(columns={
    'Data': 'data',
    'ID_Cliente': 'id_cliente',
    'ID_Veiculo': 'id_veiculo',
    'Numero Documento Fiscal': 'num_doc_fiscal',
    'Viagem': 'viagem',
    'Valor de Frete Líquido': 'valor_frete_liquido',
    'Peso (KG)': 'peso_kg',
    'Valor Mercadoria': 'valor_mercadoria'
}, inplace=True)
df3.head(1)  # Verificação.

# Renomeia as colunas de 'df4' para padronizar.
df4.rename(columns={
    'Mês': 'mes',
    'ID_Veiculo': 'id_veiculo',
    'Km percorridos': 'km_percorridos',
    'Valor_Combustível': 'valor_combustivel',
    'Manut.': 'manutencao',
    'Custos Fixos': 'custos_fixos'
}, inplace=True)
df4.head(1)  # Verificação.

##Mudança do tipo de dados

In [None]:
# Converte a coluna 'Mês' para o tipo datetime, interpretando-a com o formato de data 'mês/dia/ano'.
df4['Mês'] = pd.to_datetime(df4['Mês'], format='%m/%d/%Y')

# Converte a coluna 'Valor do Frete Líquido' para o tipo float, garantindo que todos os valores sejam numéricos.
df4['Valor do Frete Líquido'] = df4['Valor do Frete Líquido'].astype(float)

# Converte a coluna 'Peso (KG)' para o tipo float, já que representa valores numéricos que podem conter casas decimais.
df4['Peso (KG)'] = df4['Peso (KG)'].astype(float)

# Converte a coluna 'Valor da Mercadoria' para o tipo float, garantindo que esteja pronta para operações matemáticas.
df4['Valor da Mercadoria'] = df4['Valor da Mercadoria'].astype(float)

# Exibe os tipos de dados das colunas do DataFrame 'df3', útil para garantir que todas as colunas tenham o tipo correto.
print(df3.dtypes)

In [None]:
# Substituir vírgulas por pontos e remover espaços em branco

df4['Gasto com Combustível'] = df4['Gasto com Combustível'].str.replace(',', '.').str.strip()

# Converter para float
df4['Mês'] = pd.to_datetime(df4['Mês'], format='%m/%d/%Y')
df4['Gasto com Combustível'] = df4['Gasto com Combustível'].astype(float)
df4['Manut.'] = df4['Manut.'].astype(float)
df4['Custos Fixos'] = df4['Custos Fixos'].astype(float)

# Verificar tipos para confirmar a conversão
print(df4.dtypes)


Mês                      datetime64[ns]
ID Veiculo                        int64
Km percorridos                    int64
Gasto com Combustível           float64
Manut.                          float64
Custos Fixos                    float64
dtype: object


##Salvando os DataFrames em csv para enviar ao banco de dados

In [None]:
# Salvar cada DataFrame em arquivos CSV separados
df1.to_csv("/content/Cliente.csv", index=False)
df2.to_csv("/content/Veiculo.csv", index=False)
df3.to_csv("/content/Frete.csv", index=False)
df4.to_csv("/content/Km_rodado.csv", index=False)

print("Arquivos CSV salvos com sucesso!")

Arquivos CSV salvos com sucesso!


##Conecta e cria se o banco não existir

In [None]:
# Instalação das bibliotecas necessárias
!pip install pandas google-cloud-storage mysql-connector-python python-dotenv

# Importação das bibliotecas
import os
import pandas as pd
from google.cloud import storage
import mysql.connector
from mysql.connector import Error
from dotenv import load_dotenv

# Carrega as variáveis de ambiente do arquivo .env
load_dotenv()

# Definição das credenciais e informações para a conexão com o MySQL
servidor = os.getenv('MYSQL_SERVER')
basededados = os.getenv('MYSQL_DATABASE')
usuario = os.getenv('MYSQL_USER')
senha = os.getenv('MYSQL_PASSWORD')

# Função para conectar ao banco de dados MySQL
def conectar_mysql(servidor, basededados, usuario, senha):
    try:
        conn = mysql.connector.connect(
            host=servidor,
            user=usuario,
            password=senha,
            database=basededados
        )

        if conn.is_connected():
            print(f"Conexão bem-sucedida ao banco de dados {basededados}")
            return conn
    except Error as e:
        print(f"Erro ao conectar ao MySQL: {e}")
        return None

# Função para criar o banco de dados se ele ainda não existir
def criar_banco(conexao, basededados):
    try:
        cursor = conexao.cursor()
        cursor.execute(f"CREATE DATABASE IF NOT EXISTS {basededados}")
        cursor.execute(f"USE {basededados}")
        conexao.commit()
        print(f"Banco de dados {basededados} criado ou já existente.")
    except Error as e:
        print(f"Erro ao criar banco de dados: {e}")

# Conectar ao MySQL e criar o banco de dados
conexao = conectar_mysql(servidor, basededados, usuario, senha)

# Se a conexão for bem-sucedida, tenta criar o banco de dados
if conexao is not None:
    criar_banco(conexao, basededados)


# Função para conectar ao banco de dados MySQL
def conectar_mysql(servidor, basededados, usuario, senha):
    try:

        conn = mysql.connector.connect(
            host=servidor,
            user=usuario,
            password=senha,
            database=basededados
        )

        if conn.is_connected():
            print(f"Conexão bem-sucedida ao banco de dados {basededados}")
            return conn
    except Error as e:

        print(f"Erro ao conectar ao MySQL: {e}")
        return None
# Função para criar o banco de dados se ele ainda não existir
def criar_banco(conexao, basededados):
    try:
        cursor = conexao.cursor()

        cursor.execute(f"CREATE DATABASE IF NOT EXISTS {basededados}")
        cursor.execute(f"USE {basededados}")
        conexao.commit()
        print(f"Banco de dados {basededados} criado ou já existente.")
    except Error as e:

        print(f"Erro ao criar banco de dados: {e}")

# Conectar ao MySQL e criar o banco de dados
conexao = conectar_mysql(servidor, basededados, usuario, senha)

# Se a conexão for bem-sucedida, tenta criar o banco de dados
if conexao is not None:
    criar_banco(conexao, basededados)


Conexão bem-sucedida ao banco de dados projeto_final
Banco de dados projeto_final criado ou já existente.


##Efetua o envio dos DatasFrames tratados para o banco de dados


In [None]:
# Instalação das bibliotecas necessárias
!pip install mysql-connector-python

# Importação das bibliotecas
import pandas as pd
import mysql.connector
from mysql.connector import Error
import os

# Função para ler dados de arquivos CSV
def puxar_dados_csv(caminhos):
    """Lê arquivos CSV especificados em uma lista."""
    dados_abas = {}
    for caminho_arquivo in caminhos:
        if caminho_arquivo.endswith('.csv'):
            df = pd.read_csv(caminho_arquivo)  # Lê o arquivo CSV
            dados_abas[os.path.basename(caminho_arquivo).replace('.csv', '').lower()] = df  # Armazena o DataFrame com o nome do arquivo (sem a extensão) como chave
    return dados_abas

# Função para inserir dados no MySQL
def inserir_dados_mysql(df, conexao, tabela):
    """Insere os dados do DataFrame no banco de dados MySQL."""
    cursor = conexao.cursor()

    for i, row in df.iterrows():
        # Escapa os nomes das colunas para evitar erros de sintaxe
        sql = f"INSERT INTO {tabela} VALUES ({', '.join(['%s'] * len(row))})"
        cursor.execute(sql, tuple(row))

    conexao.commit()
    print(f"Inserido {len(df)} registros na tabela {tabela}")

# Função para conectar ao banco de dados MySQL
def conectar_mysql(servidor, basededados, usuario, senha):
    try:
        conn = mysql.connector.connect(
            host=servidor,
            user=usuario,
            password=senha,
            database=basededados
        )
        if conn.is_connected():
            print(f"Conexão bem-sucedida ao banco de dados {basededados}")
            return conn
    except Error as e:
        print(f"Erro ao conectar ao MySQL: {e}")
        return None

# Função para criar tabela se não existir
def criar_tabela_if_not_exists(conexao, tabela, colunas):
    cursor = conexao.cursor()
    colunas_sql = []

    for col in colunas:
        # Determina o tipo de dado correto para cada coluna
        col = col.strip()  # Remove espaços em branco
        if pd.api.types.is_integer_dtype(col):
            tipo = "INT"
        elif pd.api.types.is_float_dtype(col):
            tipo = "FLOAT"
        else:
            tipo = "VARCHAR(255)"

        # Adiciona crases se o nome da coluna contiver espaços ou caracteres especiais
        colunas_sql.append(f"`{col}` {tipo}")

    colunas_sql_str = ", ".join(colunas_sql)
    sql = f"CREATE TABLE IF NOT EXISTS {tabela} ({colunas_sql_str})"
    cursor.execute(sql)
    print(f"Tabela '{tabela}' verificada/criada.")

# Definir os parâmetros
caminhos = ['/content/Cliente.csv', '/content/Veiculo.csv', '/content/Frete.csv', '/content/Km_rodado.csv']
host=os.getenv("MYSQL_SERVER"),      # Endereço do servidor
user=os.getenv("MYSQL_USER"),        # Nome do usuário
password=os.getenv("MYSQL_PASSWORD"), # Senha do usuário
database=os.getenv("MYSQL_DATABASE")

# Puxar dados de arquivos CSV
dados_abas = puxar_dados_csv(caminhos)

# Conectar ao MySQL
conexao = conectar_mysql(servidor, basededados, usuario, senha)

# Inserir os dados de cada CSV no MySQL
if conexao:
    for nome_aba, df in dados_abas.items():
        tabela = nome_aba  # Usa o nome do arquivo CSV como nome da tabela
        print(f"Inserindo dados do arquivo '{nome_aba}' na tabela '{tabela}'")

        try:
            criar_tabela_if_not_exists(conexao, tabela, df.dtypes.index)  # Passa os nomes das colunas para criar a tabela
            inserir_dados_mysql(df, conexao, tabela)

            print(f"Dados do arquivo '{nome_aba}' inseridos com sucesso na tabela '{tabela}'")

        except Exception as e:
            # Se ocorrer um erro, exibe a mensagem de erro
            print(f"Erro ao inserir dados do arquivo '{nome_aba}' na tabela '{tabela}': {str(e)}")
            if "Duplicate entry" in str(e):
                print(f"Os dados do arquivo '{nome_aba}' já foram inseridos anteriormente.")

    conexao.close()

##Conexão com o banco de dados

In [None]:
# Instalação da biblioteca necessária
!pip install mysql-connector-python python-dotenv

# Importação da biblioteca
import os
import mysql.connector
from dotenv import load_dotenv

# Carrega as variáveis de ambiente do arquivo .env
load_dotenv()

# Conectar ao MySQL no Google Cloud usando variáveis de ambiente
db_connection = mysql.connector.connect(
    host=os.getenv("MYSQL_SERVER"),      # Endereço do servidor
    user=os.getenv("MYSQL_USER"),        # Nome do usuário
    password=os.getenv("MYSQL_PASSWORD"), # Senha do usuário
    database=os.getenv("MYSQL_DATABASE")  # Nome do banco de dados
)

# Verificando a conexão
if db_connection.is_connected():
    print("Conexão bem-sucedida ao banco de dados!")
else:
    print("Erro ao conectar ao banco de dados.")

##Extraindo os dados das tabelas

In [None]:
# Criar um cursor para executar consultas
cursor = db_connection.cursor()

# Extraindo dados da tabela dCliente
cursor.execute("SELECT * FROM dCliente")
dados_cliente = cursor.fetchall()

# Extraindo dados da tabela dVeiculo
cursor.execute("SELECT * FROM dVeiculo")
dados_veiculo = cursor.fetchall()

# Extraindo dados da tabela fFrente
cursor.execute("SELECT * FROM fFrente")
dados_frente = cursor.fetchall()

# Extraindo dados da tabela fKmRodado
cursor.execute("SELECT * FROM fKmRodado")
dados_km_rodado = cursor.fetchall()

# Fechar o cursor e a conexão após extrair os dados
cursor.close()
db_connection.close()


##Carregar os dados no bigquery

In [None]:
# Instalação da biblioteca necessária
!pip install --upgrade google-cloud-bigquery

# Importação da biblioteca
from google.oauth2 import service_account
from google.cloud import bigquery

# Carregar credenciais da conta de serviço
credentials = service_account.Credentials.from_service_account_file(
    'chatbigquery.json'  # Substitua pelo nome do arquivo JSON que você carregou
)

# Criar um cliente BigQuery com as credenciais
client = bigquery.Client(credentials=credentials, project=credentials.project_id)

##Criação do dataset para o envio do banco ao BigQuery

In [None]:
# Definir o ID do projeto e o nome do dataset
project_id = "gothic-airlock-438618-i2"
dataset_id = "logistica"

# Criar um objeto Dataset
dataset = bigquery.Dataset(f"{project_id}.{dataset_id}")
dataset.location = "US"

# Criar o dataset
dataset = client.create_dataset(dataset, exists_ok=True)
print(f"Dataset {dataset_id} criado ou já existe.")

In [None]:
# Definir esquema da tabela
schema_dcliente = [
    bigquery.SchemaField("id_cliente", "INTEGER", mode="REQUIRED"),
    bigquery.SchemaField("cidade", "STRING", mode="REQUIRED"),
    bigquery.SchemaField("uf", "STRING", mode="REQUIRED"),
]

# Criar a tabela
table_id_dcliente = f"{project_id}.{dataset_id}.cliente"
table_dcliente = bigquery.Table(table_id_dcliente, schema=schema_dcliente)

# Criar a tabela no BigQuery
table_dcliente = client.create_table(table_dcliente, exists_ok=True)
print(f"Tabela {table_id_dcliente} criada ou já existe.")

In [None]:
# Definir esquema da tabela
schema_dveiculo = [
    bigquery.SchemaField("id_veiculo", "INTEGER", mode="REQUIRED"),
    bigquery.SchemaField("placa", "STRING", mode="REQUIRED"),
    bigquery.SchemaField("marca", "STRING", mode="REQUIRED"),
    bigquery.SchemaField("tipo_veiculo", "STRING", mode="REQUIRED"),
    bigquery.SchemaField("bau", "STRING", mode="REQUIRED")
]

# Criar a tabela
table_id_dveiculo = f"{project_id}.{dataset_id}.veiculo"
table_dveiculo = bigquery.Table(table_id_dveiculo, schema=schema_dveiculo)

# Criar a tabela no BigQuery
table_dveiculo = client.create_table(table_dveiculo, exists_ok=True)
print(f"Tabela {table_id_dveiculo} criada ou já existe.")


In [None]:
# Definir esquema da tabela
schema_ffrete = [
    bigquery.SchemaField("data", "DATE", mode="REQUIRED"),
    bigquery.SchemaField("id_cliente", "INTEGER", mode="REQUIRED"),
    bigquery.SchemaField("id_veiculo", "INTEGER", mode="REQUIRED"),
    bigquery.SchemaField("num_doc_Fiscal", "INTEGER", mode="REQUIRED"),
    bigquery.SchemaField("viagem", "STRING", mode="REQUIRED"),
    bigquery.SchemaField("valor_frete_liquido", "FLOAT64", mode="REQUIRED"),
    bigquery.SchemaField("peso_kg", "FLOAT64", mode="REQUIRED"),
    bigquery.SchemaField("valor_mercadoria", "FLOAT64", mode="REQUIRED")
]

# Criar a tabela
table_id_ffrete = f"{project_id}.{dataset_id}.frete"
table_ffrete = bigquery.Table(table_id_ffrete, schema=schema_ffrete)

# Criar a tabela no BigQuery
table_ffrete = client.create_table(table_ffrete, exists_ok=True)
print(f"Tabela {table_id_ffrete} criada ou já existe.")


In [None]:
# Importação da biblioteca
from google.cloud import bigquery

# Definir esquema da tabela
schema_fkmrodado = [
    bigquery.SchemaField("mes", "DATE", mode="REQUIRED"),
    bigquery.SchemaField("id_veiculo", "INTEGER", mode="REQUIRED"),
    bigquery.SchemaField("km_percorridos", "INTEGER", mode="REQUIRED"),
    bigquery.SchemaField("gasto_combustivel", "FLOAT64", mode="REQUIRED"),
    bigquery.SchemaField("manutencao", "FLOAT64", mode="REQUIRED"),
    bigquery.SchemaField("custos_fixos", "INTEGER", mode="REQUIRED")
]

# Criar a tabela
table_id_fkmrodado = f"{project_id}.{dataset_id}.km_rodado"
table_fkmrodado = bigquery.Table(table_id_fkmrodado, schema=schema_fkmrodado)

try:
    # Tente criar a tabela
    table_fkmrodado = client.create_table(table_fkmrodado, exists_ok=True)
    print(f"Tabela {table_id_fkmrodado} criada ou já existe.")
except Exception as e:
    print(f"Erro ao criar tabela: {e}")


In [None]:
# Instalação da biblioteca necessária
!pip install google-cloud-bigquery pandas mysql-connector-python

# Importação da biblioteca
from sqlalchemy import create_engine

# Criar a conexão usando SQLAlchemy
engine = create_engine('mysql+mysqlconnector://eloisa:senhanormal123@34.70.115.32/projeto_final')

# Consulta para extrair os dados da tabela dCliente
query = "SELECT * FROM cliente"
df = pd.read_sql(query, engine)


In [None]:
# Importaçãos das bibliotecas
from google.colab import files
import os

# Carregar o arquivo JSON de chave da conta de serviço
uploaded = files.upload()

# Definir a variável de ambiente para o caminho do arquivo
os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/content/chatbigquery.json'


In [None]:
# Importaçãos das bibliotecas
import pandas as pd
from sqlalchemy import create_engine
from google.cloud import bigquery
from google.colab import files
import os

# 1. Carregar o arquivo JSON de chave da conta de serviço
uploaded = files.upload()  # Faça o upload do arquivo .json

# Definir a variável de ambiente para o caminho do arquivo
os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/content/chatbigquery.json'

# 2. Conectar ao MySQL usando SQLAlchemy
engine = create_engine('mysql+mysqlconnector://eloisa:senhanormal123@34.70.115.32/projeto_final')

# Consulta para extrair os dados da tabela dCliente
query = "SELECT * FROM cliente"
df = pd.read_sql(query, engine)

# 3. Configurar o cliente do BigQuery
client = bigquery.Client()

# 4. Definir a tabela de destino no BigQuery
project_id = "gothic-airlock-438618-i2"
dataset_id = "logistica"
table_id = 'cliente'
table_ref = client.dataset(dataset_id).table(table_id)

# 5. Inserir dados no BigQuery linha por linha
for index, row in df.iterrows():
    # Cria um dicionário com os dados da linha
    row_dict = {
        "id_cliente": row['id_cliente'],
        "cidade": row['cidade'],
        "uf": row['uf']
    }

    # Insere a linha no BigQuery
    errors = client.insert_rows_json(table_ref, [row_dict])
    if errors:
        print(f"Ocorreram erros ao inserir a linha {index}: {errors}")
    else:
        print(f"Linha {index} inserida com sucesso.")


In [None]:
# Consulta para extrair os dados da tabela dCliente
query = "SELECT * FROM veiculo"
df = pd.read_sql(query, engine)

# 1. Configurar o cliente do BigQuery
client = bigquery.Client()

# 2. Definir a tabela de destino no BigQuery
project_id = "gothic-airlock-438618-i2"  # Seu ID do projeto
dataset_id = "logistica"                  # Nome do dataset
table_id = 'veiculo'                     # Nome da tabela existente no BigQuery
table_ref = f"{project_id}.{dataset_id}.{table_id}"

# 3. Inserir dados no BigQuery linha por linha
for index, row in df.iterrows():
    # Cria um dicionário com os dados da linha
    row_dict = {
        "id_veiculo": row['id_veiculo'],
        "placa": row['placa'],
        "marca": row['marca'],
        "tipo_veiculo": row['tipo_veiculo'],
        "bau": row['bau']
    }

    # Insere a linha no BigQuery
    errors = client.insert_rows_json(table_ref, [row_dict])  # Use insert_rows_json para uma linha
    if errors:
        print(f"Ocorreram erros ao inserir a linha {index}: {errors}")
    else:
        print(f"Linha {index} inserida com sucesso.")


In [None]:
# Consulta para extrair os dados da tabela dCliente
query = "SELECT * FROM frete"
df = pd.read_sql(query, engine)

# 1. Configurar o cliente do BigQuery
client = bigquery.Client()

# 2. Definir a tabela de destino no BigQuery
project_id = "gothic-airlock-438618-i2"  # Seu ID do projeto
dataset_id = "logistica"                  # Nome do dataset
table_id = 'frete'                     # Nome da tabela existente no BigQuery
table_ref = f"{project_id}.{dataset_id}.{table_id}"

# 3. Inserir dados no BigQuery linha por linha
for index, row in df.iterrows():
    # Cria um dicionário com os dados da linha
    row_dict = {
        "data": row['data'].strftime('%Y-%m-%d'),
        "id_cliente": row['id_cliente'],
        "id_veiculo": row['id_veiculo'],
        "num_doc_fiscal": row['num_doc_fiscal'],
        "viagem": row['viagem'],
        "valor_frete_liquido": row['valor_frete_liquido'],
        "peso_kg": row['peso_kg'],
        "valor_mercadoria": row['valor_mercadoria']
    }

    # Insere a linha no BigQuery
    errors = client.insert_rows_json(table_ref, [row_dict])  # Use insert_rows_json para uma linha
    if errors:
        print(f"Ocorreram erros ao inserir a linha {index}: {errors}")
    else:
        print(f"Linha {index} inserida com sucesso.")


[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
Linha 75501 inserida com sucesso.
Linha 75502 inserida com sucesso.
Linha 75503 inserida com sucesso.
Linha 75504 inserida com sucesso.
Linha 75505 inserida com sucesso.
Linha 75506 inserida com sucesso.
Linha 75507 inserida com sucesso.
Linha 75508 inserida com sucesso.
Linha 75509 inserida com sucesso.
Linha 75510 inserida com sucesso.
Linha 75511 inserida com sucesso.
Linha 75512 inserida com sucesso.
Linha 75513 inserida com sucesso.
Linha 75514 inserida com sucesso.
Linha 75515 inserida com sucesso.
Linha 75516 inserida com sucesso.
Linha 75517 inserida com sucesso.
Linha 75518 inserida com sucesso.
Linha 75519 inserida com sucesso.
Linha 75520 inserida com sucesso.
Linha 75521 inserida com sucesso.
Linha 75522 inserida com sucesso.
Linha 75523 inserida com sucesso.
Linha 75524 inserida com sucesso.
Linha 75525 inserida com sucesso.
Linha 75526 inserida com sucesso.
Linha 75527 inserida com sucesso.
Linha 755

In [None]:
# Consulta para extrair os dados da tabela dCliente
query = "SELECT * FROM km_rodado"
df = pd.read_sql(query, engine)

# 1. Configurar o cliente do BigQuery
client = bigquery.Client()

# 2. Definir a tabela de destino no BigQuery
project_id = "gothic-airlock-438618-i2"  # Seu ID do projeto
dataset_id = "logistica"                  # Nome do dataset
table_id = 'km_rodado'                     # Nome da tabela existente no BigQuery
table_ref = f"{project_id}.{dataset_id}.{table_id}"

# 3. Inserir dados no BigQuery linha por linha
for index, row in df.iterrows():
    # Cria um dicionário com os dados da linha
    row_dict = {
        "mes": row['mes'].strftime('%Y-%m-%d'),
        "id_veiculo": row['id_veiculo'],
        "km_percorridos": row['km_percorridos'],
        "gasto_combustivel": row['gasto_combustivel'],
        "manutencao": row['manutencao'],
        "custos_fixos": row['custos_fixos']
    }

    # Insere a linha no BigQuery
    errors = client.insert_rows_json(table_ref, [row_dict])  # Use insert_rows_json para uma linha
    if errors:
        print(f"Ocorreram erros ao inserir a linha {index}: {errors}")
    else:
        print(f"Linha {index} inserida com sucesso.")


#Criando MongoDB

In [None]:
# Instalação da biblioteca necessária
!pip install --upgrade pymongo python-dotenv sqlalchemy mysql-connector-python pandas

# Importações das bibliotecas
import os
import pandas as pd
from sqlalchemy import create_engine
from google.cloud import bigquery
from urllib.parse import quote_plus
import pymongo
from dotenv import load_dotenv

# Carrega as variáveis de ambiente do arquivo .env
load_dotenv()

# 1. Conectar ao MySQL usando SQLAlchemy
engine = create_engine(f'mysql+mysqlconnector://{os.getenv("MYSQL_USER")}:{os.getenv("MYSQL_PASSWORD")}@{os.getenv("MYSQL_SERVER")}/{os.getenv("MYSQL_DATABASE")}')

# 2. Conectar ao MongoDB
usuario = os.getenv("MONGO_USER")
senha = os.getenv("MONGO_PASSWORD")
senha_escapada = quote_plus(senha)
connection_string = f"mongodb+srv://{usuario}:{senha_escapada}@cluster0.l61jv.mongodb.net/soulcode?retryWrites=true&w=majority&appName=Cluster0"

try:
    client = pymongo.MongoClient(connection_string)
    db = client['squad03']
    colecao = db['projeto03']
    print("Conexão com MongoDB bem-sucedida!")

    # 3. Extrair dados do MySQL e enviar para o MongoDB

    # Tabela 1: cliente
    query = "SELECT * FROM cliente"
    df_cliente = pd.read_sql(query, engine)

    # Converter para dicionários e inserir no MongoDB
    data_cliente = df_cliente.to_dict(orient='records')
    colecao.insert_many(data_cliente)
    print(f"Dados da tabela cliente inseridos no MongoDB: {len(data_cliente)} documentos.")

    # Tabela 2: veiculo
    query = "SELECT * FROM veiculo"
    df_veiculo = pd.read_sql(query, engine)

    # Converter para dicionários e inserir no MongoDB
    data_veiculo = df_veiculo.to_dict(orient='records')
    colecao.insert_many(data_veiculo)
    print(f"Dados da tabela veiculo inseridos no MongoDB: {len(data_veiculo)} documentos.")

    # Tabela 3: frete
    query = "SELECT * FROM frete"
    df_frete = pd.read_sql(query, engine)

    # Converter para dicionários e inserir no MongoDB
    data_frete = df_frete.to_dict(orient='records')
    colecao.insert_many(data_frete)
    print(f"Dados da tabela frete inseridos no MongoDB: {len(data_frete)} documentos.")

    # Tabela 4: km_rodado
    query = "SELECT * FROM km_rodado"
    df_kmrodado = pd.read_sql(query, engine)

    # Converter para dicionários e inserir no MongoDB
    data_kmrodado = df_kmrodado.to_dict(orient='records')
    colecao.insert_many(data_kmrodado)
    print(f"Dados da tabela kmrodado inseridos no MongoDB: {len(data_kmrodado)} documentos.")

except Exception as e:
    print(f"Erro ao conectar ou inserir dados no MongoDB: {e}")

Conexão com MongoDB bem-sucedida!
Dados da tabela dcliente inseridos no MongoDB: 1000 documentos.
Dados da tabela dveiculo inseridos no MongoDB: 50 documentos.
Erro ao conectar ou inserir dados no MongoDB: cannot encode object: datetime.date(2018, 1, 1), of type: <class 'datetime.date'>


In [None]:
# Recuperar e imprimir todos os documentos da coleção
for documento in colecao.find():
    print(documento)

{'_id': ObjectId('6712cdcf23c9e610e16effee'), 'id_cliente': 1, 'cidade': 'Duque de Caxias', 'uf': 'RJ', 'classificacao_cliente': 'Regular'}
{'_id': ObjectId('6712cdcf23c9e610e16effef'), 'id_cliente': 2, 'cidade': 'Contagem', 'uf': 'MG', 'classificacao_cliente': 'Regular'}
{'_id': ObjectId('6712cdcf23c9e610e16efff0'), 'id_cliente': 3, 'cidade': 'Barra Mansa', 'uf': 'RJ', 'classificacao_cliente': 'Regular'}
{'_id': ObjectId('6712cdcf23c9e610e16efff1'), 'id_cliente': 4, 'cidade': 'Nova Friburgo', 'uf': 'RJ', 'classificacao_cliente': 'Regular'}
{'_id': ObjectId('6712cdcf23c9e610e16efff2'), 'id_cliente': 5, 'cidade': 'Contagem', 'uf': 'MG', 'classificacao_cliente': 'Regular'}
{'_id': ObjectId('6712cdcf23c9e610e16efff3'), 'id_cliente': 6, 'cidade': 'Congonhas', 'uf': 'MG', 'classificacao_cliente': 'Estratégico'}
{'_id': ObjectId('6712cdcf23c9e610e16efff4'), 'id_cliente': 7, 'cidade': 'Congonhas', 'uf': 'MG', 'classificacao_cliente': 'Regular'}
{'_id': ObjectId('6712cdcf23c9e610e16efff5'), 'i

In [None]:
#Visualização das colunas frete
print(df_frete.columns)

Index(['data', 'id_cliente', 'id_veiculo', 'num_doc_fiscal', 'viagem',
       'valor_frete_liquido', 'peso_kg', 'valor_mercadoria'],
      dtype='object')


In [None]:
#Visualização das colunas km_rodado
print(df_kmrodado.columns)

Index(['mes', 'id_veiculo', 'km_percorridos', 'gasto_combustivel',
       'manutencao', 'custos_fixos'],
      dtype='object')


In [None]:
# Instalação da biblioteca necessária
!pip install --upgrade pymongo python-dotenv sqlalchemy mysql-connector-python pandas

# Importações das bibliotecas
import os
import pandas as pd
from sqlalchemy import create_engine
import pymongo
from dotenv import load_dotenv

# Carrega as variáveis de ambiente do arquivo .env
load_dotenv()

# Conectar ao MySQL usando SQLAlchemy
engine = create_engine(f'mysql+mysqlconnector://{os.getenv("MYSQL_USER")}:{os.getenv("MYSQL_PASSWORD")}@{os.getenv("MYSQL_SERVER")}/{os.getenv("MYSQL_DATABASE")}')

# Conectar ao MongoDB
usuario = os.getenv("MONGO_USER")
senha = os.getenv("MONGO_PASSWORD")
connection_string = f"mongodb+srv://{usuario}:{quote_plus(senha)}@cluster0.l61jv.mongodb.net/soulcode?retryWrites=true&w=majority&appName=Cluster0"

try:
    client = pymongo.MongoClient(connection_string)
    db = client['squad03']
    colecao = db['projetov3']
    print("Conexão com MongoDB bem-sucedida!")

    # Tabela 3: frete
    query = "SELECT * FROM frete"
    df_frete = pd.read_sql(query, engine)

    # Converter colunas de datas para strings
    df_frete['data'] = df_frete['data'].astype(str)

    # Converter para dicionários e inserir no MongoDB
    data_frete = df_frete.to_dict(orient='records')
    colecao.insert_many(data_frete)
    print(f"Dados da tabela frete inseridos no MongoDB: {len(data_frete)} documentos.")

    # Tabela 4: km_rodado
    query = "SELECT * FROM km_rodado"
    df_kmrodado = pd.read_sql(query, engine)

    # Converter colunas de datas para strings
    df_kmrodado['mes'] = df_kmrodado['mes'].astype(str)

    # Converter para dicionários e inserir no MongoDB
    data_kmrodado = df_kmrodado.to_dict(orient='records')
    colecao.insert_many(data_kmrodado)
    print(f"Dados da tabela km_rodado inseridos no MongoDB: {len(data_kmrodado)} documentos.")

except Exception as e:
    print(f"Erro ao conectar ou inserir dados no MongoDB: {e}")

Conexão com MongoDB bem-sucedida!
Dados da tabela frete inseridos no MongoDB: 80501 documentos.
Dados da tabela km_rodado inseridos no MongoDB: 1200 documentos.


In [None]:
# Importaçãos das bibliotecas
from pymongo import MongoClient
from pprint import pprint  # Usaremos pprint para uma exibição mais legível

# Consultar todos os documentos da coleção
documentos = colecao.find()

# Exibir todos os documentos
for doc in documentos:
    pprint(doc)

# Instalação AWS

In [None]:
!pip install boto3

#Adicionando os arquivos no S3


In [None]:
# Instalação da biblioteca necessária
!pip install boto3 python-dotenv

# Importações das bibliotecas
import os
import boto3
from botocore.exceptions import NoCredentialsError
from dotenv import load_dotenv

# Carrega as variáveis de ambiente do arquivo .env
load_dotenv()

# Substitua as suas credenciais aqui
aws_access_key_id = os.getenv('AWS_ACCESS_KEY_ID')
aws_secret_access_key = os.getenv('AWS_SECRET_ACCESS_KEY')
bucket_name = 'squad03'

# Inicializa a sessão com as credenciais
s3 = boto3.client('s3',
                  aws_access_key_id=aws_access_key_id,
                  aws_secret_access_key=aws_secret_access_key,
                  region_name='us-east-1')  # Região do bucket

def upload_to_s3(file_name, bucket, object_name=None):
    """Função para fazer upload de um arquivo para o S3."""
    if object_name is None:
        object_name = file_name

    try:
        s3.upload_file(file_name, bucket, object_name)
        print(f"Upload bem-sucedido: {file_name} para {bucket}/{object_name}")
    except FileNotFoundError:
        print("O arquivo não foi encontrado.")
    except NoCredentialsError:
        print("Credenciais não disponíveis.")
    except Exception as e:
        print(f"Ocorreu um erro: {str(e)}")

# Lista de arquivos CSV para upload
arquivos_csv = [
    '/content/Cliente.csv',
    '/content/Frete.csv',
    '/content/Km_rodado.csv',
    '/content/Veiculo.csv'
]

# Fazendo o upload de cada arquivo
for arquivo in arquivos_csv:
    upload_to_s3(arquivo, bucket_name)

#Adição tabelas

In [None]:
# Instalação das bibliotecas necessárias
!pip install boto3 python-dotenv pandas sqlalchemy mysql-connector-python

# Importações das bibliotecas
import os
import pandas as pd
import boto3
from botocore.exceptions import NoCredentialsError
from sqlalchemy import create_engine
from dotenv import load_dotenv

# Carrega as variáveis de ambiente do arquivo .env
load_dotenv()

# Conectar ao MySQL usando SQLAlchemy
mysql_host = os.getenv('MYSQL_HOST')
mysql_user = os.getenv('MYSQL_USER')
mysql_password = os.getenv('MYSQL_PASSWORD')
mysql_database = os.getenv('MYSQL_DATABASE')

engine = create_engine(f'mysql+mysqlconnector://{mysql_user}:{mysql_password}@{mysql_host}/{mysql_database}')

# Substitua as suas credenciais aqui usando variáveis de ambiente
aws_access_key_id = os.getenv('AWS_ACCESS_KEY_ID',)
aws_secret_access_key = os.getenv('AWS_SECRET_ACCESS_KEY')
region_name = 'us-east-1'

# Inicializa a sessão com as credenciais do DynamoDB
dynamodb = boto3.resource('dynamodb',
                          aws_access_key_id=aws_access_key_id,
                          aws_secret_access_key=aws_secret_access_key,
                          region_name=region_name)

# Função para criar uma tabela DynamoDB (caso ela ainda não exista)
def create_dynamodb_table(table_name):
    try:
        table = dynamodb.create_table(
            TableName=table_name,
            KeySchema=[
                {'AttributeName': 'id_veiculo', 'KeyType': 'HASH'},  # Chave primária
            ],
            AttributeDefinitions=[
                {'AttributeName': 'id_veiculo', 'AttributeType': 'S'},  # Tipo da chave (String)
            ],
            ProvisionedThroughput={
                'ReadCapacityUnits': 5,
                'WriteCapacityUnits': 5
            }
        )
        table.wait_until_exists()
        print(f"Tabela {table_name} criada com sucesso.")
    except dynamodb.meta.client.exceptions.ResourceInUseException:
        print(f"Tabela {table_name} já existe.")

# Função para inserir os dados no DynamoDB
def insert_into_dynamodb(table_name, df):
    table = dynamodb.Table(table_name)

    for index, row in df.iterrows():
        try:
            table.put_item(
                Item={
                    'id_veiculo': str(row['id_veiculo']),  # Convertendo para string se necessário
                    'placa': row['placa'],
                    'marca': row['marca'],
                    'tipo_veiculo': row['tipo_veiculo'],
                    'bau': str(row['bau'])  # Convertendo para string se necessário
                }
            )
            print(f"Linha {index} inserida com sucesso na tabela {table_name}.")
        except Exception as e:
            print(f"Erro ao inserir linha {index}: {e}")

# Extrair os dados do MySQL
query_veiculo = "SELECT * FROM veiculo"
df_veiculo = pd.read_sql(query_veiculo, engine)

# Criar a tabela DynamoDB (se ainda não existir)
table_name = 'veiculos'
create_dynamodb_table(table_name)

# Inserir os dados no DynamoDB
insert_into_dynamodb(table_name, df_veiculo)


Tabela veiculos criada com sucesso.
Linha 0 inserida com sucesso na tabela veiculos.
Linha 1 inserida com sucesso na tabela veiculos.
Linha 2 inserida com sucesso na tabela veiculos.
Linha 3 inserida com sucesso na tabela veiculos.
Linha 4 inserida com sucesso na tabela veiculos.
Linha 5 inserida com sucesso na tabela veiculos.
Linha 6 inserida com sucesso na tabela veiculos.
Linha 7 inserida com sucesso na tabela veiculos.
Linha 8 inserida com sucesso na tabela veiculos.
Linha 9 inserida com sucesso na tabela veiculos.
Linha 10 inserida com sucesso na tabela veiculos.
Linha 11 inserida com sucesso na tabela veiculos.
Linha 12 inserida com sucesso na tabela veiculos.
Linha 13 inserida com sucesso na tabela veiculos.
Linha 14 inserida com sucesso na tabela veiculos.
Linha 15 inserida com sucesso na tabela veiculos.
Linha 16 inserida com sucesso na tabela veiculos.
Linha 17 inserida com sucesso na tabela veiculos.
Linha 18 inserida com sucesso na tabela veiculos.
Linha 19 inserida com su

In [None]:
# Importaçãos das bibliotecas
import boto3
from botocore.exceptions import NoCredentialsError
import pandas as pd
from sqlalchemy import create_engine

# Conectar ao MySQL usando SQLAlchemy
engine = create_engine('mysql+mysqlconnector://eloisa:senhanormal123@34.70.115.32/projeto_final')

# Credenciais do AWS
aws_access_key_id=aws_access_key_id,
aws_secret_access_key=aws_secret_access_key,
region_name = 'us-east-1'

# Inicializa a sessão com as credenciais do DynamoDB
dynamodb = boto3.resource('dynamodb',
                          aws_access_key_id=aws_access_key_id,
                          aws_secret_access_key=aws_secret_access_key,
                          region_name=region_name)

# Função para criar uma tabela DynamoDB (caso ela ainda não exista)
def create_dynamodb_table(table_name, key_column, key_type='S'):
    try:
        table = dynamodb.create_table(
            TableName=table_name,
            KeySchema=[
                {'AttributeName': key_column, 'KeyType': 'HASH'},  # Chave primária
            ],
            AttributeDefinitions=[
                {'AttributeName': key_column, 'AttributeType': key_type},  # Tipo da chave
            ],
            ProvisionedThroughput={
                'ReadCapacityUnits': 5,
                'WriteCapacityUnits': 5
            }
        )
        table.wait_until_exists()
        print(f"Tabela {table_name} criada com sucesso.")
    except dynamodb.meta.client.exceptions.ResourceInUseException:
        print(f"Tabela {table_name} já existe.")

# Função para inserir os dados no DynamoDB
def insert_into_dynamodb(table_name, df):
    table = dynamodb.Table(table_name)

    for index, row in df.iterrows():
        try:
            item = {col: str(row[col]) if pd.notna(row[col]) else None for col in df.columns}  # Convertendo valores para string
            table.put_item(Item=item)
            print(f"Linha {index} inserida com sucesso na tabela {table_name}.")
        except Exception as e:
            print(f"Erro ao inserir linha {index}: {e}")

# 1. Tabela 'cliente'
query_cliente = "SELECT * FROM cliente"
df_cliente = pd.read_sql(query_cliente, engine)
create_dynamodb_table('clientes', 'id_cliente', 'S')  # Criar tabela com chave primária id_cliente
insert_into_dynamodb('clientes', df_cliente)

# 2. Tabela 'km_rodado'
query_km_rodado = "SELECT * FROM km_rodado"
df_km_rodado = pd.read_sql(query_km_rodado, engine)
create_dynamodb_table('km_rodado', 'id_veiculo', 'S')  # Criar tabela com chave primária id_veiculo
insert_into_dynamodb('km_rodado', df_km_rodado)

# 3. Tabela 'frete'
query_frete = "SELECT * FROM frete"
df_frete = pd.read_sql(query_frete, engine)
create_dynamodb_table('fretes', 'num_doc_fiscal', 'S')  # Criar tabela com chave primária num_doc_fiscal
insert_into_dynamodb('fretes', df_frete)

[1;30;43mA saída de streaming foi truncada nas últimas 5000 linhas.[0m
Linha 75501 inserida com sucesso na tabela fretes.
Linha 75502 inserida com sucesso na tabela fretes.
Linha 75503 inserida com sucesso na tabela fretes.
Linha 75504 inserida com sucesso na tabela fretes.
Linha 75505 inserida com sucesso na tabela fretes.
Linha 75506 inserida com sucesso na tabela fretes.
Linha 75507 inserida com sucesso na tabela fretes.
Linha 75508 inserida com sucesso na tabela fretes.
Linha 75509 inserida com sucesso na tabela fretes.
Linha 75510 inserida com sucesso na tabela fretes.
Linha 75511 inserida com sucesso na tabela fretes.
Linha 75512 inserida com sucesso na tabela fretes.
Linha 75513 inserida com sucesso na tabela fretes.
Linha 75514 inserida com sucesso na tabela fretes.
Linha 75515 inserida com sucesso na tabela fretes.
Linha 75516 inserida com sucesso na tabela fretes.
Linha 75517 inserida com sucesso na tabela fretes.
Linha 75518 inserida com sucesso na tabela fretes.
Linha 755

#Excluir Tabelas

In [None]:
# Nome da tabela a ser excluída
table_name = 'Departamentos'

# Obtém a tabela
table = dynamodb.Table(table_name)

# Exclui a tabela
try:
    table.delete()
    print(f"Tabela {table_name} excluída com sucesso.")
except ClientError as e:
    print(f"Erro ao excluir a tabela: {e.response['Error']['Message']}")

Tabela Funcionarios excluída com sucesso.


In [None]:
# Importaçãos das bibliotecas
import boto3
from botocore.exceptions import ClientError

# Inicializa a sessão com as credenciais do DynamoDB
dynamodb = boto3.resource('dynamodb',
                          aws_access_key_id='AKIATTSKF3NNLKX4JRV2',
                          aws_secret_access_key='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',
                          region_name='us-east-1')

# Nome da tabela a ser excluída
table_name = 'Departamentos'

# Obtém a tabela
table = dynamodb.Table(table_name)

# Exclui a tabela
try:
    table.delete()
    print(f"Tabela {table_name} excluída com sucesso.")
except ClientError as e:
    print(f"Erro ao excluir a tabela: {e.response['Error']['Message']}")

Tabela Departamentos excluída com sucesso.


In [None]:
# Importaçãos das bibliotecas
import boto3
from botocore.exceptions import ClientError

# Inicializa a sessão com as credenciais do DynamoDB
dynamodb = boto3.resource('dynamodb',
                          aws_access_key_id='AKIATTSKF3NNLKX4JRV2',
                          aws_secret_access_key='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',
                          region_name='us-east-1')

# Nome da tabela a ser excluída
table_name = 'logistica'

# Obtém a tabela
table = dynamodb.Table(table_name)

# Exclui a tabela
try:
    table.delete()
    print(f"Tabela {table_name} excluída com sucesso.")
except ClientError as e:
    print(f"Erro ao excluir a tabela: {e.response['Error']['Message']}")

Tabela logistica excluída com sucesso.


#Instalação Azure

In [None]:
!pip install azure-storage-blob

Collecting azure-storage-blob
  Downloading azure_storage_blob-12.23.1-py3-none-any.whl.metadata (26 kB)
Collecting azure-core>=1.30.0 (from azure-storage-blob)
  Downloading azure_core-1.31.0-py3-none-any.whl.metadata (39 kB)
Collecting isodate>=0.6.1 (from azure-storage-blob)
  Downloading isodate-0.7.2-py3-none-any.whl.metadata (11 kB)
Downloading azure_storage_blob-12.23.1-py3-none-any.whl (405 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m405.6/405.6 kB[0m [31m23.8 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading azure_core-1.31.0-py3-none-any.whl (197 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m197.4/197.4 kB[0m [31m13.2 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading isodate-0.7.2-py3-none-any.whl (22 kB)
Installing collected packages: isodate, azure-core, azure-storage-blob
Successfully installed azure-core-1.31.0 azure-storage-blob-12.23.1 isodate-0.7.2


#Envio dos Arquivos Container

In [None]:
# Importaçãos das bibliotecas
import os
from azure.storage.blob import BlobServiceClient
from dotenv import load_dotenv

# Carrega as variáveis de ambiente do arquivo .env
load_dotenv()

# Cadeia de conexão da sua conta de armazenamento
connection_string = os.getenv('AZURE_CONNECTION_STRING')

# Nome do container
container_name = "container01"

# Lista de arquivos a serem enviados
arquivos = [
    '/content/Cliente.csv',
    '/content/Frete.csv',
    '/content/Km_rodado.csv',
    '/content/Veiculo.csv'
]

# Inicializa o cliente do Blob usando a cadeia de conexão
blob_service_client = BlobServiceClient.from_connection_string(connection_string)

# Acessa o container
container_client = blob_service_client.get_container_client(container_name)

# Loop para fazer o upload de cada arquivo
for file_path in arquivos:
    blob_name = file_path.split('/')[-1]  # Nome do blob será o nome do arquivo
    try:
        # Faz o upload do arquivo
        with open(file_path, "rb") as data:
            container_client.upload_blob(name=blob_name, data=data)
            print(f"Upload de {file_path} concluído com sucesso no container {container_name} como {blob_name}.")
    except Exception as e:
        print(f"Erro ao fazer upload de {file_path}: {e}")

Upload de /content/Cliente.csv concluído com sucesso no container container01 como Cliente.csv.
Upload de /content/Frete.csv concluído com sucesso no container container01 como Frete.csv.
Upload de /content/Km_rodado.csv concluído com sucesso no container container01 como Km_rodado.csv.
Upload de /content/Veiculo.csv concluído com sucesso no container container01 como Veiculo.csv.


#Instalação SQL Azure

In [None]:
!pip install sqlalchemy pandas pyodbc

Collecting pyodbc
  Downloading pyodbc-5.2.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (2.7 kB)
Downloading pyodbc-5.2.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (336 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m336.0/336.0 kB[0m [31m15.3 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pyodbc
Successfully installed pyodbc-5.2.0


#Pacotes para conexão SQL

In [None]:
!apt-get update
!apt-get install -y unixodbc-dev
!curl https://packages.microsoft.com/keys/microsoft.asc | apt-key add -
!curl https://packages.microsoft.com/config/debian/10/prod.list > /etc/apt/sources.list.d/mssql-release.list
!apt-get update
!ACCEPT_EULA=Y apt-get install -y msodbcsql17

0% [Working]            Hit:1 http://archive.ubuntu.com/ubuntu jammy InRelease
0% [Waiting for headers] [Connecting to security.ubuntu.com (185.125.190.83)] [Connected to cloud.r-                                                                                                    Get:2 http://archive.ubuntu.com/ubuntu jammy-updates InRelease [128 kB]
                                                                                                    Get:3 https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/ InRelease [3,626 B]
0% [2 InRelease 101 kB/128 kB 79%] [Waiting for headers] [Connected to r2u.stat.illinois.edu (192.170% [Waiting for headers] [Waiting for headers] [Connected to r2u.stat.illinois.edu (192.17.190.167)]                                                                                                    Get:4 http://archive.ubuntu.com/ubuntu jammy-backports InRelease [127 kB]
0% [4 InRelease 15.6 kB/127 kB 12%] [Waiting for headers] [Waiting for header

#String de conexão

In [None]:
# Importaçãos das bibliotecas
import os
from sqlalchemy import create_engine
from dotenv import load_dotenv

# Carrega as variáveis de ambiente do arquivo .env
load_dotenv()

# Configura a string de conexão
username = os.getenv('SQL_SERVER_USERNAME')
password = os.getenv('SQL_SERVER_PASSWORD')
server = os.getenv('SQL_SERVER_HOST')
database = os.getenv('SQL_SERVER_DATABASE')

connection_string = f"mssql+pyodbc://{username}:{password}@{server}:1433/{database}?driver=ODBC+Driver+17+for+SQL+Server"
engine = create_engine(connection_string)

#Instalação biblioteca MySQL

In [None]:
!pip install pymssql

Collecting pymssql
  Downloading pymssql-2.3.1-cp310-cp310-manylinux_2_28_x86_64.whl.metadata (7.1 kB)
Downloading pymssql-2.3.1-cp310-cp310-manylinux_2_28_x86_64.whl (4.6 MB)
[?25l   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m0.0/4.6 MB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m[90m╺[0m[90m━━━━━━[0m [32m3.8/4.6 MB[0m [31m111.3 MB/s[0m eta [36m0:00:01[0m[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m4.6/4.6 MB[0m [31m70.4 MB/s[0m eta [36m0:00:00[0m
[?25hInstalling collected packages: pymssql
Successfully installed pymssql-2.3.1


#Conexão ao banco de dados Azure SQL

In [None]:
# Importação das bibliotecas
import os
import pandas as pd
from sqlalchemy import create_engine
import pymssql

# Dados de conexão ao banco de dados Azure SQL (substitua com variáveis de ambiente)
server = os.getenv('AZURE_SQL_SERVER')
database = os.getenv('AZURE_SQL_DB')
username = os.getenv('AZURE_SQL_USER')
password = os.getenv('AZURE_SQL_PASSWORD')

# Crie uma string de conexão usando pymssql
connection_string = f'mssql+pymssql://{username}:{password}@{server}/{database}'
engine = create_engine(connection_string)

try:
    # Estabelece a conexão usando pymssql com contexto
    with pymssql.connect(server=server, user=username, password=password, database=database) as conn:
        print("Conexão bem-sucedida!")

        # Exemplo de uso da conexão com pandas (opcional)
        # df = pd.read_sql("SELECT * FROM sua_tabela", conn)
        # print(df)

except Exception as e:
    print(f"Erro ao conectar: {e}")


#Verificando Colunas Data Frame

In [None]:
# Importaçãos das bibliotecas
import pandas as pd

# Carregar os arquivos CSV
cliente_df = pd.read_csv('/content/Cliente.csv')
frete_df = pd.read_csv('/content/Frete.csv')
km_rodado_df = pd.read_csv('/content/Km_rodado.csv')
veiculo_df = pd.read_csv('/content/Veiculo.csv')

# Exibir as colunas de cada arquivo
print("Colunas de Cliente.csv:", cliente_df.columns)
print("Colunas de Frete.csv:", frete_df.columns)
print("Colunas de Km_rodado.csv:", km_rodado_df.columns)
print("Colunas de Veiculo.csv:", veiculo_df.columns)

Colunas de Cliente.csv: Index(['id_cliente', 'cidade', 'uf'], dtype='object')
Colunas de Frete.csv: Index(['data', 'id_cleinte', 'id_veiculo', 'num_doc_fiscal', 'viagem',
       'valor_frete_liquido', 'peso_kg', 'Valor da Mercadoria'],
      dtype='object')
Colunas de Km_rodado.csv: Index(['mes', 'id_veiculo', 'km_percorridos', 'gasto_combustivel',
       'manutencao', 'custos_fixos'],
      dtype='object')
Colunas de Veiculo.csv: Index(['id_veiculo', 'placa', 'marca', 'tipo_veiculo', 'bau'], dtype='object')


#Renomeando Colunas

In [None]:
# Importaçãos das bibliotecas
import pandas as pd

# Caminho do arquivo CSV
file_path = '/content/Frete.csv'

# Ler o arquivo CSV
df_frete = pd.read_csv(file_path)

# Exibir as colunas originais
print("Colunas originais:", df_frete.columns.tolist())

# Renomear a coluna
df_frete.rename(columns={'Valor da Mercadoria': 'valor_mercadoria'}, inplace=True)

# Exibir as colunas após a renomeação
print("Colunas após renomeação:", df_frete.columns.tolist())

# Salvar o DataFrame modificado de volta em um novo CSV (opcional)
df_frete.to_csv('/content/Frete_renomeado.csv', index=False)

Colunas originais: ['data', 'id_cleinte', 'id_veiculo', 'num_doc_fiscal', 'viagem', 'valor_frete_liquido', 'peso_kg', 'Valor da Mercadoria']
Colunas após renomeação: ['data', 'id_cleinte', 'id_veiculo', 'num_doc_fiscal', 'viagem', 'valor_frete_liquido', 'peso_kg', 'valor_mercadoria']


#Criando Base de Dados no Azure e Inserindo Dados

In [None]:
# Importaçãos das bibliotecas
import pymssql
import pandas as pd

# Dados de conexão ao banco de dados Azure SQL
server = os.getenv('AZURE_SQL_SERVER')
database = os.getenv('AZURE_SQL_DB')
username = os.getenv('AZURE_SQL_USER')
password = os.getenv('AZURE_SQL_PASSWORD')

# Conexão com o banco de dados usando pymssql
try:
    conn = pymssql.connect(server=server, user=username, password=password, database=database)
    cursor = conn.cursor()
    print("Conexão bem-sucedida ao banco de dados Azure SQL.")

    # 1. Excluir tabelas se já existirem
    tabelas = ['Km_rodado', 'Frete', 'Veiculo', 'Cliente']
    for tabela in tabelas:
        try:
            cursor.execute(f"DROP TABLE IF EXISTS {tabela};")
            conn.commit()
            print(f"Tabela {tabela} excluída com sucesso (se existia).")
        except Exception as e:
            print(f"Erro ao excluir a tabela {tabela}: {e}")

    # 2. Criar tabelas com as colunas corretas e relacionamentos
    tabelas_sql = {
        'Cliente': '''
            CREATE TABLE Cliente (
                id_cliente INT PRIMARY KEY,
                cidade NVARCHAR(100),
                uf NVARCHAR(2)
            )
        ''',
        'Veiculo': '''
            CREATE TABLE Veiculo (
                id_veiculo INT PRIMARY KEY,
                placa NVARCHAR(10),
                marca NVARCHAR(50),
                tipo_veiculo NVARCHAR(50),
                bau NVARCHAR(50)
            )
        ''',
        'Frete': '''
            CREATE TABLE Frete (
                id_frete INT PRIMARY KEY IDENTITY(1,1),
                data DATE,
                id_cleinte INT,
                id_veiculo INT,
                num_doc_fiscal NVARCHAR(50),
                viagem NVARCHAR(50),
                valor_frete_liquido DECIMAL(10, 2),
                peso_kg DECIMAL(10, 2),
                valor_mercadoria DECIMAL(10, 2),
                FOREIGN KEY (id_cleinte) REFERENCES Cliente(id_cliente),
                FOREIGN KEY (id_veiculo) REFERENCES Veiculo(id_veiculo)
            )
        ''',
        'Km_rodado': '''
            CREATE TABLE Km_rodado (
                id_km_rodado INT PRIMARY KEY IDENTITY(1,1),
                mes NVARCHAR(20),
                id_veiculo INT,
                km_percorridos DECIMAL(10, 2),
                gasto_combustivel DECIMAL(10, 2),
                manutencao DECIMAL(10, 2),
                custos_fixos DECIMAL(10, 2),
                FOREIGN KEY (id_veiculo) REFERENCES Veiculo(id_veiculo)
            )
        '''
    }

    for nome_tabela, create_sql in tabelas_sql.items():
        try:
            cursor.execute(create_sql)
            conn.commit()
            print(f"Tabela {nome_tabela} criada com sucesso.")
        except Exception as e:
            print(f"Erro ao criar a tabela {nome_tabela}: {e}")

    # 3. Inserir dados a partir dos arquivos CSV

    # Função para inserir dados no banco
    def insert_data_from_csv(file_path, table_name, columns):
        try:
            # Ler o arquivo CSV
            df = pd.read_csv(file_path)

            # Mostrar as colunas do DataFrame para depuração
            print(f"Colunas em {file_path}: {df.columns.tolist()}")

            # Verificar se todas as colunas necessárias estão presentes
            for col in columns:
                if col not in df.columns:
                    print(f"Coluna {col} não encontrada em {file_path}.")
                    return

            # Selecionar apenas as colunas que existem na tabela
            df = df[columns]

            # Ajustar tipo de dados da coluna 'bau' para garantir que os valores sejam válidos
            if 'bau' in df.columns:
                df['bau'] = df['bau'].replace({'Alumínio': 1, 'Outro': 0})  # Exemplo de ajuste; adapte conforme necessário

            # Inserir os dados linha a linha
            for index, row in df.iterrows():
                placeholders = ', '.join(['%s'] * len(row))
                sql = f"INSERT INTO {table_name} ({', '.join(columns)}) VALUES ({placeholders})"
                cursor.execute(sql, tuple(row))

            conn.commit()
            print(f"Dados do arquivo {file_path} foram inseridos com sucesso na tabela {table_name}.")
        except Exception as e:
            print(f"Erro ao inserir dados de {file_path}: {e}")

    # Inserir dados para cada tabela
    insert_data_from_csv('/content/Cliente.csv', 'Cliente', ['id_cliente', 'cidade', 'uf'])
    insert_data_from_csv('/content/Veiculo.csv', 'Veiculo', ['id_veiculo', 'placa', 'marca', 'tipo_veiculo', 'bau'])
    insert_data_from_csv('/content/Frete.csv', 'Frete', ['data', 'id_cleinte', 'id_veiculo', 'num_doc_fiscal', 'viagem', 'valor_frete_liquido', 'peso_kg', 'valor_mercadoria'])
    insert_data_from_csv('/content/Km_rodado.csv', 'Km_rodado', ['mes', 'id_veiculo', 'km_percorridos', 'gasto_combustivel', 'manutencao', 'custos_fixos'])

except Exception as e:
    print(f"Erro ao conectar ao banco de dados: {e}")

finally:
    if 'conn' in locals():
        conn.close()  # Certifica-se de fechar a conexão

Conexão bem-sucedida ao banco de dados Azure SQL.
Tabela Km_rodado excluída com sucesso (se existia).
Tabela Frete excluída com sucesso (se existia).
Tabela Veiculo excluída com sucesso (se existia).
Tabela Cliente excluída com sucesso (se existia).
Tabela Cliente criada com sucesso.
Tabela Veiculo criada com sucesso.
Tabela Frete criada com sucesso.
Tabela Km_rodado criada com sucesso.
Colunas em /content/Cliente.csv: ['id_cliente', 'cidade', 'uf']
Dados do arquivo /content/Cliente.csv foram inseridos com sucesso na tabela Cliente.
Colunas em /content/Veiculo.csv: ['id_veiculo', 'placa', 'marca', 'tipo_veiculo', 'bau']
Dados do arquivo /content/Veiculo.csv foram inseridos com sucesso na tabela Veiculo.
Colunas em /content/Frete.csv: ['data', 'id_cleinte', 'id_veiculo', 'num_doc_fiscal', 'viagem', 'valor_frete_liquido', 'peso_kg', 'valor_mercadoria']
Dados do arquivo /content/Frete.csv foram inseridos com sucesso na tabela Frete.
Colunas em /content/Km_rodado.csv: ['mes', 'id_veiculo',

#Código com Barra de Progesso

In [None]:
# Importaçãos das bibliotecas
import pymssql
import pandas as pd
from tqdm import tqdm  # Importar tqdm para a barra de progresso

# Dados de conexão ao banco de dados Azure SQL
server = os.getenv('AZURE_SQL_SERVER')
database = os.getenv('AZURE_SQL_DB')
username = os.getenv('AZURE_SQL_USER')
password = os.getenv('AZURE_SQL_PASSWORD')

# Conexão com o banco de dados usando pymssql
try:
    conn = pymssql.connect(server=server, user=username, password=password, database=database)
    cursor = conn.cursor()
    print("Conexão bem-sucedida ao banco de dados Azure SQL.")

    # 1. Excluir tabelas se já existirem
    tabelas = ['Km_rodado', 'Frete', 'Veiculo', 'Cliente']
    for tabela in tabelas:
        try:
            cursor.execute(f"DROP TABLE IF EXISTS {tabela};")
            conn.commit()
            print(f"Tabela {tabela} excluída com sucesso (se existia).")
        except Exception as e:
            print(f"Erro ao excluir a tabela {tabela}: {e}")

    # 2. Criar tabelas com as colunas corretas e relacionamentos
    tabelas_sql = {
        'Cliente': '''
            CREATE TABLE Cliente (
                id_cliente INT PRIMARY KEY,
                cidade NVARCHAR(100),
                uf NVARCHAR(2)
            )
        ''',
        'Veiculo': '''
            CREATE TABLE Veiculo (
                id_veiculo INT PRIMARY KEY,
                placa NVARCHAR(10),
                marca NVARCHAR(50),
                tipo_veiculo NVARCHAR(50),
                bau NVARCHAR(50)
            )
        ''',
        'Frete': '''
            CREATE TABLE Frete (
                id_frete INT PRIMARY KEY IDENTITY(1,1),
                data DATE,
                id_cleinte INT,
                id_veiculo INT,
                num_doc_fiscal NVARCHAR(50),
                viagem NVARCHAR(50),
                valor_frete_liquido DECIMAL(10, 2),
                peso_kg DECIMAL(10, 2),
                valor_mercadoria DECIMAL(10, 2),
                FOREIGN KEY (id_cleinte) REFERENCES Cliente(id_cliente),
                FOREIGN KEY (id_veiculo) REFERENCES Veiculo(id_veiculo)
            )
        ''',
        'Km_rodado': '''
            CREATE TABLE Km_rodado (
                id_km_rodado INT PRIMARY KEY IDENTITY(1,1),
                mes NVARCHAR(20),
                id_veiculo INT,
                km_percorridos DECIMAL(10, 2),
                gasto_combustivel DECIMAL(10, 2),
                manutencao DECIMAL(10, 2),
                custos_fixos DECIMAL(10, 2),
                FOREIGN KEY (id_veiculo) REFERENCES Veiculo(id_veiculo)
            )
        '''
    }

    for nome_tabela, create_sql in tabelas_sql.items():
        try:
            cursor.execute(create_sql)
            conn.commit()
            print(f"Tabela {nome_tabela} criada com sucesso.")
        except Exception as e:
            print(f"Erro ao criar a tabela {nome_tabela}: {e}")

    # 3. Inserir dados a partir dos arquivos CSV

    # Função para inserir dados no banco com barra de progresso
    def insert_data_from_csv(file_path, table_name, columns):
        try:
            # Ler o arquivo CSV
            df = pd.read_csv(file_path)

            # Mostrar as colunas do DataFrame para depuração
            print(f"Colunas em {file_path}: {df.columns.tolist()}")

            # Verificar se todas as colunas necessárias estão presentes
            for col in columns:
                if col not in df.columns:
                    print(f"Coluna {col} não encontrada em {file_path}.")
                    return

            # Selecionar apenas as colunas que existem na tabela
            df = df[columns]

            # Ajustar tipo de dados da coluna 'bau' para garantir que os valores sejam válidos
            if 'bau' in df.columns:
                df['bau'] = df['bau'].replace({'Alumínio': 1, 'Outro': 0})  # Exemplo de ajuste; adapte conforme necessário

            # Inserir os dados linha a linha com barra de progresso
            with tqdm(total=len(df), desc=f"Inserindo dados na tabela {table_name}", unit="linha") as pbar:
                for index, row in df.iterrows():
                    placeholders = ', '.join(['%s'] * len(row))
                    sql = f"INSERT INTO {table_name} ({', '.join(columns)}) VALUES ({placeholders})"
                    cursor.execute(sql, tuple(row))
                    pbar.update(1)  # Atualizar a barra de progresso

            conn.commit()
            print(f"Dados do arquivo {file_path} foram inseridos com sucesso na tabela {table_name}.")

            # Confirmar o número de linhas inseridas na tabela
            cursor.execute(f"SELECT COUNT(*) FROM {table_name}")
            result = cursor.fetchone()
            print(f"Número total de registros na tabela {table_name}: {result[0]}")

        except Exception as e:
            print(f"Erro ao inserir dados de {file_path}: {e}")

    # Inserir dados para cada tabela
    insert_data_from_csv('/content/Cliente.csv', 'Cliente', ['id_cliente', 'cidade', 'uf'])
    insert_data_from_csv('/content/Veiculo.csv', 'Veiculo', ['id_veiculo', 'placa', 'marca', 'tipo_veiculo', 'bau'])
    insert_data_from_csv('/content/Frete.csv', 'Frete', ['data', 'id_cleinte', 'id_veiculo', 'num_doc_fiscal', 'viagem', 'valor_frete_liquido', 'peso_kg', 'valor_mercadoria'])
    insert_data_from_csv('/content/Km_rodado.csv', 'Km_rodado', ['mes', 'id_veiculo', 'km_percorridos', 'gasto_combustivel', 'manutencao', 'custos_fixos'])

except Exception as e:
    print(f"Erro ao conectar ao banco de dados: {e}")

finally:
    if 'conn' in locals():
        conn.close()  # Certifica-se de fechar a conexão