<a href="https://colab.research.google.com/github/rickgp99/Modelagem-de-Dados-/blob/main/Teste.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# Importar bibliotecas necessárias
import pandas as pd
import numpy as np
from datetime import datetime, timedelta

print("--- Demonstração Conceitual de Dados como Apoio à Tomada de Decisão em Google Colab ---")

# 1. Simulação de Dados Operacionais (OLTP - On-line Transaction Processing)
# Esta seção simula um banco de dados transacional, onde as operações do dia a dia da empresa ocorrem [5].
# Um banco de dados é uma 'mina de ouro' cujo estudo minucioso pode revelar informações preciosas para decisões estratégicas [8].

print("\n## 1. Simulação de Dados Operacionais (OLTP)")

# Criar um DataFrame para simular registros de transações
# Estes dados representam informações detalhadas armazenadas nos SGBDs [2].
df_oltp = pd.DataFrame({
    'ID_Transacao': [1001, 1002, 1003, 1004, 1005],
    'Data_Transacao': [datetime(2023, 1, 10), datetime(2023, 1, 15), datetime(2023, 2, 5), datetime(2023, 2, 12), datetime(2023, 3, 1)],
    'Cliente_ID': ['C001', 'C002', 'C001', 'C003', 'C002'],
    'Produto_ID': ['P101', 'P102', 'P103', 'P101', 'P102'],
    'Valor_Total': [150.00, 200.00, 300.00, 120.00, 250.00],
    'Quantidade': [9, 9, 9, 10, 10],
    'Status': ['Concluída', 'Concluída', 'Pendente', 'Concluída', 'Concluída']
})

print("\nDados iniciais (simulação de sistema OLTP):")
print(df_oltp)

# Exemplos de operações OLTP: INSERT, UPDATE, DELETE [5]
# INSERT: Adicionar uma nova transação
nova_transacao = pd.DataFrame([{
    'ID_Transacao': 1006,
    'Data_Transacao': datetime(2023, 3, 5),
    'Cliente_ID': 'C004',
    'Produto_ID': 'P104',
    'Valor_Total': 80.00,
    'Quantidade': 1,
    'Status': 'Concluída'
}])
df_oltp = pd.concat([df_oltp, nova_transacao], ignore_index=True)
print("\nApós inserir nova transação (OLTP):")
print(df_oltp)

# UPDATE: Atualizar o status de uma transação pendente [5]
df_oltp.loc[df_oltp['ID_Transacao'] == 1003, 'Status'] = 'Concluída'
print("\nApós atualizar status de transação (OLTP):")
print(df_oltp)

# DELETE (conceitual): remover uma transação (neste caso, filtramos para demonstrar a exclusão) [5]
# Em sistemas reais, muitas vezes se marca como 'cancelada' ao invés de excluir fisicamente para manter o histórico.
df_oltp_sem_1001 = df_oltp[df_oltp['ID_Transacao'] != 1001]
print("\nApós simular exclusão de transação (OLTP - id 1001):")
print(df_oltp_sem_1001) # Mostrando um novo DataFrame sem a transação para ilustrar.

# Voltaremos ao df_oltp original para as próximas etapas para manter o exemplo simples.
df_oltp.loc[df_oltp['ID_Transacao'] == 1003, 'Status'] = 'Pendente' # Revertendo o status para o exemplo do Data Warehouse

# 2. Preparação de Dados para Análise (Data Warehouse Conceitual)
# Um Data Warehouse é um repositório de informações obtidas de várias fontes e armazenadas em um único local [3].
# Seu propósito é apoiar a tomada de decisão, sendo orientado por assunto, integrado, não volátil e variável no tempo [3].
# Neste exemplo simplificado, usamos o próprio DataFrame OLTP como a "fonte" de dados para o DW.
# Em um cenário real, haveria um processo de ETL (Extração, Transformação e Carga) para mover os dados para o DW.

print("\n## 2. Preparação de Dados para Análise (Data Warehouse Conceitual)")
df_dw = df_oltp.copy() # Cria uma cópia para simular a carga no Data Warehouse
print("\nDados no Data Warehouse (snapshot do OLTP para análise):")
print(df_dw)

# 3. Análise OLAP (Online Analytical Processing)
# O OLAP permite um processo interativo de criar, gerenciar, analisar e gerar relatórios sobre dados [6].
# Ele busca obter informações de alto nível a partir de dados detalhados [2].

print("\n## 3. Análise OLAP (Online Analytical Processing)")

# Exemplo 1: Vendas totais por produto (análise de agregação)
vendas_por_produto = df_dw.groupby('Produto_ID')['Valor_Total'].sum().reset_index()
print("\nVendas totais por produto (insight para decisão sobre estoque/marketing):")
print(vendas_por_produto)
# Decisões: Qual produto estocar mais? O que vender primeiro? Qual produto deve entrar em promoção? [2]

# Exemplo 2: Vendas mensais (tendência temporal)
df_dw['Mes'] = df_dw['Data_Transacao'].dt.to_period('M')
vendas_mensais = df_dw.groupby('Mes')['Valor_Total'].sum().reset_index()
print("\nVendas totais por mês (insight para decisões de planejamento financeiro):")
print(vendas_mensais)

# Exemplo 3: Clientes mais valiosos (gastos totais por cliente)
clientes_vip = df_dw.groupby('Cliente_ID')['Valor_Total'].sum().sort_values(ascending=False).reset_index()
print("\nClientes por valor total gasto (insight para programas de fidelidade):")
print(clientes_vip)
# Esta análise pode revelar o perfil de alunos para oferta de novos cursos, por exemplo [11].

# 4. Mineração de Dados (Data Mining)
# Descoberta de conhecimento a partir de padrões, mudanças, anomalias e associações em grandes volumes de dados [4].
# Utiliza estatísticas, inteligência artificial e reconhecimento de padrões [4].

print("\n## 4. Mineração de Dados (Conceito Básico de Data Mining)")

# Exemplo 1: Identificar produtos "mais vendidos" baseado em um limiar (padrão simples)
limiar_vendas_altas = df_dw['Valor_Total'].mean() + df_dw['Valor_Total'].std()
produtos_em_destaque = df_dw.groupby('Produto_ID')['Valor_Total'].sum().reset_index()
produtos_mais_vendidos_dm = produtos_em_destaque[produtos_em_destaque['Valor_Total'] > limiar_vendas_altas]
print(f"\nProdutos com vendas acima da média + 1 desvio padrão (limiar de {limiar_vendas_altas:.2f}):")
print(produtos_mais_vendidos_dm)
# Este tipo de análise pode ser aplicado para aumentar a lucratividade de empresas [4].

# Exemplo 2: Identificar "anomalias" (transações de alto valor fora do padrão, se houvesse mais dados)
# Aqui, apenas um exemplo conceitual de como se buscaria algo incomum.
anomalias_alto_valor = df_dw[df_dw['Valor_Total'] > 280] # Definindo um limite arbitrário
print("\nTransações de alto valor que podem ser anomalias (para investigação):")
print(anomalias_alto_valor)


# 5. Business Intelligence (BI)
# É o processo de coleta, análise, monitoramento e compartilhamento de informações para a gestão de negócios [7].
# As etapas acima (OLTP, DW, OLAP, Data Mining) contribuem para o BI, focando em encontrar informações úteis para auxiliar decisões [7].

print("\n## 5. Business Intelligence (BI)")
print("As análises OLAP e as descobertas de Data Mining são componentes chave do Business Intelligence.")
print("Elas transformam 'dados brutos operacionais' em 'informação útil' para 'auxiliar a tomada de decisão' e 'fornecer conhecimento para decisões de longo prazo' [7].")
print("Por exemplo, a empresa pode decidir expandir a linha de produtos 'P103' baseado nas vendas e no perfil dos clientes [12].")

# 6. Considerações sobre Redundância, Inconsistência, Backup e Segurança
# Embora não diretamente codificáveis em um script simples, estes são aspectos cruciais na gestão de dados [11, 13-15].

print("\n## 6. Considerações (não diretamente codificáveis aqui, mas essenciais):")
print("- **Redundância e Inconsistência de Dados**: O resumo enfatiza o controle da redundância (repetição de dados) e a prevenção de inconsistências (dados cadastrados de forma errônea) [11, 13]. Um bom projeto de banco de dados (e Data Warehouse) visa minimizar esses problemas.")
print("  - Exemplo: Criar uma tabela 'Cidade' separada e referenciá-la por chave estrangeira para evitar digitar 'São Paulo', 'Sao Paulo', 'SP' [13].")
print("- **Políticas de Backup**: Essenciais para prevenção e recuperação de dados em caso de falhas, determinando responsabilidades, meios, período e locais de armazenamento [14].")
print("- **Segurança da Informação**: A informação é o bem mais valioso de uma empresa [15]. O SGBD permite implementar diversas formas de segurança, como políticas de permissões e acessos, garantindo que usuários acessem apenas o autorizado [16, 17].")
print("  - Falhas na segurança podem causar prejuízos muito altos [16].")

print("\n--- Fim da Demonstração ---")

--- Demonstração Conceitual de Dados como Apoio à Tomada de Decisão em Google Colab ---

## 1. Simulação de Dados Operacionais (OLTP)

Dados iniciais (simulação de sistema OLTP):
   ID_Transacao Data_Transacao Cliente_ID Produto_ID  Valor_Total  Quantidade  \
0          1001     2023-01-10       C001       P101        150.0           9   
1          1002     2023-01-15       C002       P102        200.0           9   
2          1003     2023-02-05       C001       P103        300.0           9   
3          1004     2023-02-12       C003       P101        120.0          10   
4          1005     2023-03-01       C002       P102        250.0          10   

      Status  
0  Concluída  
1  Concluída  
2   Pendente  
3  Concluída  
4  Concluída  

Após inserir nova transação (OLTP):
   ID_Transacao Data_Transacao Cliente_ID Produto_ID  Valor_Total  Quantidade  \
0          1001     2023-01-10       C001       P101        150.0           9   
1          1002     2023-01-15       C002    