# üéâ Festeja Kids 2.0 - An√°lise de Dados

**Notebook para an√°lise de dados do sistema de gest√£o de festas infantis**

Este notebook conecta ao banco de dados do Festeja Kids e gera an√°lises e visualiza√ß√µes.

---

## üìã Como Usar no Google Colab

1. Fa√ßa upload deste arquivo no Google Colab
2. Execute as c√©lulas em ordem
3. Insira suas credenciais do banco de dados quando solicitado
4. Visualize os gr√°ficos e relat√≥rios gerados

---

## üì¶ Instala√ß√£o de Depend√™ncias

In [None]:
# Instalar bibliotecas necess√°rias
!pip install -q pymysql pandas matplotlib seaborn plotly sqlalchemy cryptography

## üìö Importar Bibliotecas

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from datetime import datetime, timedelta
from sqlalchemy import create_engine
import warnings
warnings.filterwarnings('ignore')

# Configurar estilo dos gr√°ficos
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")

print("‚úÖ Bibliotecas importadas com sucesso!")

## üîå Conex√£o com Banco de Dados

**Importante**: Suas credenciais n√£o ser√£o salvas no notebook.

In [None]:
from getpass import getpass

# Solicitar credenciais do banco de dados
print("üîê Insira as credenciais do banco de dados:")
print("\nExemplo de DATABASE_URL:")
print("mysql://usuario:senha@host:porta/database")
print("\nOu insira cada campo separadamente:\n")

# Op√ß√£o 1: URL completa
use_url = input("Deseja usar DATABASE_URL completa? (s/n): ").lower() == 's'

if use_url:
    database_url = getpass("DATABASE_URL: ")
else:
    # Op√ß√£o 2: Campos separados
    db_host = input("Host (ex: localhost): ")
    db_port = input("Porta (ex: 3306): ")
    db_user = input("Usu√°rio: ")
    db_password = getpass("Senha: ")
    db_name = input("Nome do banco (ex: festeja_kids): ")
    
    database_url = f"mysql+pymysql://{db_user}:{db_password}@{db_host}:{db_port}/{db_name}"

# Criar conex√£o
try:
    engine = create_engine(database_url)
    # Testar conex√£o
    with engine.connect() as conn:
        result = conn.execute("SELECT 1")
    print("\n‚úÖ Conex√£o estabelecida com sucesso!")
except Exception as e:
    print(f"\n‚ùå Erro ao conectar: {e}")
    print("\nVerifique suas credenciais e tente novamente.")

## üìä Carregar Dados

In [None]:
# Carregar todas as tabelas
print("üì• Carregando dados...\n")

# Festas
df_festas = pd.read_sql("SELECT * FROM festas", engine)
df_festas['dataFesta'] = pd.to_datetime(df_festas['dataFesta'])
df_festas['dataFechamento'] = pd.to_datetime(df_festas['dataFechamento'])
df_festas['valorTotal'] = df_festas['valorTotal'] / 100  # Converter centavos para reais
df_festas['valorPago'] = df_festas['valorPago'] / 100
print(f"‚úÖ Festas: {len(df_festas)} registros")

# Clientes
df_clientes = pd.read_sql("SELECT * FROM clientes", engine)
print(f"‚úÖ Clientes: {len(df_clientes)} registros")

# Pagamentos
df_pagamentos = pd.read_sql("SELECT * FROM pagamentos", engine)
df_pagamentos['dataPagamento'] = pd.to_datetime(df_pagamentos['dataPagamento'])
df_pagamentos['valor'] = df_pagamentos['valor'] / 100
print(f"‚úÖ Pagamentos: {len(df_pagamentos)} registros")

# Visita√ß√µes
df_visitacoes = pd.read_sql("SELECT * FROM visitacoes", engine)
df_visitacoes['dataVisita'] = pd.to_datetime(df_visitacoes['dataVisita'])
print(f"‚úÖ Visita√ß√µes: {len(df_visitacoes)} registros")

# Custos Vari√°veis
df_custos_var = pd.read_sql("SELECT * FROM custos_variaveis", engine)
df_custos_var['valor'] = df_custos_var['valor'] / 100
print(f"‚úÖ Custos Vari√°veis: {len(df_custos_var)} registros")

# Custos Fixos
df_custos_fixos = pd.read_sql("SELECT * FROM custos_fixos", engine)
df_custos_fixos['valor'] = df_custos_fixos['valor'] / 100
print(f"‚úÖ Custos Fixos: {len(df_custos_fixos)} registros")

print("\n‚úÖ Todos os dados carregados!")

## üìà Vis√£o Geral dos Dados

In [None]:
# Estat√≠sticas gerais
print("=" * 60)
print("üìä VIS√ÉO GERAL DO NEG√ìCIO")
print("=" * 60)

# Festas
total_festas = len(df_festas)
festas_agendadas = len(df_festas[df_festas['status'] == 'agendada'])
festas_realizadas = len(df_festas[df_festas['status'] == 'realizada'])
festas_canceladas = len(df_festas[df_festas['status'] == 'cancelada'])

print(f"\nüéâ FESTAS")
print(f"  Total: {total_festas}")
print(f"  Agendadas: {festas_agendadas}")
print(f"  Realizadas: {festas_realizadas}")
print(f"  Canceladas: {festas_canceladas}")

# Financeiro
faturamento_total = df_festas['valorTotal'].sum()
valor_recebido = df_festas['valorPago'].sum()
valor_a_receber = faturamento_total - valor_recebido
ticket_medio = df_festas['valorTotal'].mean()

print(f"\nüí∞ FINANCEIRO")
print(f"  Faturamento Total: R$ {faturamento_total:,.2f}")
print(f"  Valor Recebido: R$ {valor_recebido:,.2f}")
print(f"  Valor a Receber: R$ {valor_a_receber:,.2f}")
print(f"  Ticket M√©dio: R$ {ticket_medio:,.2f}")

# Clientes
total_clientes = len(df_clientes)
print(f"\nüë• CLIENTES")
print(f"  Total: {total_clientes}")

# Visita√ß√µes
total_visitacoes = len(df_visitacoes)
visitacoes_convertidas = len(df_visitacoes[df_visitacoes['status'] == 'fechado'])
taxa_conversao = (visitacoes_convertidas / total_visitacoes * 100) if total_visitacoes > 0 else 0

print(f"\nüîî VISITA√á√ïES")
print(f"  Total: {total_visitacoes}")
print(f"  Convertidas: {visitacoes_convertidas}")
print(f"  Taxa de Convers√£o: {taxa_conversao:.1f}%")

# Custos
total_custos_var = df_custos_var['valor'].sum()
total_custos_fixos = df_custos_fixos['valor'].sum()
total_custos = total_custos_var + total_custos_fixos
lucro = faturamento_total - total_custos
margem = (lucro / faturamento_total * 100) if faturamento_total > 0 else 0

print(f"\nüí∏ CUSTOS")
print(f"  Custos Vari√°veis: R$ {total_custos_var:,.2f}")
print(f"  Custos Fixos: R$ {total_custos_fixos:,.2f}")
print(f"  Total de Custos: R$ {total_custos:,.2f}")
print(f"\nüìä LUCRO")
print(f"  Lucro Bruto: R$ {lucro:,.2f}")
print(f"  Margem de Lucro: {margem:.1f}%")

print("\n" + "=" * 60)

## üìä Gr√°ficos e Visualiza√ß√µes

### 1. Distribui√ß√£o de Status das Festas

In [None]:
# Contar festas por status
status_counts = df_festas['status'].value_counts()

# Criar gr√°fico de pizza
fig = px.pie(
    values=status_counts.values,
    names=status_counts.index,
    title='Distribui√ß√£o de Festas por Status',
    color_discrete_sequence=px.colors.qualitative.Set3
)
fig.update_traces(textposition='inside', textinfo='percent+label')
fig.show()

### 2. Evolu√ß√£o Mensal de Contratos

In [None]:
# Agrupar festas por m√™s de fechamento
df_festas['mes_fechamento'] = df_festas['dataFechamento'].dt.to_period('M')
contratos_por_mes = df_festas.groupby('mes_fechamento').size().reset_index(name='contratos')
contratos_por_mes['mes_fechamento'] = contratos_por_mes['mes_fechamento'].astype(str)

# Criar gr√°fico de linha
fig = px.line(
    contratos_por_mes,
    x='mes_fechamento',
    y='contratos',
    title='Evolu√ß√£o Mensal de Contratos Fechados',
    markers=True
)
fig.update_layout(
    xaxis_title='M√™s',
    yaxis_title='N√∫mero de Contratos',
    hovermode='x unified'
)
fig.show()

### 3. Faturamento Mensal

In [None]:
# Agrupar faturamento por m√™s
faturamento_por_mes = df_festas.groupby('mes_fechamento')['valorTotal'].sum().reset_index()
faturamento_por_mes['mes_fechamento'] = faturamento_por_mes['mes_fechamento'].astype(str)

# Criar gr√°fico de barras
fig = px.bar(
    faturamento_por_mes,
    x='mes_fechamento',
    y='valorTotal',
    title='Faturamento Mensal',
    text='valorTotal'
)
fig.update_traces(texttemplate='R$ %{text:,.0f}', textposition='outside')
fig.update_layout(
    xaxis_title='M√™s',
    yaxis_title='Faturamento (R$)'
)
fig.show()

### 4. Ranking de Temas Mais Vendidos

In [None]:
# Contar festas por tema
temas = df_festas['tema'].value_counts().head(10).reset_index()
temas.columns = ['tema', 'quantidade']

# Criar gr√°fico de barras horizontais
fig = px.bar(
    temas,
    x='quantidade',
    y='tema',
    orientation='h',
    title='Top 10 Temas Mais Vendidos',
    text='quantidade'
)
fig.update_layout(
    xaxis_title='Quantidade de Festas',
    yaxis_title='Tema',
    yaxis={'categoryorder':'total ascending'}
)
fig.show()

### 5. Funil de Convers√£o de Visita√ß√µes

In [None]:
# Contar visita√ß√µes por status
funil = df_visitacoes['status'].value_counts().reset_index()
funil.columns = ['status', 'quantidade']

# Ordenar por funil de vendas
ordem_funil = ['visitou', 'aguardando', 'proposta_enviada', 'fechado', 'perdido']
funil['status'] = pd.Categorical(funil['status'], categories=ordem_funil, ordered=True)
funil = funil.sort_values('status')

# Criar gr√°fico de funil
fig = go.Figure(go.Funnel(
    y=funil['status'],
    x=funil['quantidade'],
    textinfo="value+percent initial"
))
fig.update_layout(title='Funil de Convers√£o de Visita√ß√µes')
fig.show()

### 6. An√°lise de Custos

In [None]:
# Criar DataFrame de custos
custos_data = pd.DataFrame({
    'Tipo': ['Custos Vari√°veis', 'Custos Fixos'],
    'Valor': [total_custos_var, total_custos_fixos]
})

# Criar gr√°fico de pizza
fig = px.pie(
    custos_data,
    values='Valor',
    names='Tipo',
    title='Distribui√ß√£o de Custos',
    color_discrete_sequence=['#ff6b6b', '#4ecdc4']
)
fig.update_traces(textposition='inside', textinfo='percent+label+value')
fig.show()

### 7. An√°lise de Lucratividade

In [None]:
# Criar DataFrame de receitas vs custos
financeiro_data = pd.DataFrame({
    'Categoria': ['Faturamento', 'Custos', 'Lucro'],
    'Valor': [faturamento_total, total_custos, lucro],
    'Cor': ['#2ecc71', '#e74c3c', '#3498db']
})

# Criar gr√°fico de barras
fig = px.bar(
    financeiro_data,
    x='Categoria',
    y='Valor',
    title='An√°lise de Lucratividade',
    text='Valor',
    color='Categoria',
    color_discrete_map={
        'Faturamento': '#2ecc71',
        'Custos': '#e74c3c',
        'Lucro': '#3498db'
    }
)
fig.update_traces(texttemplate='R$ %{text:,.0f}', textposition='outside')
fig.update_layout(yaxis_title='Valor (R$)', showlegend=False)
fig.show()

### 8. Distribui√ß√£o de Convidados por Festa

In [None]:
# Criar histograma de n√∫mero de convidados
fig = px.histogram(
    df_festas,
    x='numeroConvidados',
    nbins=20,
    title='Distribui√ß√£o de N√∫mero de Convidados',
    labels={'numeroConvidados': 'N√∫mero de Convidados', 'count': 'Frequ√™ncia'}
)
fig.update_layout(
    xaxis_title='N√∫mero de Convidados',
    yaxis_title='Quantidade de Festas'
)
fig.show()

# Estat√≠sticas
print(f"\nüìä Estat√≠sticas de Convidados:")
print(f"  M√©dia: {df_festas['numeroConvidados'].mean():.0f} convidados")
print(f"  Mediana: {df_festas['numeroConvidados'].median():.0f} convidados")
print(f"  M√≠nimo: {df_festas['numeroConvidados'].min():.0f} convidados")
print(f"  M√°ximo: {df_festas['numeroConvidados'].max():.0f} convidados")

## üíæ Exportar Relat√≥rios

In [None]:
# Criar relat√≥rio em Excel com m√∫ltiplas abas
from datetime import datetime

timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
filename = f"Festeja_Kids_Relatorio_{timestamp}.xlsx"

with pd.ExcelWriter(filename, engine='openpyxl') as writer:
    # Aba 1: Resumo Executivo
    resumo = pd.DataFrame({
        'M√©trica': [
            'Total de Festas',
            'Festas Agendadas',
            'Festas Realizadas',
            'Faturamento Total',
            'Valor Recebido',
            'Valor a Receber',
            'Ticket M√©dio',
            'Total de Clientes',
            'Total de Visita√ß√µes',
            'Taxa de Convers√£o',
            'Total de Custos',
            'Lucro Bruto',
            'Margem de Lucro'
        ],
        'Valor': [
            total_festas,
            festas_agendadas,
            festas_realizadas,
            f"R$ {faturamento_total:,.2f}",
            f"R$ {valor_recebido:,.2f}",
            f"R$ {valor_a_receber:,.2f}",
            f"R$ {ticket_medio:,.2f}",
            total_clientes,
            total_visitacoes,
            f"{taxa_conversao:.1f}%",
            f"R$ {total_custos:,.2f}",
            f"R$ {lucro:,.2f}",
            f"{margem:.1f}%"
        ]
    })
    resumo.to_excel(writer, sheet_name='Resumo Executivo', index=False)
    
    # Aba 2: Festas
    df_festas.to_excel(writer, sheet_name='Festas', index=False)
    
    # Aba 3: Clientes
    df_clientes.to_excel(writer, sheet_name='Clientes', index=False)
    
    # Aba 4: Pagamentos
    df_pagamentos.to_excel(writer, sheet_name='Pagamentos', index=False)
    
    # Aba 5: Visita√ß√µes
    df_visitacoes.to_excel(writer, sheet_name='Visita√ß√µes', index=False)
    
    # Aba 6: Evolu√ß√£o Mensal
    contratos_por_mes.to_excel(writer, sheet_name='Evolu√ß√£o Mensal', index=False)
    
    # Aba 7: Ranking de Temas
    temas.to_excel(writer, sheet_name='Ranking Temas', index=False)

print(f"\n‚úÖ Relat√≥rio exportado: {filename}")
print(f"\nüì• Fa√ßa o download do arquivo no menu 'Arquivos' do Colab")

# Disponibilizar para download
from google.colab import files
files.download(filename)

## üí° Insights e Recomenda√ß√µes

In [None]:
print("=" * 60)
print("üí° INSIGHTS E RECOMENDA√á√ïES")
print("=" * 60)

# An√°lise de convers√£o
if taxa_conversao < 30:
    print("\n‚ö†Ô∏è Taxa de convers√£o baixa (<30%)")
    print("   Recomenda√ß√£o: Melhorar follow-up de visita√ß√µes")
elif taxa_conversao < 50:
    print("\n‚úÖ Taxa de convers√£o moderada (30-50%)")
    print("   Recomenda√ß√£o: Continuar otimizando processo de vendas")
else:
    print("\nüéâ Taxa de convers√£o excelente (>50%)!")
    print("   Recomenda√ß√£o: Manter estrat√©gia atual")

# An√°lise de margem
if margem < 20:
    print("\n‚ö†Ô∏è Margem de lucro baixa (<20%)")
    print("   Recomenda√ß√£o: Revisar custos e precifica√ß√£o")
elif margem < 40:
    print("\n‚úÖ Margem de lucro saud√°vel (20-40%)")
    print("   Recomenda√ß√£o: Buscar otimiza√ß√µes incrementais")
else:
    print("\nüéâ Margem de lucro excelente (>40%)!")
    print("   Recomenda√ß√£o: Considerar expans√£o do neg√≥cio")

# An√°lise de inadimpl√™ncia
taxa_inadimplencia = (valor_a_receber / faturamento_total * 100) if faturamento_total > 0 else 0
if taxa_inadimplencia > 30:
    print(f"\n‚ö†Ô∏è Alta inadimpl√™ncia ({taxa_inadimplencia:.1f}%)")
    print("   Recomenda√ß√£o: Implementar cobran√ßa mais rigorosa")
else:
    print(f"\n‚úÖ Inadimpl√™ncia controlada ({taxa_inadimplencia:.1f}%)")

# Tema mais popular
if len(df_festas) > 0:
    tema_popular = df_festas['tema'].value_counts().index[0]
    print(f"\nüé® Tema mais popular: {tema_popular}")
    print("   Recomenda√ß√£o: Investir em decora√ß√£o deste tema")

# Sazonalidade
if len(df_festas) > 0:
    df_festas['mes'] = df_festas['dataFesta'].dt.month
    mes_popular = df_festas['mes'].value_counts().index[0]
    meses = ['Jan', 'Fev', 'Mar', 'Abr', 'Mai', 'Jun', 'Jul', 'Ago', 'Set', 'Out', 'Nov', 'Dez']
    print(f"\nüìÖ M√™s com mais festas: {meses[mes_popular-1]}")
    print("   Recomenda√ß√£o: Preparar estoque e equipe para alta demanda")

print("\n" + "=" * 60)

---

## ‚úÖ An√°lise Conclu√≠da!

**Desenvolvido para Festeja Kids 2.0**

Para mais informa√ß√µes, consulte:
- `TIMELINE.md` - Hist√≥rico completo do projeto
- `DESENVOLVIMENTO_LOCAL.md` - Guia de desenvolvimento
- `DOCUMENTACAO_TECNICA.md` - Documenta√ß√£o t√©cnica

---