# 🏠 Configurações do Projeto Airbnb Rio - Estruturas de Dados

Este notebook define as **estruturas de dados essenciais** utilizadas no projeto de predição de preços do Airbnb Rio de Janeiro.

## 📋 Objetivo
Centralizar e documentar todas as variáveis, categorias e configurações que serão utilizadas:
- Na interface Streamlit (`DeployProjetoAirbnb.py`)
- No treinamento do modelo (`Solução Airbnb Rio.ipynb`)
- Na predição de preços

## 🔧 Como usar
1. Execute todas as células deste notebook para definir as variáveis
2. Use essas estruturas nos outros arquivos do projeto
3. Mantenha este arquivo como referência para futuras modificações

---

In [4]:
# ================================================
# IMPORTAÇÕES E CONFIGURAÇÕES INICIAIS
# ================================================

import pandas as pd    # Manipulação de dados
import streamlit as st  # Interface web
import joblib          # Carregamento do modelo treinado

# NOTA: O modelo será carregado dinamicamente na aplicação principal
# modelo = joblib.load('modelo.joblib')  # Descomentado quando modelo existir

# ================================================
# ESTRUTURAS DE DADOS DO PROJETO
# ================================================

# 📊 VARIÁVEIS NUMÉRICAS
# Dicionário com todas as features numéricas que o usuário pode inserir
# Valores iniciais = 0 (serão substituídos pela entrada do usuário)
x_numericos = {
    'latitude': 0,              # Coordenada geográfica (-90 a 90)
    'longitude': 0,             # Coordenada geográfica (-180 a 180)
    'accommodates': 0,          # Número máximo de hóspedes
    'bathrooms': 0,             # Quantidade de banheiros
    'bedrooms': 0,              # Quantidade de quartos
    'beds': 0,                  # Quantidade de camas
    'extra_people': 0,          # Taxa cobrada por pessoa extra (R$)
    'minimum_nights': 0,        # Número mínimo de noites para reserva
    'ano': 0,                   # Ano da estadia (2018-2030)
    'mes': 0,                   # Mês da estadia (1-12)
    'n_amenities': 0,           # Número total de amenidades oferecidas
    'host_listings_count': 0    # Quantidade de imóveis que o host possui
}

# 🔘 VARIÁVEIS BOOLEANAS (True/False)
# Convertidas para 1 (Sim) ou 0 (Não) para o modelo
x_tf = {
    'host_is_superhost': 0,     # Host tem status de "Superhost"?
    'instant_bookable': 0       # Reserva pode ser feita instantaneamente?
}

# 📂 VARIÁVEIS CATEGÓRICAS
# Listas com todas as opções disponíveis para cada categoria
# Serão convertidas em variáveis dummy (one-hot encoding) para o modelo
x_listas = {
    # Tipos de propriedade disponíveis no dataset
    'property_type': [
        'Apartment',           # Apartamento
        'Bed and breakfast',   # Pousada/B&B
        'Condominium',         # Condomínio
        'Guest suite',         # Suíte de hóspedes
        'Guesthouse',          # Casa de hóspedes
        'Hostel',              # Hostel
        'House',               # Casa
        'Loft',                # Loft
        'Outros',              # Outros tipos (agrupados)
        'Serviced apartment'   # Apartamento com serviços
    ],
    
    # Tipos de acomodação
    'room_type': [
        'Entire home/apt',     # Casa/apartamento inteiro
        'Hotel room',          # Quarto de hotel
        'Private room',        # Quarto privado
        'Shared room'          # Quarto compartilhado
    ],
    
    # Políticas de cancelamento
    'cancelation_policy': [
        'flexible',                      # Flexível
        'moderate',                      # Moderada
        'strict',                        # Rígida
        'strict_14_with_grace_period'    # Rígida com período de carência
    ]
}

print("✅ Estruturas de dados definidas com sucesso!")
print(f"📊 Variáveis numéricas: {len(x_numericos)} campos")
print(f"🔘 Variáveis booleanas: {len(x_tf)} campos") 
print(f"📂 Variáveis categóricas: {len(x_listas)} grupos")
print(f"📋 Total de opções categóricas: {sum(len(opcoes) for opcoes in x_listas.values())}")

✅ Estruturas de dados definidas com sucesso!
📊 Variáveis numéricas: 12 campos
🔘 Variáveis booleanas: 2 campos
📂 Variáveis categóricas: 3 grupos
📋 Total de opções categóricas: 18


In [5]:
# ================================================
# EXEMPLO DE USO DAS ESTRUTURAS
# ================================================

# 🧪 Demonstração de como as estruturas são utilizadas no projeto

print("=" * 60)
print("📋 EXEMPLO DE USO DAS ESTRUTURAS DE DADOS")
print("=" * 60)

# Exemplo 1: Criando dicionário para variáveis dummy (categóricas)
print("\n1️⃣ Preparando variáveis categóricas (dummy variables):")
dicionario_dummy = {}
for categoria in x_listas:
    for valor in x_listas[categoria]:
        chave = f'{categoria}_{valor}'
        dicionario_dummy[chave] = 0  # Inicializa com 0
        print(f"   {chave}")

print(f"\n📊 Total de colunas dummy criadas: {len(dicionario_dummy)}")

# Exemplo 2: Simulando entrada do usuário
print("\n2️⃣ Exemplo de dados de entrada do usuário:")
exemplo_usuario = x_numericos.copy()
exemplo_usuario.update({
    'latitude': -22.9068,
    'longitude': -43.1729,
    'accommodates': 4,
    'bathrooms': 2,
    'bedrooms': 2,
    'beds': 2,
    'ano': 2024,
    'mes': 12
})

for campo, valor in exemplo_usuario.items():
    print(f"   {campo}: {valor}")

print("\n3️⃣ Exemplo de seleção categórica:")
print(f"   property_type selecionado: {x_listas['property_type'][0]}")
print(f"   room_type selecionado: {x_listas['room_type'][0]}")
print(f"   cancelation_policy selecionada: {x_listas['cancelation_policy'][0]}")

print("\n" + "=" * 60)
print("✅ Estruturas prontas para uso no projeto!")
print("📄 Próximos passos:")
print("   1. Use em DeployProjetoAirbnb.py para interface")
print("   2. Use em modelo de ML para predições") 
print("   3. Mantenha sincronizado com dados de treinamento")
print("=" * 60)

📋 EXEMPLO DE USO DAS ESTRUTURAS DE DADOS

1️⃣ Preparando variáveis categóricas (dummy variables):
   property_type_Apartment
   property_type_Bed and breakfast
   property_type_Condominium
   property_type_Guest suite
   property_type_Guesthouse
   property_type_Hostel
   property_type_House
   property_type_Loft
   property_type_Outros
   property_type_Serviced apartment
   room_type_Entire home/apt
   room_type_Hotel room
   room_type_Private room
   room_type_Shared room
   cancelation_policy_flexible
   cancelation_policy_moderate
   cancelation_policy_strict
   cancelation_policy_strict_14_with_grace_period

📊 Total de colunas dummy criadas: 18

2️⃣ Exemplo de dados de entrada do usuário:
   latitude: -22.9068
   longitude: -43.1729
   accommodates: 4
   bathrooms: 2
   bedrooms: 2
   beds: 2
   extra_people: 0
   minimum_nights: 0
   ano: 2024
   mes: 12
   n_amenities: 0
   host_listings_count: 0

3️⃣ Exemplo de seleção categórica:
   property_type selecionado: Apartment
   room