# üè† Configura√ß√µes do Projeto Airbnb Rio - Estruturas de Dados

Este notebook define as **estruturas de dados essenciais** utilizadas no projeto de predi√ß√£o de pre√ßos do Airbnb Rio de Janeiro.

## üìã Objetivo
Centralizar e documentar todas as vari√°veis, categorias e configura√ß√µes que ser√£o utilizadas:
- Na interface Streamlit (`DeployProjetoAirbnb.py`)
- No treinamento do modelo (`Solu√ß√£o Airbnb Rio.ipynb`)
- Na predi√ß√£o de pre√ßos

## üîß Como usar
1. Execute todas as c√©lulas deste notebook para definir as vari√°veis
2. Use essas estruturas nos outros arquivos do projeto
3. Mantenha este arquivo como refer√™ncia para futuras modifica√ß√µes

---

In [4]:
# ================================================
# IMPORTA√á√ïES E CONFIGURA√á√ïES INICIAIS
# ================================================

import pandas as pd    # Manipula√ß√£o de dados
import streamlit as st  # Interface web
import joblib          # Carregamento do modelo treinado

# NOTA: O modelo ser√° carregado dinamicamente na aplica√ß√£o principal
# modelo = joblib.load('modelo.joblib')  # Descomentado quando modelo existir

# ================================================
# ESTRUTURAS DE DADOS DO PROJETO
# ================================================

# üìä VARI√ÅVEIS NUM√âRICAS
# Dicion√°rio com todas as features num√©ricas que o usu√°rio pode inserir
# Valores iniciais = 0 (ser√£o substitu√≠dos pela entrada do usu√°rio)
x_numericos = {
    'latitude': 0,              # Coordenada geogr√°fica (-90 a 90)
    'longitude': 0,             # Coordenada geogr√°fica (-180 a 180)
    'accommodates': 0,          # N√∫mero m√°ximo de h√≥spedes
    'bathrooms': 0,             # Quantidade de banheiros
    'bedrooms': 0,              # Quantidade de quartos
    'beds': 0,                  # Quantidade de camas
    'extra_people': 0,          # Taxa cobrada por pessoa extra (R$)
    'minimum_nights': 0,        # N√∫mero m√≠nimo de noites para reserva
    'ano': 0,                   # Ano da estadia (2018-2030)
    'mes': 0,                   # M√™s da estadia (1-12)
    'n_amenities': 0,           # N√∫mero total de amenidades oferecidas
    'host_listings_count': 0    # Quantidade de im√≥veis que o host possui
}

# üîò VARI√ÅVEIS BOOLEANAS (True/False)
# Convertidas para 1 (Sim) ou 0 (N√£o) para o modelo
x_tf = {
    'host_is_superhost': 0,     # Host tem status de "Superhost"?
    'instant_bookable': 0       # Reserva pode ser feita instantaneamente?
}

# üìÇ VARI√ÅVEIS CATEG√ìRICAS
# Listas com todas as op√ß√µes dispon√≠veis para cada categoria
# Ser√£o convertidas em vari√°veis dummy (one-hot encoding) para o modelo
x_listas = {
    # Tipos de propriedade dispon√≠veis no dataset
    'property_type': [
        'Apartment',           # Apartamento
        'Bed and breakfast',   # Pousada/B&B
        'Condominium',         # Condom√≠nio
        'Guest suite',         # Su√≠te de h√≥spedes
        'Guesthouse',          # Casa de h√≥spedes
        'Hostel',              # Hostel
        'House',               # Casa
        'Loft',                # Loft
        'Outros',              # Outros tipos (agrupados)
        'Serviced apartment'   # Apartamento com servi√ßos
    ],
    
    # Tipos de acomoda√ß√£o
    'room_type': [
        'Entire home/apt',     # Casa/apartamento inteiro
        'Hotel room',          # Quarto de hotel
        'Private room',        # Quarto privado
        'Shared room'          # Quarto compartilhado
    ],
    
    # Pol√≠ticas de cancelamento
    'cancelation_policy': [
        'flexible',                      # Flex√≠vel
        'moderate',                      # Moderada
        'strict',                        # R√≠gida
        'strict_14_with_grace_period'    # R√≠gida com per√≠odo de car√™ncia
    ]
}

print("‚úÖ Estruturas de dados definidas com sucesso!")
print(f"üìä Vari√°veis num√©ricas: {len(x_numericos)} campos")
print(f"üîò Vari√°veis booleanas: {len(x_tf)} campos") 
print(f"üìÇ Vari√°veis categ√≥ricas: {len(x_listas)} grupos")
print(f"üìã Total de op√ß√µes categ√≥ricas: {sum(len(opcoes) for opcoes in x_listas.values())}")

‚úÖ Estruturas de dados definidas com sucesso!
üìä Vari√°veis num√©ricas: 12 campos
üîò Vari√°veis booleanas: 2 campos
üìÇ Vari√°veis categ√≥ricas: 3 grupos
üìã Total de op√ß√µes categ√≥ricas: 18


In [5]:
# ================================================
# EXEMPLO DE USO DAS ESTRUTURAS
# ================================================

# üß™ Demonstra√ß√£o de como as estruturas s√£o utilizadas no projeto

print("=" * 60)
print("üìã EXEMPLO DE USO DAS ESTRUTURAS DE DADOS")
print("=" * 60)

# Exemplo 1: Criando dicion√°rio para vari√°veis dummy (categ√≥ricas)
print("\n1Ô∏è‚É£ Preparando vari√°veis categ√≥ricas (dummy variables):")
dicionario_dummy = {}
for categoria in x_listas:
    for valor in x_listas[categoria]:
        chave = f'{categoria}_{valor}'
        dicionario_dummy[chave] = 0  # Inicializa com 0
        print(f"   {chave}")

print(f"\nüìä Total de colunas dummy criadas: {len(dicionario_dummy)}")

# Exemplo 2: Simulando entrada do usu√°rio
print("\n2Ô∏è‚É£ Exemplo de dados de entrada do usu√°rio:")
exemplo_usuario = x_numericos.copy()
exemplo_usuario.update({
    'latitude': -22.9068,
    'longitude': -43.1729,
    'accommodates': 4,
    'bathrooms': 2,
    'bedrooms': 2,
    'beds': 2,
    'ano': 2024,
    'mes': 12
})

for campo, valor in exemplo_usuario.items():
    print(f"   {campo}: {valor}")

print("\n3Ô∏è‚É£ Exemplo de sele√ß√£o categ√≥rica:")
print(f"   property_type selecionado: {x_listas['property_type'][0]}")
print(f"   room_type selecionado: {x_listas['room_type'][0]}")
print(f"   cancelation_policy selecionada: {x_listas['cancelation_policy'][0]}")

print("\n" + "=" * 60)
print("‚úÖ Estruturas prontas para uso no projeto!")
print("üìÑ Pr√≥ximos passos:")
print("   1. Use em DeployProjetoAirbnb.py para interface")
print("   2. Use em modelo de ML para predi√ß√µes") 
print("   3. Mantenha sincronizado com dados de treinamento")
print("=" * 60)

üìã EXEMPLO DE USO DAS ESTRUTURAS DE DADOS

1Ô∏è‚É£ Preparando vari√°veis categ√≥ricas (dummy variables):
   property_type_Apartment
   property_type_Bed and breakfast
   property_type_Condominium
   property_type_Guest suite
   property_type_Guesthouse
   property_type_Hostel
   property_type_House
   property_type_Loft
   property_type_Outros
   property_type_Serviced apartment
   room_type_Entire home/apt
   room_type_Hotel room
   room_type_Private room
   room_type_Shared room
   cancelation_policy_flexible
   cancelation_policy_moderate
   cancelation_policy_strict
   cancelation_policy_strict_14_with_grace_period

üìä Total de colunas dummy criadas: 18

2Ô∏è‚É£ Exemplo de dados de entrada do usu√°rio:
   latitude: -22.9068
   longitude: -43.1729
   accommodates: 4
   bathrooms: 2
   bedrooms: 2
   beds: 2
   extra_people: 0
   minimum_nights: 0
   ano: 2024
   mes: 12
   n_amenities: 0
   host_listings_count: 0

3Ô∏è‚É£ Exemplo de sele√ß√£o categ√≥rica:
   property_type seleci