<a href="https://colab.research.google.com/github/daniel-usp/MBA-BIA-USP/blob/main/analytics_im%C3%B3veis_sp_usp.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 🏙️ Caso de Estudo: Analytics Imobiliário em São Paulo  

## 📖 O Enredo  

Imagine que você é um investidor do mercado imobiliário em São Paulo.  
O ano é **2025** e o setor imobiliário da cidade passa por grandes transformações:  
- A valorização dos bairros próximos ao metrô 🚇  
- O aumento da procura por apartamentos com piscina 🏊 e academia 🏋️  
- A preocupação com indicadores socioeconômicos como **IDH**, **renda per capita** e **desigualdade (Gini)** 📊⚖️  

Você recebeu acesso a uma **base de dados com 2.259 imóveis de SP**.  
Cada linha é um imóvel real e cada coluna traz uma informação essencial para a decisão: preço, tamanho, localização, infraestrutura e dados socioeconômicos do bairro.  

Seu objetivo é **agir como um investidor orientado por dados**.  
Você terá que responder às perguntas de Analytics e, no final, escolher **um imóvel para recomendar como investimento**.  

---

## 📜 As Variáveis do Banco  

- **valor_total** 💰 → preço total do imóvel  
- **preco_m2** 💵 → preço por metro quadrado  
- **area_util** 📐 → área útil em m²  
- **quartos** 🛏️ → número de quartos  
- **vagas** 🚗 → número de vagas de garagem  
- **condominio** 🏢 → valor do condomínio mensal  
- **suites** 🛌 → número de suítes  
- **banheiros** 🚿 → número de banheiros  
- **piscina** 🏊 → 1 se possui piscina, 0 se não  
- **academia** 🏋️ → 1 se possui academia, 0 se não  
- **quadra** 🏀 → 1 se possui quadra esportiva, 0 se não  
- **bairro** 🏘️ → nome do bairro  
- **media_idh** 📊 → índice de desenvolvimento humano médio do bairro  
- **media_gini** ⚖️ → índice de desigualdade do bairro  
- **renda_percapita** 💵 → renda média per capita do bairro  
- **estacao_prox** 🚉 → estação de metrô mais próxima  
- **linha_prox** 🚇 → linha do metrô mais próxima  
- **dist_metro** 📏 → distância até a estação de metrô (em metros)  

---

# 🎮 Perguntas de Analytics  

## 🔎 Exploração Inicial  
1. 📊 Quantas linhas e colunas existem no dataset?  
2. 🏘️ Liste todos os bairros únicos.  
3. 📐 Qual é a área média dos imóveis (`area_util`)?  
4. 💰 Qual é o valor médio e máximo do preço (`valor_total`)?  
5. 💵 Qual é o preço médio por metro quadrado (`preco_m2`)?  
6. 📏 Qual é o imóvel com maior área útil e qual o menor?  
7. 🏢 Qual é o valor de condomínio mais alto encontrado?  
8. 🛏️ Qual é a distribuição do número de quartos?  

---

## 🏘️ Análise por Bairros  
9. 💵 Qual é o bairro mais caro em média por m²?  
10. 💵 Qual é o bairro mais barato em média por m²?  
11. 🏘️ Quais são os 5 bairros com maior número de imóveis cadastrados?  
12. 📊 Existe correlação entre renda per capita e preço por m²?  

---

## 🏗️ Infraestrutura e Comodidades  
13. 🏊 Quantos imóveis possuem piscina?  
14. 🏋️🏀 Quantos possuem academia e quadra ao mesmo tempo?  
15. 💰 Qual é o preço médio de imóveis com piscina vs sem piscina?  
16. 🚇 Qual linha de metrô concentra mais imóveis?  
17. 📏 Existe diferença de preço por m² conforme a distância do metrô (`dist_metro`)?  

---

## ⚖️ Fatores Socioeconômicos  
18. 📊 Existe relação entre IDH do bairro e preço do m²?  
19. ⚖️ Imóveis em bairros com maior desigualdade (Gini alto) são mais caros ou mais baratos?  
20. 💵 Quais são os 5 bairros com maior renda per capita e como se posicionam em termos de preço por m²?  

---

## 📈 Oportunidades de Investimento  
21. 📊 Calcule a média de preço por m² por bairro e compare cada imóvel com a média do seu bairro.  
22. ➕➖ Quantos imóveis estão acima da média (SUPER) e quantos abaixo da média (SUB)?  
23. 🏆 Quais são os 10 melhores negócios (imóveis SUB com maior área útil)?  
24. 🎯 Selecione 1 imóvel SUB que tenha pelo menos 2 quartos, 1 vaga, esteja a menos de 1 km do metrô e em bairro com IDH acima da média.  

---

# 🏆 O Desfecho  

No final, você terá que responder:  

**👉 Qual imóvel você recomendaria como investimento e por quê?**  

A decisão deve ser baseada nos insights de Analytics, equilibrando:  
- Preço justo 💵  
- Localização estratégica 🚉  
- Infraestrutura de lazer 🏊🏋️  
- Qualidade socioeconômica do bairro 📊⚖️  

🎉 Boa sorte, investidor! O mercado de São Paulo espera sua decisão. 🚀  

In [1]:
import pandas as pd

tabela = pd.read_excel("dados_imoveis_SP_Aula.xlsx")

tabela

Unnamed: 0,valor_total,preco_m2,area_util,quartos,vagas,condominio,suites,banheiros,piscina,academia,quadra,bairro,media_idh,media_gini,renda_percapita,estacao_prox,linha_prox,dist_metro
0,189900,5934.38,32,2,1,180,0,1,0,1,0,JOSE BONIFACIO,0.697182,0.410909,559.668182,SÃO MATEUS,PRATA,6822.823684
1,221110,5142.09,43,2,1,250,0,1,0,0,1,JOSE BONIFACIO,0.697182,0.410909,559.668182,CORINTHIANS-ITAQUERA,VERMELHA,4682.709841
2,219990,5116.05,43,1,1,300,0,1,1,0,0,JOSE BONIFACIO,0.697182,0.410909,559.668182,CORINTHIANS-ITAQUERA,VERMELHA,4579.311123
3,219990,5116.05,43,2,1,300,0,1,1,0,0,JOSE BONIFACIO,0.697182,0.410909,559.668182,CORINTHIANS-ITAQUERA,VERMELHA,4579.311123
4,220000,5365.85,41,2,1,300,0,1,1,1,1,JOSE BONIFACIO,0.697182,0.410909,559.668182,CORINTHIANS-ITAQUERA,VERMELHA,3313.918703
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2254,255000,11590.91,22,1,0,200,1,1,1,0,0,REPUBLICA,0.839667,0.510000,1691.543333,ANHANGABAÚ,VERMELHA,307.247605
2255,688000,4712.33,146,2,1,600,1,3,0,0,0,REPUBLICA,0.839667,0.510000,1691.543333,REPÚBLICA,AMARELA,452.950837
2256,275000,6875.00,40,1,0,382,0,1,0,0,0,REPUBLICA,0.839667,0.510000,1691.543333,REPÚBLICA,AMARELA,362.414001
2257,329000,11750.00,28,1,0,350,1,1,0,0,0,REPUBLICA,0.839667,0.510000,1691.543333,REPÚBLICA,AMARELA,394.364415


Unnamed: 0,valor_total,preco_m2,area_util,quartos,vagas,condominio,suites,banheiros,piscina,academia,quadra,media_idh,media_gini,renda_percapita,dist_metro
count,2259.0,2259.0,2259.0,2259.0,2259.0,2259.0,2259.0,2259.0,2259.0,2259.0,2259.0,2259.0,2259.0,2259.0,2259.0
mean,554514.4,7245.002032,71.065958,2.281098,1.23683,606.028774,0.652501,1.753431,0.376273,0.168659,0.316512,0.794526,0.455214,1610.743752,2761.009402
std,516054.9,2887.327976,42.005088,0.632211,1.097605,554.350458,0.804167,1.024427,0.484557,0.374533,0.465218,0.058132,0.036816,1120.535302,2647.744236
min,80000.0,1666.67,22.0,1.0,0.0,1.0,0.0,1.0,0.0,0.0,0.0,0.692258,0.370968,522.515294,31.324895
25%,270000.0,5151.645,50.0,2.0,1.0,350.0,0.0,1.0,0.0,0.0,0.0,0.7482,0.427333,870.8215,911.903103
50%,390000.0,6578.95,60.0,2.0,1.0,485.0,1.0,1.0,0.0,0.0,0.0,0.7885,0.44725,1251.631739,1996.258152
75%,600000.0,8636.36,74.0,3.0,1.0,650.0,1.0,2.0,1.0,0.0,1.0,0.8264,0.486,1789.764,3730.501883
max,3950000.0,18694.44,420.0,5.0,39.0,4800.0,4.0,8.0,1.0,1.0,1.0,0.944667,0.588889,6721.23,26101.126557
