# Conclusão do Módulo 1

## Projeto de Análise de Dados da Imobiliária

Você é responsável pela análise de dados de um pequeno negócio imobiliário. Você recebeu um conjunto de dados que contém informações sobre propriedades, incluindo valores de venda, áreas, número de quartos e localização. Seu objetivo é criar um relatório para a gerência que inclua análises e visualizações dos dados.

### Passos para o Exercício



#### 1.   Criação dos Dados

*   Crie um conjunto de dados usando dados aleatórios e salvando como DataFrame.
*   Exiba as primeiras linhas do DataFrame para familiarizar-se com os dados.

#### 2. Limpeza e Preparação dos Dados

* Verifique se há valores ausentes no DataFrame e trate-os apropriadamente.
* Certifique-se de que todos os dados estão no formato correto.

#### 3. Análise Exploratória dos Dados

* Calcule a média, mediana e desvio padrão dos valores de venda e áreas das propriedades.
* Determine o número de propriedades por número de quartos.
* Encontre a distribuição de preços por localização.

#### 4. Visualização dos Dados

* Crie um gráfico de barras mostrando o número de propriedades por número de quartos.
* Crie um histograma da distribuição dos valores de venda.
* Crie um gráfico de dispersão (scatter plot) mostrando a relação entre área e valor de venda das propriedades.
* Crie um gráfico de barras mostrando a média dos valores de venda por localização.
* Relatório Final

Compile todas as análises e gráficos em um relatório final, incluindo títulos e descrições para cada gráfico.

# 1. Dados

In [None]:
import pandas as pd
import numpy as np

# Definindo os dados
np.random.seed(42)  # Para reprodutibilidade

localizacoes = ["Centro", "Norte", "Sul", "Leste", "Oeste"]
dados = {
    "Id": range(1, 51),
    "Localização": np.random.choice(localizacoes, 50),
    "Valor Venda": np.random.randint(200000, 1000000, 50),
    "Área (m²)": np.random.randint(50, 300, 50),
    "Quartos": np.random.randint(1, 5, 50)
}

# Criando o DataFrame
df = pd.DataFrame(dados)

# Exibir as primeiras linhas
df.head()

# 2. Limpeza e Preparação dos Dados

In [None]:
# Verificar valores ausentes
df.isnull().sum()

# Tratar valores ausentes, se houver
df = df.dropna()

# Verificar os tipos de dados
df.dtypes

# Converter colunas para os tipos apropriados, se necessário
df['Valor Venda'] = df['Valor Venda'].astype(float)
df['Área (m²)'] = df['Área (m²)'].astype(float)


# 3. Análise Exploratória dos Dados

In [None]:
# Estatísticas descritivas
media_valor = df['Valor Venda'].mean()
mediana_valor = df['Valor Venda'].median()
desvio_valor = df['Valor Venda'].std()

media_area = df['Área (m²)'].mean()
mediana_area = df['Área (m²)'].median()
desvio_area = df['Área (m²)'].std()

# Número de propriedades por número de quartos
quartos_contagem = df['Quartos'].value_counts()

# Distribuição de preços por localização
precos_por_localizacao = df.groupby('Localização')['Valor Venda'].describe()


# 4. Visualização dos Dados

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# Gráfico de barras: Número de propriedades por número de quartos
plt.figure(figsize=(10, 6))
quartos_contagem.plot(kind='bar', color='skyblue')
plt.title('Número de Propriedades por Número de Quartos')
plt.xlabel('Número de Quartos')
plt.ylabel('Número de Propriedades')
plt.grid(True)
plt.show()

In [None]:
# Histograma: Distribuição dos valores de venda
plt.figure(figsize=(10, 6))
plt.hist(df['Valor Venda'], bins=20, color='skyblue', edgecolor='black')
plt.title('Distribuição dos Valores de Venda')
plt.xlabel('Valor de Venda')
plt.ylabel('Frequência')
plt.grid(True)
plt.show()

In [None]:
# Gráfico de dispersão: Relação entre área e valor de venda
plt.figure(figsize=(10, 6))
plt.scatter(df['Área (m²)'], df['Valor Venda'], color='skyblue')
plt.title('Relação entre Área e Valor de Venda')
plt.xlabel('Área (m²)')
plt.ylabel('Valor de Venda')
plt.grid(True)
plt.show()

In [None]:
# Gráfico de barras: Média dos valores de venda por localização
media_valores_por_localizacao = df.groupby('Localização')['Valor Venda'].mean()
plt.figure(figsize=(10, 6))
media_valores_por_localizacao.plot(kind='bar', color='skyblue')
plt.title('Média dos Valores de Venda por Localização')
plt.xlabel('Localização')
plt.ylabel('Valor Médio de Venda')
plt.grid(True)
plt.show()