# Aula 01 - Resolução dos Exercícios

## Novas perguntas do CEO para vocês
1. Quantas casas estão disponíveis para compra?
2. Quantos atributos as casas possuem?
3. Quais são os atributos das casas?
4. Qual a casa mais cara ( casa com o maior valor de venda )?
5. Qual a casa com o maior número de quartos?

6. Qual a soma total de quartos do conjunto de dados?
7. Quantas casas possuem 2 banheiros?
8. Qual o preço médio de todas as casas no conjunto de dados?
9. Qual o preço médio de casas com 2 banheiros?
10. Qual o preço mínimo entre as casas com 3 quartos?

11. Quantas casas possuem mais de 300 metros quadrados na sala de estar?
12. Quantas casas tem mais de 2 andares?
13. Quantas casas tem vista para o mar?
14. Das casas com vista para o mar, quantas tem 3 quartos?
15. Das casas com mais de 300 metros quadrados de sala de estar, quantas tem mais de 2 banheiros?


# Resolução

## Import Libraries

In [1]:
import numpy  as np
import pandas as pd
import seaborn as sns

from matplotlib import pyplot as plt
import plotly.express as px

In [2]:
# Supress Scientific Notation
np.set_printoptions(suppress=True)
pd.set_option("display.float_format", '{:.2f}'.format)

## Loading Data

In [3]:
# loading data into memory
data = pd.read_csv( 'datasets/kc_house_data.csv' )

## 1. Quantas casas estão disponíveis para compra?

In [4]:
# Atenção! Temos casas duplicadas, para saber o numero de casas precisamos ver ids únicos
# Checando se há duplicatas
data['id'].is_unique

False

In [5]:
# Temos que contar apenas os ids únicos

num_houses_unique = data['id'].nunique()

# Resultado
print( 'Estão disponíveis {} imóveis para compra'.format( num_houses_unique ) )

Estão disponíveis 21436 imóveis para compra


## 2. Quantos atributos as casas possuem?

In [6]:
# O numero de colunas representam os atributos do apartamento
num_attributes = len( data.columns )

# Resultado
print( "Os imóveis posseum {} atributos". format( num_attributes ) )

Os imóveis posseum 21 atributos


## 3. Quais são os atributos das casas?

In [7]:
print( "Esses são os seguintes atributos das casas: {}".format( data.columns.tolist() ))

Esses são os seguintes atributos das casas: ['id', 'date', 'price', 'bedrooms', 'bathrooms', 'sqft_living', 'sqft_lot', 'floors', 'waterfront', 'view', 'condition', 'grade', 'sqft_above', 'sqft_basement', 'yr_built', 'yr_renovated', 'zipcode', 'lat', 'long', 'sqft_living15', 'sqft_lot15']


## 4. Qual a casa mais cara ( casa com o maior valor de venda )?

In [10]:
# Estratégia: selecionar as colunas 'id' e 'price', ordenar as casas pela coluna 'price' em ordem decrescente e escolher o imóvel do primeiro id.

# DataFrame.sort_values
# (by, axis=0, ascending=True, inplace=False, kind='quicksort', na_position='last', ignore_index=False, key=None)
# loc para pegar o dado da primeira linha da coluna 'id'
most_expensive_house = data[[ 'id','price' ]].sort_values( 'price', ascending=False ).reset_index().loc[0,'id']

# Resposta tem que ser o id 6762700020, mas apenas com o loc[0,'id'] o resultado está sendo: 7129300520. 
# ATENÇÃO Solução: resetar o index, pois o item 0 estava sendo considerado erroneamente!

print( "A casa mais cara é a {}.".format( most_expensive_house ) )

A casa mais cara é a 6762700020.


## 5. Qual a casa com o maior número de quartos?

In [61]:
# Estratégia:
# 1. Selecionar as colunas 'id' e 'bedrooms'
# 2. Ordenar os imóveis pelo numero de quartos em ordem decrescente
# 3. Selecionar o primeiro dado da coluna 'id'

greater_num_bedrooms = data[[ 'id','bedrooms' ]].sort_values( 'bedrooms', ascending=False ).reset_index().loc[0,'id'] 
print( 'A casa com maior número de quartos é a de id: {}.'.format( greater_num_bedrooms ) )

A casa com maior número de quartos é a de id: 2402100895.


## 6. Qual a soma total de quartos do conjunto de dados?

In [64]:
# Estratégia:
# 1. Somar os dados da coluna 'bedrooms'

total_num_bedrooms = data[ 'bedrooms' ].sum()

print( 'A soma total de quartos do conjunto de dados é: {}.'.format( total_num_bedrooms ) )

A soma total de quartos do conjunto de dados é: 72854.


## 7. Quantas casas possuem 2 banheiros?

In [68]:
# Estratégia:
# 1. Filtrar linhas (imóveis) que possuem 2 'bathrooms'
# 2. Contar o número de linhas do dataset

# Dica: atente que quando temos os booleanos (resultantes de alguma condição), podemos usar eles para selecionar linhas e colunas!
# loc = localize pelo nome das colunas
# iloc = localize para mim pelo índice das linhas e das colunas

num_houses = len( data.loc[data[ 'bathrooms' ] == 2, 'bathrooms'] )

print( 'O número total de casas que possuem 2 banheiros é: {}.'.format( num_houses ) )

O número total de casas que possuem 2 banheiros é: 1930.


## 8. Qual o preço médio de todas as casas no conjunto de dados?

In [71]:
# Estratégia:
# 1. Calcular o preço médio da coluna 'price'

avg_price = np.round( data[ 'price' ].mean(), 2 )

print( 'O preço médio de todas as casas no conjunto de dados é de: R${}.'.format( avg_price ))

O preço médio de todas as casas no conjunto de dados é de: R$540088.14.


## 9. Qual o preço médio de casas com 2 banheiros?

In [73]:
# Estratégia:
# 1. Selecionar os imóveis com 2 'bathrooms'
# 2. Calcular o preço médio da coluna 'price' do novo conjunto de dados

avg_price = np.round( data.loc[data[ 'bathrooms' ] == 2, 'price'].mean() , 2 )

print( 'O preço médio de casas com 2 banheiros é de: R${}.'.format( avg_price ) )

O preço médio de casas com 2 banheiros é de: R$457889.72.


## 10. Qual o preço mínimo entre as casas com 3 quartos?

In [77]:
# Estratégia:
# 1. Selecionar imíveis com 3 'bedrooms'
# 2. Calcular o menor preço da coluna 'price' do novo conjunto de dados

min_price = data.loc[ data[ 'bedrooms' ] == 3, 'price'].min()

print( 'O preço mínimo entre as casas com 3 quartos é de: R${}.'. format( min_price ) )

O preço mínimo entre as casas com 3 quartos é de: R$82000.0.


## 11. Quantas casas possuem mais de 300 metros quadrados na sala de estar?

In [11]:
# Estratégia:
# 1. Filtrar os imóveis com mais de 300 'sqft_living'
# 2. Contar o número de imóveis nesse novo conjunto de dados

data['m2'] = data['sqft_living'] * 0.093
houses = data.loc[data[ 'sqft_living' ] > 300, 'id'].shape[0]

print( 'Um total de {} casas possuem mais de 300 metros quadrados na sala de estar.'.format( houses ))

Um total de 21612 casas possuem mais de 300 metros quadrados na sala de estar.


## 12. Quantas casas tem mais de 2 andares?

In [83]:
# Estratégia:
# 1. Selecionar imóveis com a coluna 'floors' maior que 2.
# 2. Contar o número de imóveis nesse novo conjunto de dados.

houses = data.loc[ data[ 'floors' ] > 2, 'id' ].shape[0]

print( 'Um total de {} casas possuem mais de 2 andares.'.format( houses ) )

Um total de 782 casas possuem mais de 2 andares.


## 13. Quantas casas tem vista para o mar?

In [84]:
# Estratégia:
# 1. Selecionar imóveis com a coluna 'waterfront' igual a 1.
# 2. Contar o número de imóveis nesse novo conjunto de dados.

houses = data.loc[ data[ 'waterfront' ] == 1, 'id' ].shape[0]

print( 'Um total de {} casas possuem vista para o mar.'.format( houses ) )

Um total de 163 casas possuem vista para o mar.


## 14. Das casas com vista para o mar, quantas tem 3 quartos?

In [87]:
# Estratégia:
# 1. Selecionar imóveis com a coluna 'waterfront' igual a 1 e a coluna 'bedrooms' maior que 3.
# 2. Contar o número de imóveis nesse novo conjunto de dados.

houses = data.loc[ (data[ 'waterfront' ] == 1) & ( data[ 'bedrooms' ] == 3 ), 'id' ].shape[0]

print( 'Um total de {} casas com vista pro mar possuem 3 quartos.'.format( houses ) )

Um total de 64 casas com vista pro mar possuem 3 quartos.


## 15. Das casas com mais de 300 metros quadrados de sala de estar, quantas tem mais de 2 banheiros?

In [88]:
# Estratégia:
# 1. Selecionar imóveis com a coluna 'sqft_living' maior que 300 e a coluna 'bathrooms' maior que 2.
# 2. Contar o número de imóveis nesse novo conjunto de dados.

houses = data.loc[ ( data[ 'sqft_living' ] > 300 ) & ( data[ 'bathrooms' ] > 2 ), 'id' ].shape[0]

print( 'Um total de {} casas com mais de 300 metros quadrados de sala de estar possuem mais de 2 banheiros.'.format( houses ) )

Um total de 11242 casas com mais de 300 metros quadrados de sala de estar possuem mais de 2 banheiros.
