# Relatório de Análise I - Base de dados e infos gerais

## Importando a Base de Dados

In [1]:
import pandas as pd

In [2]:
# importando
dados = pd.read_csv('aluguel.csv', sep = ';')
dados.head()

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
0,Quitinete,Copacabana,1,0,0,40,1700.0,500.0,60.0
1,Casa,Jardim Botânico,2,0,1,100,7000.0,,
2,Conjunto Comercial/Sala,Barra da Tijuca,0,4,0,150,5200.0,4020.0,1111.0
3,Apartamento,Centro,1,0,0,15,800.0,390.0,20.0
4,Apartamento,Higienópolis,1,0,0,48,800.0,230.0,


In [3]:
type(dados) #exibe o tipo da variável passada como parametro

pandas.core.frame.DataFrame

## Informações Gerais sobre a Base de Dados

In [4]:
dados.info() #exibe informações gerais sobra o dataframe

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 32960 entries, 0 to 32959
Data columns (total 9 columns):
Tipo          32960 non-null object
Bairro        32960 non-null object
Quartos       32960 non-null int64
Vagas         32960 non-null int64
Suites        32960 non-null int64
Area          32960 non-null int64
Valor         32943 non-null float64
Condominio    28867 non-null float64
IPTU          22723 non-null float64
dtypes: float64(3), int64(4), object(2)
memory usage: 2.3+ MB


In [5]:
dados.dtypes

Tipo           object
Bairro         object
Quartos         int64
Vagas           int64
Suites          int64
Area            int64
Valor         float64
Condominio    float64
IPTU          float64
dtype: object

In [6]:
tipos_de_dados = pd.DataFrame(dados.dtypes, columns = ['Tipos de Dados'])

In [7]:
tipos_de_dados.columns.name = 'Variáveis'

In [8]:
tipos_de_dados

Variáveis,Tipos de Dados
Tipo,object
Bairro,object
Quartos,int64
Vagas,int64
Suites,int64
Area,int64
Valor,float64
Condominio,float64
IPTU,float64


In [9]:
#listas suportam atribuições diretas, são expressas por colchetes
lista = [1, 2, 3, 4]
lista[0] = 10
lista

[10, 2, 3, 4]

In [10]:
#Tuplas não suportam atribuição direta de valores, são expressas por parenteses
tupla = (1, 2, 3, 4)
tupla

(1, 2, 3, 4)

In [11]:
tupla[0] = 10

TypeError: 'tuple' object does not support item assignment

In [None]:
#atributo; exibe uma tupla que informa a qtde de linhas e colunas do dataframe
dados.shape

In [None]:
dados.shape[0]

In [None]:
dados.shape[1]

In [None]:
print('A base de dados apresenta {} registros (imóveis) e {} variáveis'.format(dados.shape[0], dados.shape[1]))

In [None]:
print(f'A base de dados apresenta {dados.shape[0]} registros (imóveis) e {dados.shape[1]} variáveis')

In [None]:
dados['Tipo'].unique()

In [None]:
len(dados['Tipo'].unique())

In [None]:
dados['Tipo'].value_counts()

In [None]:
dados['Tipo'].value_counts(normalize = True) #em porcentagem

In [None]:
dados['Tipo'].value_counts().plot.bar()

# Relatório de Análise II - Análise básica e organização

## Tipos de Imóveis

In [None]:
#import pandas as pd
#dados = pd.read_csv('aluguel.csv', sep = ';')

In [None]:
dados.head()

In [None]:
#dados.Tipo = dados['Tipo']
dados.Tipo.head()

In [None]:
dados['Tipo'].head()

In [None]:
tipos_de_imovel = dados['Tipo']
type(tipos_de_imovel)

In [None]:
tipos_de_imovel.head()

In [None]:
#unique() - devolve um array com os itens unicos da série
tipos_de_imovel.unique()

In [None]:
#função que apaga os registros duplicados da serie.
#devolve a informação em formato sintatico, diferente de unique
tipos_de_imovel.drop_duplicates()

In [None]:
tipos_de_imovel

In [None]:
#na celula passada embora a serie tenha sido exibida com os valores duplicados
#removidos, essa operação não foi de fato implementada na série.
#para isso, é necessário informar o parametro inplace = True
tipos_de_imovel.drop_duplicates(inplace = True)
tipos_de_imovel

## Organizando a Visualização

In [None]:
tipos_de_imovel = pd.DataFrame(tipos_de_imovel)

In [None]:
tipos_de_imovel

In [None]:
tipos_de_imovel.reset_index()

In [None]:
tipos_de_imovel.reset_index(drop = True)

In [None]:
tipos_de_imovel

In [None]:
tipos_de_imovel.reset_index(drop = True, inplace = True)

In [None]:
tipos_de_imovel

In [None]:
tipos_de_imovel.columns.name = 'ID'
tipos_de_imovel

# Relatório  de Análise III - Seleção e exportação

## Imóveis Residenciais

In [None]:
#import pandas as pd
dados = pd.read_csv('aluguel.csv', sep = ';')

In [None]:
list(dados['Tipo'].drop_duplicates())

In [None]:
#dados.query('Tipo=="Quitinete" or Tipo=="Casa" or Tipo=="Apartamento" ...')
#outra forma de fazer
residencial = ['Quitinete',
 'Casa',
 'Apartamento',
 'Casa de Condomínio',
 'Casa de Vila']
residencial

In [None]:
dados.head(10)

In [None]:
selecao = dados['Tipo'].isin(residencial)
selecao.head(10)

In [None]:
dados_residencial = dados[selecao]
dados_residencial.head()

In [None]:
#verificacao
dados_residencial['Tipo'].unique()

In [None]:
dados_residencial.reset_index(drop = True, inplace = True)
dados_residencial

## Exportando a Base de Dados

In [None]:
dados_residencial.to_csv('aluguel_res.csv', sep=';')

In [None]:
pd.read_csv('aluguel_res.csv', sep=';')

In [None]:
dados_residencial.to_csv('aluguel_residencial.csv', sep=';', index = False)
pd.read_csv('aluguel_residencial.csv', sep=';')

In [None]:
#index foi salvo!!!


# Relatório de Análise IV - Seleções e frequências (exercícios)

## Seleções e Frequências

In [None]:
#import pandas as pd

In [None]:
dados = pd.read_csv('aluguel_residencial.csv', sep = ';')

In [14]:
dados.head()

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
0,Quitinete,Copacabana,1,0,0,40,1700.0,500.0,60.0
1,Casa,Jardim Botânico,2,0,1,100,7000.0,,
2,Conjunto Comercial/Sala,Barra da Tijuca,0,4,0,150,5200.0,4020.0,1111.0
3,Apartamento,Centro,1,0,0,15,800.0,390.0,20.0
4,Apartamento,Higienópolis,1,0,0,48,800.0,230.0,


In [None]:
# Selecione somente os imóveis classificados com tipo 'Apartamento'
selecao1 = dados.query('Tipo=="Apartamento"')
selecao1.head()

In [20]:
# Outra forma de selecionar somente os imóveis classificados com tipo 'Apartamento'
sel = dados['Tipo']=='Apartamento'
selecao1 = dados[sel]
n1 = selecao1.shape[0]
selecao1.head()

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
3,Apartamento,Centro,1,0,0,15,800.0,390.0,20.0
4,Apartamento,Higienópolis,1,0,0,48,800.0,230.0,
5,Apartamento,Vista Alegre,3,1,0,70,1200.0,,
6,Apartamento,Cachambi,2,0,0,50,1300.0,301.0,17.0
10,Apartamento,Centro,1,0,0,36,1200.0,,


In [22]:
# Selecione os imóveis classificados com tipos 'Casa', 'Casa de Condomínio' e 'Casa de Vila'
casas = ['Casa', 'Casa de Condomínio', 'Casa de Vila']
sel = dados['Tipo'].isin(casas)
selecao2 = dados[sel]
n2 = selecao2.shape[0]
selecao2.head()

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
1,Casa,Jardim Botânico,2,0,1,100,7000.0,,
7,Casa de Condomínio,Barra da Tijuca,5,4,5,750,22000.0,,
8,Casa de Condomínio,Ramos,2,2,0,65,1000.0,,
18,Casa de Condomínio,Taquara,3,1,1,115,2000.0,,
22,Casa de Condomínio,Barra da Tijuca,4,3,2,466,7500.0,2695.0,


In [25]:
# Selecione os imóveis com área entre 60 e 100 metros quadrados, incluindo os limites
# 60 <= Area <= 100
selecao3 = dados.query('Area>=60 and Area<=100')
n3 = selecao3.shape[0]
selecao3

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
1,Casa,Jardim Botânico,2,0,1,100,7000.0,,
5,Apartamento,Vista Alegre,3,1,0,70,1200.0,,
8,Casa de Condomínio,Ramos,2,2,0,65,1000.0,,
11,Apartamento,Grajaú,2,1,0,70,1500.0,642.0,74.0
12,Apartamento,Lins de Vasconcelos,3,1,1,90,1500.0,455.0,14.0
17,Flat,Botafogo,3,1,1,80,3800.0,1040.0,
20,Apartamento,Barra da Tijuca,2,1,1,67,1700.0,589.0,147.0
23,Apartamento,Olaria,3,1,0,68,1000.0,670.0,
24,Apartamento,Tijuca,2,1,0,78,2000.0,700.0,
32,Apartamento,Botafogo,2,1,0,76,2500.0,740.0,


In [26]:
# Selecione os imóveis que tenham pelo menos 4 quartos e aluguel menor que R$ 2.000,00
selecao4 = dados.query('Quartos>=4 and Valor<=2000')
n4 = selecao4.shape[0]
selecao4

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
701,Apartamento,Recreio dos Bandeirantes,4,2,2,160,1900.0,830.0,
1465,Apartamento,Taquara,4,1,1,110,1900.0,,
2367,Apartamento,Tijuca,4,1,0,160,2000.0,1032.0,1056.0
2874,Casa,Campo Grande,4,1,4,100,1600.0,,
3000,Apartamento,Tijuca,4,1,2,190,2000.0,1247.0,353.0
3075,Casa,Engenho de Dentro,4,3,0,120,1500.0,,
3218,Apartamento,Recreio dos Bandeirantes,4,2,2,125,1700.0,,90.0
3419,Casa de Vila,Méier,4,0,1,85,1600.0,,
3491,Apartamento,Recreio dos Bandeirantes,4,4,1,145,2000.0,1350.0,390.0
4721,Pousada/Chalé,Barra da Tijuca,23,0,23,862,1480.0,295.0,


In [27]:
#Imprima a frequencia das selecoes anteriores

print("Nº de imóveis classificados com tipo 'Apartamento' -> {}".format(n1))
print("Nº de imóveis classificados com tipos 'Casa', 'Casa de Condomínio' e 'Casa de Vila' -> {}".format(n2))
print("Nº de imóveis com área entre 60 e 100 metros quadrados, incluindo os limites -> {}".format(n3))
print("Nº de imóveis que tenham pelo menos 4 quartos e aluguel menor que R$ 2.000,00 -> {}".format(n4))

Nº de imóveis classificados com tipo 'Apartamento' -> 19532
Nº de imóveis classificados com tipos 'Casa', 'Casa de Condomínio' e 'Casa de Vila' -> 2212
Nº de imóveis com área entre 60 e 100 metros quadrados, incluindo os limites -> 10187
Nº de imóveis que tenham pelo menos 4 quartos e aluguel menor que R$ 2.000,00 -> 62
