# Relatório de Análise II

## Tipos de Imóveis

Importando a biblioteca e os dados:

In [None]:
import pandas as pd

In [None]:
dados = pd.read_csv('dados/aluguel.csv', sep=';')

In [None]:
dados.head(10)

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
0,Quitinete,Copacabana,1,0,0,40,1700.0,500.0,60.0
1,Casa,Jardim Botânico,2,0,1,100,7000.0,,
2,Conjunto Comercial/Sala,Barra da Tijuca,0,4,0,150,5200.0,4020.0,1111.0
3,Apartamento,Centro,1,0,0,15,800.0,390.0,20.0
4,Apartamento,Higienópolis,1,0,0,48,800.0,230.0,
5,Apartamento,Vista Alegre,3,1,0,70,1200.0,,
6,Apartamento,Cachambi,2,0,0,50,1300.0,301.0,17.0
7,Casa de Condomínio,Barra da Tijuca,5,4,5,750,22000.0,,
8,Casa de Condomínio,Ramos,2,2,0,65,1000.0,,
9,Conjunto Comercial/Sala,Centro,0,3,0,695,35000.0,19193.0,3030.0


Como trabalharemos apenas com uma variável (Tipo), selecionaremos ela abaixo:

In [None]:
dados['Tipo']

0                      Quitinete
1                           Casa
2        Conjunto Comercial/Sala
3                    Apartamento
4                    Apartamento
                  ...           
32955                  Quitinete
32956                Apartamento
32957                Apartamento
32958                Apartamento
32959    Conjunto Comercial/Sala
Name: Tipo, Length: 32960, dtype: object

Verificando o tipo da variável "tipo_de_imovel" onde guarda a seleção que fizemos acima:

In [None]:
tipo_de_imovel = dados['Tipo']
type(tipo_de_imovel)

pandas.core.series.Series

Temos portanto uma estrutura do Pandas chamada **Series**, que é um array unidimensional. Diferente do **DataFrame** que é uma estrutura multidimensional.

Para visualizar unicamente cada tipo de imóvel existente na nossa series, utilizaremos o "drop_duplicates()".

O método "drop_duplicates()" coleta apenas o primeiro item de cada tipo, e elimina os outros.

No inplace, quando esta marcado como true, ele modifica a variável a partir da execução do método, e não precisamos criar uma variável e atribuir a execução à ela.

In [None]:
tipo_de_imovel.drop_duplicates(inplace = True)

In [None]:
tipo_de_imovel

0                          Quitinete
1                               Casa
2            Conjunto Comercial/Sala
3                        Apartamento
7                 Casa de Condomínio
16                    Prédio Inteiro
17                              Flat
29                        Loja/Salão
80           Galpão/Depósito/Armazém
83                    Casa Comercial
117                     Casa de Vila
159                   Terreno Padrão
207                      Box/Garagem
347                             Loft
589      Loja Shopping/ Ct Comercial
2157                         Chácara
3354           Loteamento/Condomínio
4379                           Sítio
4721                   Pousada/Chalé
6983                          Studio
9687                           Hotel
23614                      Indústria
Name: Tipo, dtype: object

Agora podemos visualizar acima todos os tipos de imóveis existentes.

## Organizando a visualização

Criando um DataFrame para exibir o conteúdo de "tipo_de_imovel"

In [None]:
tipo_de_imovel = pd.DataFrame(tipo_de_imovel)
tipo_de_imovel

Unnamed: 0,Tipo
0,Quitinete
1,Casa
2,Conjunto Comercial/Sala
3,Apartamento
7,Casa de Condomínio
16,Prédio Inteiro
17,Flat
29,Loja/Salão
80,Galpão/Depósito/Armazém
83,Casa Comercial


Notamos que os índices dos itens não estão seguindo uma sequência coerente, isso porque anteriormente foi coletado os primeiros itens de cada tipo. E também foi registrada a linha em que esses itens foram encontrados pela primeira vez durante a varredura.

Modificaremos a visualização adicionando o termo indice à variável tipo_de_imovel.

In [None]:
tipo_de_imovel.index

Int64Index([    0,     1,     2,     3,     7,    16,    17,    29,    80,
               83,   117,   159,   207,   347,   589,  2157,  3354,  4379,
             4721,  6983,  9687, 23614],
           dtype='int64')

Para numerar os índices da forma correta, utilizaremos o método "range()", um interador. Mas o método precisa receber como parâmetro o tamanho do dataframe, então, verificaremos com o "shape" na primeira posição(0):

In [None]:
tipo_de_imovel.shape[0]

22

Passando essa informação para o método "range()":

In [None]:
range(tipo_de_imovel.shape[0])

range(0, 22)

Agora iremos interar o conteúdo adicionando o "for":

In [None]:
for i in range(tipo_de_imovel.shape[0]):
    print(i)

0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21


Para efetivamente adicionarmos esse índice ao nosso dataframe:

In [None]:
tipo_de_imovel.index = range(tipo_de_imovel.shape[0])

Agora temos o index enumerado corretamente:

In [None]:
tipo_de_imovel

Unnamed: 0,Tipo
0,Quitinete
1,Casa
2,Conjunto Comercial/Sala
3,Apartamento
4,Casa de Condomínio
5,Prédio Inteiro
6,Flat
7,Loja/Salão
8,Galpão/Depósito/Armazém
9,Casa Comercial


Para melhorar ainda mais a organização, nomearemos a primeira coluna de 'id'.

In [None]:
tipo_de_imovel.columns.name = 'id'
tipo_de_imovel

id,Tipo
0,Quitinete
1,Casa
2,Conjunto Comercial/Sala
3,Apartamento
4,Casa de Condomínio
5,Prédio Inteiro
6,Flat
7,Loja/Salão
8,Galpão/Depósito/Armazém
9,Casa Comercial
