# Relatório de Análise II

Neste segundo relatório, nosso objetivo consiste em identificar os tipos de imóveis distintos que estão presentes na base de dados.

## Explorando os Tipos de Imóveis

In [1]:
# Importa o pandas com o apelido pd
import pandas as pd

# Importa o módulo os
import os

# Muda o diretório atual para a pasta de dados
os.chdir('dados')

# Lê o arquivo com os dados dos imóveis
imoveis = pd.read_csv('aluguel.csv', sep=';')

# Exibe as cinco primeiras linhas do dataframe
imoveis.head()

Unnamed: 0,Tipo,Bairro,Quartos,Vagas,Suites,Area,Valor,Condominio,IPTU
0,Quitinete,Copacabana,1,0,0,40,1700.0,500.0,60.0
1,Casa,Jardim Botânico,2,0,1,100,7000.0,,
2,Conjunto Comercial/Sala,Barra da Tijuca,0,4,0,150,5200.0,4020.0,1111.0
3,Apartamento,Centro,1,0,0,15,800.0,390.0,20.0
4,Apartamento,Higienópolis,1,0,0,48,800.0,230.0,


In [2]:
# Exibe uma série com os tipos de imóveis
imoveis['Tipo']

0                      Quitinete
1                           Casa
2        Conjunto Comercial/Sala
3                    Apartamento
4                    Apartamento
                  ...           
32955                  Quitinete
32956                Apartamento
32957                Apartamento
32958                Apartamento
32959    Conjunto Comercial/Sala
Name: Tipo, Length: 32960, dtype: object

In [3]:
# Armazena a série com os tipos de imóveis numa variável
tipos_de_imoveis = imoveis['Tipo']

# Exibe o tip da variável
type(tipos_de_imoveis)

pandas.core.series.Series

Desejamos saber quais são os tipos distintos de imóveis nesta base de dados:

In [4]:
# Remove os valores duplicados da série, mantendo somente a primeira ocorrência
tipos_de_imoveis.drop_duplicates()

0                          Quitinete
1                               Casa
2            Conjunto Comercial/Sala
3                        Apartamento
7                 Casa de Condomínio
16                    Prédio Inteiro
17                              Flat
29                        Loja/Salão
80           Galpão/Depósito/Armazém
83                    Casa Comercial
117                     Casa de Vila
159                   Terreno Padrão
207                      Box/Garagem
347                             Loft
589      Loja Shopping/ Ct Comercial
2157                         Chácara
3354           Loteamento/Condomínio
4379                           Sítio
4721                   Pousada/Chalé
6983                          Studio
9687                           Hotel
23614                      Indústria
Name: Tipo, dtype: object

In [5]:
# Remove os valores duplicados da série, mantendo somente a primeira ocorrência
# Com o parâmetro `inplace` definido como `True` modificaremos a série de forma permanente
tipos_de_imoveis.drop_duplicates(inplace=True)

# Exibe a série
tipos_de_imoveis

0                          Quitinete
1                               Casa
2            Conjunto Comercial/Sala
3                        Apartamento
7                 Casa de Condomínio
16                    Prédio Inteiro
17                              Flat
29                        Loja/Salão
80           Galpão/Depósito/Armazém
83                    Casa Comercial
117                     Casa de Vila
159                   Terreno Padrão
207                      Box/Garagem
347                             Loft
589      Loja Shopping/ Ct Comercial
2157                         Chácara
3354           Loteamento/Condomínio
4379                           Sítio
4721                   Pousada/Chalé
6983                          Studio
9687                           Hotel
23614                      Indústria
Name: Tipo, dtype: object

In [6]:
# Exibe os índices da série na forma de um array
# Estes índices são os índices dos imóveis da base de dados
tipos_de_imoveis.index

Int64Index([    0,     1,     2,     3,     7,    16,    17,    29,    80,
               83,   117,   159,   207,   347,   589,  2157,  3354,  4379,
             4721,  6983,  9687, 23614],
           dtype='int64')

Queremos redefinir estes índices para que eles sejam uma sequência de números inteiros:

In [7]:
# Redefine o índice da série
tipos_de_imoveis.index = range(tipos_de_imoveis.shape[0])

# Exibe a série
tipos_de_imoveis

0                       Quitinete
1                            Casa
2         Conjunto Comercial/Sala
3                     Apartamento
4              Casa de Condomínio
5                  Prédio Inteiro
6                            Flat
7                      Loja/Salão
8         Galpão/Depósito/Armazém
9                  Casa Comercial
10                   Casa de Vila
11                 Terreno Padrão
12                    Box/Garagem
13                           Loft
14    Loja Shopping/ Ct Comercial
15                        Chácara
16          Loteamento/Condomínio
17                          Sítio
18                  Pousada/Chalé
19                         Studio
20                          Hotel
21                      Indústria
Name: Tipo, dtype: object

In [8]:
# Transforma a série num dataframe
tipos_de_imoveis = tipos_de_imoveis.to_frame()
tipos_de_imoveis

Unnamed: 0,Tipo
0,Quitinete
1,Casa
2,Conjunto Comercial/Sala
3,Apartamento
4,Casa de Condomínio
5,Prédio Inteiro
6,Flat
7,Loja/Salão
8,Galpão/Depósito/Armazém
9,Casa Comercial


In [9]:
# Renomeia o índice do dataframe
tipos_de_imoveis.index.name = 'ID'

In [10]:
tipos_de_imoveis

Unnamed: 0_level_0,Tipo
ID,Unnamed: 1_level_1
0,Quitinete
1,Casa
2,Conjunto Comercial/Sala
3,Apartamento
4,Casa de Condomínio
5,Prédio Inteiro
6,Flat
7,Loja/Salão
8,Galpão/Depósito/Armazém
9,Casa Comercial
