# Web Scraping com Python (Parte 2)

## Resumo

Neste notebook, iremos explorar e coletar dados do site [Oceano de Aluguéis](https://ocean-web-scraping.herokuapp.com/) utilizando a biblioteca [Beautiful Soup](https://www.crummy.com/software/BeautifulSoup/bs4/doc/). Em seguida, iremos analisar todas as informações coletadas.

## Para saber mais:

* Palestras e cursos do [Samsung Ocean](http://www.oceanbrasil.com/).
* Ryan Mitchell. Web Scraping com Python: Coletando Mais Dados da Web Moderna. Novatec Editora, 2019.

## 1) Criando os objetos Beautiful Soup

In [None]:
from bs4 import BeautifulSoup
from urllib.request import urlopen

In [None]:
url_sobre = 'https://ocean-web-scraping.herokuapp.com/sobre.html'
url_busca = 'https://ocean-web-scraping.herokuapp.com/'
url_corretoras = 'https://ocean-web-scraping.herokuapp.com/corretoras.html'

### 1.1) Página 'Sobre'

In [None]:
response_sobre = urlopen(url_sobre)
html_sobre = response_sobre.read()
html_sobre

In [None]:
soup_sobre = BeautifulSoup(html_sobre, 'html.parser')
soup_sobre

### 1.2) Página de resultados da busca por imóveis

In [None]:
response_busca = urlopen(url_busca)
html_busca = response_busca.read()
html_busca

In [None]:
soup_busca = BeautifulSoup(html_busca, 'html.parser')
soup_busca

### 1.3) Página de contatos das corretoras

In [None]:
response_corretoras = urlopen(url_corretoras)
html_corretoras = response_corretoras.read()
html_corretoras

In [None]:
soup_corretoras = BeautifulSoup(html_corretoras, 'html.parser')
soup_corretoras

## 2) Lista de desafios da página 'Sobre'

### 2.1) Desafio 1: que tal coletar o texto 'Sobre este site' para começar?

In [None]:
soup_sobre.find('div', {'class': 'about'}).find('h2').get_text()

### 2.2) Desafio 2: agora extraia o link contido na palavra 'Ocean'.

In [None]:
soup_sobre.find('div', {'class': 'about'}).find('a').get('href')

### 2.3) Desafio 3: Em seguida, colete todos os itens desta lista.

In [None]:
soup_sobre.find('div', {'class': 'about'}).find('ol').find_all('li')

In [None]:
for item in soup_sobre.find('div', {'class': 'about'}).find('ol').find_all('li'):
    print(item.get_text())

### 2.4) Desafio 4: por fim, colete apenas este último item da lista.

In [None]:
soup_sobre.find('div', {'class': 'about'}).find('ol').find_all('li')[-1].get_text()

## 3) Coletando a lista de resultados da busca por imóveis

In [None]:
import pandas as pd

### 3.1) Coletando apenas o primeiro item da lista

In [None]:
soup_busca.find('div', {'class': 'ad-card'})

#### 3.1.1) Coletando as características

In [None]:
soup_busca.find('ul', {'class': 'features'})

In [None]:
soup_busca.find('ul', {'class': 'features'}).find_all('li')

In [None]:
for caracteristica in soup_busca.find('ul', {'class': 'features'}).find_all('li'):
    print(caracteristica.get_text())

#### 3.1.2) Coletando os recursos

In [None]:
soup_busca.find('ul', {'class': 'resources'})

In [None]:
soup_busca.find('ul', {'class': 'resources'}).find_all('li')

In [None]:
for recurso in soup_busca.find('ul', {'class': 'resources'}).find_all('li'):
    print(recurso.get_text())

#### 3.1.3) Coletando todos os valores (aluguel, condomínio e IPTU)

In [None]:
soup_busca.find('div', {'class': 'ad-card-price'})

In [None]:
soup_busca.find('div', {'class': 'ad-card-price'}).find_all('p')

In [None]:
soup_busca.find('div', {'class': 'ad-card-price'}).find_all('p')[:-1]

In [None]:
for precos in soup_busca.find('div', {'class': 'ad-card-price'}).find_all('p')[:-1]:
    print(precos.get_text())

#### 3.1.4) Coletando a corretora

In [None]:
soup_busca.find('div', {'class': 'ad-card-price'})

In [None]:
soup_busca.find('div', {'class': 'ad-card-price'}).find_all('p')

In [None]:
soup_busca.find('div', {'class': 'ad-card-price'}).find_all('p')[-1]

In [None]:
soup_busca.find('div', {'class': 'ad-card-price'}).find_all('p')[-1].get_text()

#### 3.1.5) Coletando a localização

In [None]:
soup_busca.find('div', {'class': 'ad-card-info'})

In [None]:
soup_busca.find('div', {'class': 'ad-card-info'}).find('p')

In [None]:
soup_busca.find('div', {'class': 'ad-card-info'}).find('p').get_text()

### 3.2) Coletando todos os itens da primeira página

In [None]:
soup_busca.find('div', {'class': 'ad-card-list'})

In [None]:
soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'})

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    print(resultado)
    print('-------------')

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    caracteristicas = resultado.find('ul', {'class': 'features'})
    print(caracteristicas)
    print('-------------')

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    caracteristicas = resultado.find('ul', {'class': 'features'})
    
    for caract in caracteristicas.find_all('li'):
        print(caract.get_text())
    
    print('-------------')

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    caracteristicas = resultado.find('ul', {'class': 'features'})
    recursos = resultado.find('ul', {'class': 'resources'})
    
    for caract in caracteristicas.find_all('li'):
        print(caract.get_text())
        
    for recur in recursos.find_all('li'):
        print(recur.get_text())
        
    print('-------------')

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    caracteristicas = resultado.find('ul', {'class': 'features'})
    recursos = resultado.find('ul', {'class': 'resources'})
    precos_corretora = resultado.find('div', {'class': 'ad-card-price'})
    
    for caract in caracteristicas.find_all('li'):
        print(caract.get_text())
        
    for recur in recursos.find_all('li'):
        print(recur.get_text())
        
    for prec_corr in precos_corretora.find_all('p'):
        print(prec_corr.get_text())
        
    print('-------------')

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    caracteristicas = resultado.find('ul', {'class': 'features'})
    recursos = resultado.find('ul', {'class': 'resources'})
    precos_corretora = resultado.find('div', {'class': 'ad-card-price'})
    localizacao = resultado.find('div', {'class': 'ad-card-info'}).find('p')
    
    for caract in caracteristicas.find_all('li'):
        print(caract.get_text())
        
    for recur in recursos.find_all('li'):
        print(recur.get_text())
        
    for prec_corr in precos_corretora.find_all('p'):
        print(prec_corr.get_text())
    
    print(localizacao.get_text())
        
    print('-------------')

#### 3.2.1) Persistindo os dados coletados em um DataFrame (tentativa 1)

In [None]:
resutados_lista = []

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    caracteristicas = resultado.find('ul', {'class': 'features'})
    recursos = resultado.find('ul', {'class': 'resources'})
    precos_corretora = resultado.find('div', {'class': 'ad-card-price'})
    localizacao = resultado.find('div', {'class': 'ad-card-info'}).find('p')
    
    resutado_dict = {}
    
    resutado_dict['área'] = caracteristicas.find_all('li')[0].get_text()
    resutado_dict['quartos'] = caracteristicas.find_all('li')[1].get_text()
    resutado_dict['banheiros'] = caracteristicas.find_all('li')[2].get_text()
    resutado_dict['vagas garagem'] = caracteristicas.find_all('li')[3].get_text()
    
    for recur in recursos.find_all('li'):
        resutado_dict[recur.get_text().lower()] = 'sim'
        
    resutado_dict['aluguel'] = precos_corretora.find_all('p')[0].get_text()
    resutado_dict['condomínio'] = precos_corretora.find_all('p')[1].get_text()
    resutado_dict['iptu'] = precos_corretora.find_all('p')[2].get_text()
    resutado_dict['corretora'] = precos_corretora.find_all('p')[3].get_text()
    
    resutado_dict['localizacao'] = localizacao.get_text()
    
    resutados_lista.append(resutado_dict)

In [None]:
resutados_lista

In [None]:
resultados_df = pd.DataFrame(resutados_lista)

In [None]:
resultados_df

In [None]:
resultados_df.dtypes

#### 3.2.2) Persistindo os dados coletados em um DataFrame (tentativa 2)

In [None]:
resutados_lista = []

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    caracteristicas = resultado.find('ul', {'class': 'features'})
    recursos = resultado.find('ul', {'class': 'resources'})
    precos_corretora = resultado.find('div', {'class': 'ad-card-price'})
    localizacao = resultado.find('div', {'class': 'ad-card-info'}).find('p')
    
    resutado_dict = {}
    
    resutado_dict['área'] = int(caracteristicas.find_all('li')[0].get_text().replace(' ','').replace('m²',''))
    resutado_dict['quartos'] = int(caracteristicas.find_all('li')[1].get_text().replace(' ','').replace('quarto(s)',''))
    resutado_dict['banheiros'] = int(caracteristicas.find_all('li')[2].get_text().replace(' ','').replace('banheiro(s)',''))
    resutado_dict['vagas garagem'] = int(caracteristicas.find_all('li')[3].get_text().replace(' ','').replace('vaga(s)',''))
    
    for recur in recursos.find_all('li'):
        resutado_dict[recur.get_text().lower()] = 'sim'
        
    resutado_dict['aluguel'] = float(precos_corretora.find_all('p')[0].get_text().replace('Aluguel: R$ ','').replace('.','').replace(',','.'))
    resutado_dict['condomínio'] = float(precos_corretora.find_all('p')[1].get_text().replace('Condomínio: ','').replace('.','').replace(',','.'))
    resutado_dict['iptu'] = float(precos_corretora.find_all('p')[2].get_text().replace('IPTU: R$ ','').replace('.','').replace(',','.'))
    
    resutado_dict['corretora'] = precos_corretora.find_all('p')[3].get_text().replace('Corretora: ','')
    
    resutado_dict['localizacao'] = localizacao.get_text().replace('Localização: ','')
    
    resutados_lista.append(resutado_dict)

In [None]:
resultados_df = pd.DataFrame(resutados_lista)
resultados_df

In [None]:
resultados_df = resultados_df.fillna(value='não')
resultados_df

In [None]:
resultados_df.dtypes

### 3.3) Coletando as imagens da primeira página

#### 3.3.1) Criando um diretório para as imagens

In [None]:
import os

In [None]:
os.makedirs('imagens')

#### 3.3.2) Obtendo as imagens

In [None]:
soup_busca.find('div', {'class': 'ad-card-list'})

In [None]:
soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'})

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    print(resultado.img)

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    print(resultado.img.get('src'))

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    print(resultado.img.get('src').replace('imagens/',''))

In [None]:
endereco = 'https://ocean-web-scraping.herokuapp.com/'

for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    print(endereco + resultado.img.get('src'))

In [None]:
from urllib.request import urlretrieve

In [None]:
for resultado in soup_busca.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
    endereco_imagem = endereco + resultado.img.get('src')
    nome_imagem = resultado.img.get('src').replace('imagens/','')
    
    urlretrieve(endereco_imagem, '/kaggle/working/imagens/' + nome_imagem)

#### 3.3.3) Compactando todas as imagens para baixar posteriormente

In [None]:
from zipfile import ZipFile

In [None]:
with ZipFile('imagens.zip', 'w') as zf:
    for pasta_principal, sub_pastas, arquivos in os.walk('/kaggle/working/imagens/'):
        for arquivo in arquivos:
            pasta = os.path.join(pasta_principal, arquivo)
            zf.write(pasta)

### 3.4) E se eu quiser coletar todos os resultados da busca por imóveis?

#### 3.4.1) Dados gerais

In [None]:
resutados_lista = []

In [None]:
for i in range(1,6):
    url_busca_todos = 'https://ocean-web-scraping.herokuapp.com/results&page=' + str(i) + '.html'
    print(url_busca_todos)
    response_busca_todos = urlopen(url_busca_todos)
    html_busca_todos = response_busca_todos.read()
    soup_busca_todos = BeautifulSoup(html_busca_todos, 'html.parser')
    
    for resultado in soup_busca_todos.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
        caracteristicas = resultado.find('ul', {'class': 'features'})
        recursos = resultado.find('ul', {'class': 'resources'})
        precos_corretora = resultado.find('div', {'class': 'ad-card-price'})
        localizacao = resultado.find('div', {'class': 'ad-card-info'}).find('p')

        resutado_dict = {}

        resutado_dict['área'] = int(caracteristicas.find_all('li')[0].get_text().replace(' ','').replace('m²',''))
        resutado_dict['quartos'] = int(caracteristicas.find_all('li')[1].get_text().replace(' ','').replace('quarto(s)',''))
        resutado_dict['banheiros'] = int(caracteristicas.find_all('li')[2].get_text().replace(' ','').replace('banheiro(s)',''))
        resutado_dict['vagas garagem'] = int(caracteristicas.find_all('li')[3].get_text().replace(' ','').replace('vaga(s)',''))

        for recur in recursos.find_all('li'):
            resutado_dict[recur.get_text().lower()] = 'sim'

        resutado_dict['aluguel'] = float(precos_corretora.find_all('p')[0].get_text().replace('Aluguel: R$ ','').replace('.','').replace(',','.'))
        resutado_dict['condomínio'] = float(precos_corretora.find_all('p')[1].get_text().replace('Condomínio: ','').replace('.','').replace(',','.'))
        resutado_dict['iptu'] = float(precos_corretora.find_all('p')[2].get_text().replace('IPTU: R$ ','').replace('.','').replace(',','.'))
        resutado_dict['corretora'] = precos_corretora.find_all('p')[3].get_text().replace('Corretora: ','')

        resutado_dict['localizacao'] = localizacao.get_text().replace('Localização: ','')

        resutados_lista.append(resutado_dict)

In [None]:
resultados_df = pd.DataFrame(resutados_lista)
resultados_df = resultados_df.fillna(value='não')
resultados_df

#### Salvando toda a base de dados

In [None]:
resultados_df.to_csv('./resultados.csv', sep = ';', index = False, encoding = 'utf-8')

#### 3.4.2) Imagens

In [None]:
for i in range(1,6):
    url_busca_todos = 'https://ocean-web-scraping.herokuapp.com/results&page=' + str(i) + '.html'
    print(url_busca_todos)
    response_busca_todos = urlopen(url_busca_todos)
    html_busca_todos = response_busca_todos.read()
    soup_busca_todos = BeautifulSoup(html_busca_todos, 'html.parser')
    
    endereco = 'https://ocean-web-scraping.herokuapp.com/'
    
    for resultado in soup_busca_todos.find('div', {'class': 'ad-card-list'}).find_all('div', {'class': 'ad-card'}):
        endereco_imagem = endereco + resultado.img.get('src')
        nome_imagem = resultado.img.get('src').replace('imagens/','')
    
        urlretrieve(endereco_imagem, '/kaggle/working/imagens/' + nome_imagem)

In [None]:
with ZipFile('imagens.zip', 'w') as zf:
    for pasta_principal, sub_pastas, arquivos in os.walk('/kaggle/working/imagens/'):
        for arquivo in arquivos:
            pasta = os.path.join(pasta_principal, arquivo)
            zf.write(pasta)

## 4) Coletando a lista de contato das corretoras

In [None]:
lista_corretoras = []
lista_nomes = []
lista_contatos = []
contatos_corretoras_dict = {}

### 4.1) Coletando dados da corretora 'Tubarão'

In [None]:
soup_corretoras.find('tbody')

In [None]:
soup_corretoras.find('tbody').find_all('tr')

In [None]:
soup_corretoras.find('tbody').find_all('tr')[0]

In [None]:
soup_corretoras.find('tbody').find_all('tr')[0].find_all('td')

In [None]:
print('Corretora: ', soup_corretoras.find('tbody').find_all('tr')[0].find_all('td')[0].get_text())
print('Contatos: ', soup_corretoras.find('tbody').find_all('tr')[0].find_all('td')[1].get_text())

In [None]:
soup_corretoras.find('tbody').find_all('tr')[0].find_all('td')[1].get_text().split(' - Fone:')

In [None]:
print('Corretora: ', soup_corretoras.find('tbody').find_all('tr')[0].find_all('td')[0].get_text())

contato = soup_corretoras.find('tbody').find_all('tr')[0].find_all('td')[1].get_text().split(' - Fone:')
print('Nome: ', contato[0])
print('Telefone: ', contato[1])

#### Salvando os dados nas listas

In [None]:
lista_corretoras.append(soup_corretoras.find('tbody').find_all('tr')[0].find_all('td')[0].get_text())
lista_nomes.append(contato[0])
lista_contatos.append(contato[1])

In [None]:
lista_corretoras, lista_nomes, lista_contatos

### 4.2) Coletando dados da corretora 'Carangueijo'

In [None]:
soup_corretoras.find('tbody').find_all('tr')[1]

In [None]:
soup_corretoras.find('tbody').find_all('tr')[1].find_all('td')

#### Problema de aplicar a mesma solução da corretora 'Tubarão'

In [None]:
soup_corretoras.find('tbody').find_all('tr')[1].find_all('td')[1].get_text().split(' - Fone:')

#### Resolvendo o problema

In [None]:
soup_corretoras.find('tbody').find_all('tr')[1].find_all('td')[1].get_text().split('; ')

In [None]:
for item in soup_corretoras.find('tbody').find_all('tr')[1].find_all('td')[1].get_text().split('; '):
    print(item.split(' - Fone:'))

In [None]:
print('Corretora: ', soup_corretoras.find('tbody').find_all('tr')[1].find_all('td')[0].get_text())

contatos = soup_corretoras.find('tbody').find_all('tr')[1].find_all('td')[1].get_text().split('; ')

for contato in contatos:
    contato = contato.split(' - Fone:')
    print('Nome: ', contato[0])
    print('Telefone: ', contato[1])

#### Salvando os dados nas listas

In [None]:
contatos = soup_corretoras.find('tbody').find_all('tr')[1].find_all('td')[1].get_text().split('; ')

for contato in contatos:
    lista_corretoras.append(soup_corretoras.find('tbody').find_all('tr')[1].find_all('td')[0].get_text())
    
    contato = contato.split(' - Fone:')
    
    lista_nomes.append(contato[0])
    lista_contatos.append(contato[1])

In [None]:
lista_corretoras, lista_nomes, lista_contatos

### 4.3) Coletando dados da corretora 'Baleia Azul'

In [None]:
soup_corretoras.find('tbody').find_all('tr')[2]

In [None]:
soup_corretoras.find('tbody').find_all('tr')[2].find_all('td')

In [None]:
soup_corretoras.find('tbody').find_all('tr')[2].find_all('td')[1].find_all('li')

In [None]:
print('Corretora: ', soup_corretoras.find('tbody').find_all('tr')[2].find_all('td')[0].get_text())

contatos = soup_corretoras.find('tbody').find_all('tr')[2].find_all('td')[1].find_all('li')

for contato in contatos:
    contato = contato.get_text().split(' - Fone:')
    print('Nome: ', contato[0])
    print('Telefone: ', contato[1])

#### Salvando os dados nas listas

In [None]:
contatos = soup_corretoras.find('tbody').find_all('tr')[2].find_all('td')[1].find_all('li')

for contato in contatos:
    lista_corretoras.append(soup_corretoras.find('tbody').find_all('tr')[2].find_all('td')[0].get_text())
    
    contato = contato.get_text().split(' - Fone:')
    
    lista_nomes.append(contato[0])
    lista_contatos.append(contato[1])

In [None]:
lista_corretoras, lista_nomes, lista_contatos

### 4.4) Coletando dados da corretora 'Enguia'

In [None]:
!pip install tabula-py

In [None]:
import tabula

In [None]:
soup_corretoras.find('tbody').find_all('tr')[3].find_all('td')

In [None]:
soup_corretoras.find('tbody').find_all('tr')[3].find_all('td')[1]

In [None]:
soup_corretoras.find('tbody').find_all('tr')[3].find_all('td')[1].find('a')

In [None]:
soup_corretoras.find('tbody').find_all('tr')[3].find_all('td')[1].find('a').get('href')

In [None]:
nome_pdf = soup_corretoras.find('tbody').find_all('tr')[3].find_all('td')[1].find('a').get('href')
arquivo = 'https://ocean-web-scraping.herokuapp.com/' + nome_pdf
arquivo

In [None]:
corretora_enguia_df = tabula.read_pdf(arquivo, pages='all', multiple_tables=False)[0]

In [None]:
corretora_enguia_df

In [None]:
print('Corretora: ', soup_corretoras.find('tbody').find_all('tr')[3].find_all('td')[0].get_text())

for nome,contato in zip(corretora_enguia_df['Corretor(a)'].to_list(),
                        corretora_enguia_df['Contato'].to_list()):
    print(nome)
    print(contato.replace('Fone:',''))

#### Salvando os dados nas listas

In [None]:
for nome,contato in zip(corretora_enguia_df['Corretor(a)'].to_list(),
                        corretora_enguia_df['Contato'].to_list()):
    lista_corretoras.append(soup_corretoras.find('tbody').find_all('tr')[3].find_all('td')[0].get_text())
    lista_nomes.append(nome)
    lista_contatos.append(contato.replace('Fone:',''))

In [None]:
lista_corretoras, lista_nomes, lista_contatos

### 4.5) Persistindo todas as informações das corretoras

In [None]:
contatos_corretoras_dict.update({'Corretoras': lista_corretoras,
                                 'Nomes': lista_nomes,
                                 'Contatos': lista_contatos})

contatos_corretoras_dict

In [None]:
contatos_corretoras_df = pd.DataFrame.from_dict(contatos_corretoras_dict)

contatos_corretoras_df

In [None]:
contatos_corretoras_df.to_csv('./contatos_corretoras.csv', sep = ';', index = False, encoding = 'utf-8')

## 5) Análise dos dados coletados

In [None]:
resultados_df

#### 5.1) Eu gostaria de pagar um aluguel de no máximo R$ 1.800,00 e morar em um apto de pelo menos 2 quartos e com 1 vaga na garagem, no Oceano Atlântico

In [None]:
busca = resultados_df['aluguel'] <= 1800
busca

In [None]:
len(resultados_df.loc[busca])

In [None]:
resultados_df.loc[busca]

In [None]:
busca = ((resultados_df['aluguel'] <= 1800) & (resultados_df['quartos'] >= 2))

In [None]:
len(resultados_df.loc[busca])

In [None]:
resultados_df.loc[busca]

In [None]:
busca = ((resultados_df['aluguel'] <= 1800) & 
         (resultados_df['quartos'] >= 2) & 
         (resultados_df['vagas garagem'] >= 1))

In [None]:
len(resultados_df.loc[busca])

In [None]:
resultados_df.loc[busca]

In [None]:
busca = ((resultados_df['aluguel'] <= 1800) & 
         (resultados_df['quartos'] >= 2) & 
         (resultados_df['vagas garagem'] >= 1) &
         (resultados_df['localizacao'] == 'Oceano Atlântico'))

In [None]:
len(resultados_df.loc[busca])

In [None]:
resultados_df.loc[busca]

#### Entrando em contato com as corretoras

In [None]:
contatos_corretoras_df

In [None]:
busca_corretora = contatos_corretoras_df['Corretoras'] == 'Carangueijo'

In [None]:
contatos_corretoras_df.loc[busca_corretora]

## 6) Exemplos de outras análises

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns

In [None]:
sns.set(font_scale=1.4)
sns.set_style({'font.family': 'serif',
               'fontname': 'Times New Roman'})

### Quem tem mais/menos imóveis?

In [None]:
resultados_df['localizacao'].value_counts()

In [None]:
resultados_df['localizacao'].value_counts().sort_values().plot(kind = 'barh', 
                                                               figsize=(8, 5))

> ### Quais são os locais com imóveis maiores/menores e com os imóveis mais baratos/caros?

In [None]:
fig_dims = (8, 6)
fig, ax = plt.subplots(figsize=fig_dims)

sns.scatterplot(data = resultados_df, 
                x = 'área', 
                y = 'aluguel', 
                hue = 'localizacao',
                s = 200,
                ax = ax)