In [1]:
# !pip install unidecode

In [2]:
# !conda install --yes -c conda-forge unidecode

In [3]:
import re, os, sys, requests, time, random
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import bs4
from bs4 import BeautifulSoup
from unidecode import unidecode
from random import randint

In [4]:
print(f'O notebook est√° na pasta: {os.getcwd()}')

O notebook est√° na pasta: C:\Users\viniz\OneDrive\√Årea de Trabalho\Vin√≠cius\Insper\Mat√©rias\Eletivas\An√°lise de Texto e Fontes Desestruturadas e Web\Projeto\projeto-fontes-desestruturadas-e-web


In [5]:
# ===== APENAS PARA A PRIMEIRA P√ÅGINA DE CADA CAPITAL POR ENQUANTO =====
'''
ANOTA√á√ïES

- Fazer com que o c√≥digo pesquise no Google o endere√ßo de cada local e
retorne separadamente bairro, n√∫mero, tipo de logradouro e
nome do logradouro;
OU
- Fazer com que o c√≥digo pesquise no Google o endere√ßo de cada local e
retorne a latitude e longitude, plotando num mapa ao decorrer do projeto;

- Fazer o Web Crawling de todas as p√°ginas dispon√≠veis para cada cidade
(√© esperado que demore, pois cidades como S√£o Paulo possuem milh√µes de
im√≥veis listados, talvez seja necess√°rio considerar um limite m√°ximo
como 10 mil im√≥veis por cidade);

- N√£o fazer a pesquisa com base nas ordena√ß√µes dispon√≠veis;

- Fazer com que o c√≥digo acesse im√≥vel por im√≥vel e retone informa√ß√µes
booleanas adicionais do im√≥vel, por exemplo, se possui elevador (quantidade?),
se possui piscina (quantidade?), se possui academia, se possui espa√ßos
para festas gerais;
''';

In [6]:
class Projeto:
    def __init__(self):
        self.posicoes = []
        self.enderecos = []
        self.areas = []
        self.quartos = []
        self.banheiros = []
        self.vagas = []
        self.precos = []
        self.conds = []
        self.iptus = []
        self.descricoes = []
        self.lista_status = []
        self.paginas = []

    def get_urls(self) -> list:
        urls = []
        uf_capital = {}
        
        url_capitais = 'https://www.todamateria.com.br/capitais-do-brasil/'
        resposta = requests.get(url_capitais)
        resposta.encoding = 'utf-8'
        
        soup = BeautifulSoup(resposta.text, 'html.parser')
        
        tabela = soup.find('tbody')
        linhas = tabela.find_all('tr')
        for linha in linhas:
            uf = linha.find_all('td')[2].text
            uf = uf.lower()
            capital = linha.find_all('td')[0].text
            capital = capital.lower()
            capital = capital.split()
            capital = '-'.join(capital)
            capital = unidecode(capital)
            uf_capital[uf] = capital
        
        for uf, capital in uf_capital.items():
            url = 'https://www.zapimoveis.com.br'
            uri = '/venda/imoveis/'
            uri += f'{uf}+{capital}'
            url += uri
            urls.append(url)
        
        return urls
        
    def endereco(self, produto):
        try:
            endereco = produto.find('h2', attrs={'itemprop': 'address'}).text
            endereco = endereco.strip('\n ')
            self.enderecos.append(endereco)

        except:
            self.enderecos.append(None)

    def area(self, produto):
        try:
            area = produto.find('li', class_='feature__item text-small js-areas').text
            area = area.strip('\n ')
            area = area.replace('m¬≤', '')
            self.areas.append(area)
        except:
            self.areas.append(None)
        
    def qtd_quartos(self, produto):
        try:
            quarto = produto.find('span', attrs={'itemprop': 'numberOfRooms'}).text
            quarto = quarto.strip('\n ') # Pode ser algo do tipo: '1 - 3'
            self.quartos.append(quarto)
        except:
            self.quartos.append(None)
        
    def qtd_banheiros(self, produto):
        try:
            banheiro = produto.find('span', attrs={'itemprop': 'numberOfBathroomsTotal'}).text
            banheiro = banheiro.strip('\n ') # Pode ser algo do tipo: '1 - 3'
            self.banheiros.append(banheiro)
        except:
            self.banheiros.append(None)
        
    def qtd_vagas(self, produto):
        try:
            vaga = produto.find('li', class_='feature__item text-small js-parking-spaces').text
            vaga = vaga.strip('\n ') # Pode ser algo do tipo: '1 - 3'
            self.vagas.append(vaga)
        except:
            self.vagas.append(None)
        
    def condominio(self, produto):
        try:
            cond = produto.find('li', class_='card-price__item condominium text-regular').text
            self.conds.append(''.join(re.findall(r'\d+', cond)))
        except:
            self.conds.append(None)
        
    def iptu(self, produto):
        try:
            iptu = produto.find('li', class_='card-price__item iptu text-regular').text
            self.iptus.append(''.join(re.findall(r'\d+', iptu)))
        except:
            self.iptus.append(None)
        
    def descricao(self, produto):
        try:
            descricao = produto.find('span', attrs={'itemprop': 'description'}).text
            self.descricoes.append(descricao)
        except:
            self.descricoes.append(None)
        
    def status(self, produto):
        try:
            status = produto.find('small').text
            self.lista_status.append(status)
        except:
            self.lista_status.append('Comum')
        
    def preco(self, produto):
        preco = produto.find('p', class_='simple-card__price js-price color-darker heading-regular heading-regular__bolder align-left').text
        self.precos.append(''.join(re.findall(r'\d+', preco)))
        
    def everything(self, produto):
        self.endereco(produto)
        self.area(produto)
        self.qtd_quartos(produto)
        self.qtd_banheiros(produto)
        self.qtd_vagas(produto)
        self.condominio(produto)
        self.iptu(produto)
        self.descricao(produto)
        self.status(produto)
        self.preco(produto)
        
    def main(self):
        urls = self.get_urls()
        for url in urls:
            posicao = 1
            pagina = 1
            
            n1, n2, n3 = randint(0, 36), randint(0, 142), randint(0, 35)
            headers = {'user-agent':
                       f'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.{n1} (KHTML, like Gecko) Chrome/75.0.3770.{n2} Safari/537.{n3}'
            }
            
            resposta = requests.get(url, headers=headers)
            resposta.encoding = 'utf-8'

            soup = BeautifulSoup(resposta.text, 'html.parser')

            lista_prod = soup.find('div', class_='listings__container')
            produtos = lista_prod.find_all('div', class_='card-container js-listing-card')
            
            for produto in produtos:
                self.posicoes.append(posicao)
                posicao += 1
                
                self.everything(produto)
                
                self.paginas.append(pagina)
                
            pagina += 1
        
        dicionario = {'Posi√ß√£o': self.posicoes,
                      'Endere√ßo': self.enderecos,
                      '√Årea': self.areas,
                      'Quartos': self.quartos,
                      'Banheiros': self.banheiros,
                      'Vagas': self.vagas,
                      'Condom√≠nio': self.conds,
                      'IPTU': self.iptus,
                      'Descri√ß√£o': self.descricoes,
                      'Status': self.lista_status,
                      'P√°gina': self.paginas,
                      'Pre√ßo': self.precos}
        
        df = pd.DataFrame(dicionario)
        
        return df

In [7]:
projeto = Projeto()
df = projeto.main()
df.head()

Unnamed: 0,Posi√ß√£o,Endere√ßo,√Årea,Quartos,Banheiros,Vagas,Condom√≠nio,IPTU,Descri√ß√£o,Status,P√°gina,Pre√ßo
0,1,"Avenida Recanto Verde, Residencial Petropolis",114,3,2.0,2,,,O sobrado no bairro Primavera possui 114 metro...,Destaque,1,495000
1,2,"Rua C, LBA Vila Betel ll",336,2,2.0,1,,,?Casa na Vila Betel ! Vende-se uma casa no co...,Destaque,1,185000
2,3,"Rua Belo Horizonte, Ivete Vargas",170,4,2.0,1,,,Vende-se uma casa no Ivete Vargas. A casa poss...,Destaque,1,245000
3,4,"Avenida Get√∫lio Vargas, Centro",250,3,,2,,,,Destaque,1,500000
4,5,"Estrada da Floresta, Floresta Sul",62,3,2.0,1,280.0,,O apartamento no bairro Floresta Sul tem 62 me...,Destaque,1,225000


In [8]:
cwd = str(os.getcwd())
_, _, files = next(os.walk(cwd))
file_count = len(files)
print(file_count)

df.to_csv(f'data{file_count - 1}.csv')

10


In [9]:
# Tipos de status
df['Status'].value_counts().index

Index(['Destaque', 'Comum', 'Super destaque', 'Em constru√ß√£o', 'Na planta',
       'Pronto para morar'],
      dtype='object')

In [10]:
# Quantidade bruta de im√≥veis por tipo de status
df['Status'].value_counts()

Destaque             259
Comum                245
Super destaque        75
Em constru√ß√£o         32
Na planta             20
Pronto para morar     17
Name: Status, dtype: int64

In [11]:
# Quantidade relativa de im√≥veis por tipo de status
df['Status'].value_counts(True).round(4)*100

Destaque             39.97
Comum                37.81
Super destaque       11.57
Em constru√ß√£o         4.94
Na planta             3.09
Pronto para morar     2.62
Name: Status, dtype: float64

In [12]:
super_mask = df['Status'] == 'Super destaque'
super_df = df.loc[super_mask, :]
super_df

Unnamed: 0,Posi√ß√£o,Endere√ßo,√Årea,Quartos,Banheiros,Vagas,Condom√≠nio,IPTU,Descri√ß√£o,Status,P√°gina,Pre√ßo
27,4,"Rua Antenor Marinho de Melo, Gruta de Lourdes",740,,,,,,Gin√°sio de esporte com 740 Mt de √°rea constru√≠da,Super destaque,1,1000000
28,5,"Avenida Doutor Ant√¥nio Gouveia, Paju√ßara",380,4,6,4,1300,5500,"Cobertura Garden, na Paju√ßara, beira mar, com ...",Super destaque,1,3500000
29,6,"Rua Ailton Torres, Serraria",68,3,2,1,350,499,De 270mil por 220mil Na MANGABEIRAS 3quarto...,Super destaque,1,220000
48,1,"Alameda das Estrelas, Muruci Fazendinha",332,,,,350,,"Lotes medindo mais de 332,00m¬≤ em excelente l...",Super destaque,1,250000
75,4,"Avenida Coronel Teixeira, Ponta Negra",49,2,2,1,,,O Estilo Ponta Negra tem uma infraestrutura gr...,Super destaque,1,260000
...,...,...,...,...,...,...,...,...,...,...,...,...
604,5,"Avenida Dulce Diniz, Luzia",80,3,2,1,410,1100,Virtuosi Residence / Reformado / Moveis Planej...,Super destaque,1,415000
605,6,"Rua Matilde Silva Lima, Luzia",68,3,1,1,302,,"Apartamento t√©rreo amplo com sala, hall, tr√™s ...",Super destaque,1,155000
627,4,"Plano Diretor Sul, Palmas",368,,,,,,Pr√©dio Comercial a venda Localiza√ß√£o mais que...,Super destaque,1,3300000
628,5,"Plano Diretor Sul, Palmas",586,4,5,5,,,A melhor e maior Cobertura Duplex de Palmas - ...,Super destaque,1,4970001


In [13]:
destaque_mask = df['Status'] == 'Destaque'
destaque_df = df.loc[destaque_mask, :]
destaque_df

Unnamed: 0,Posi√ß√£o,Endere√ßo,√Årea,Quartos,Banheiros,Vagas,Condom√≠nio,IPTU,Descri√ß√£o,Status,P√°gina,Pre√ßo
0,1,"Avenida Recanto Verde, Residencial Petropolis",114,3,2,2,,,O sobrado no bairro Primavera possui 114 metro...,Destaque,1,495000
1,2,"Rua C, LBA Vila Betel ll",336,2,2,1,,,?Casa na Vila Betel ! Vende-se uma casa no co...,Destaque,1,185000
2,3,"Rua Belo Horizonte, Ivete Vargas",170,4,2,1,,,Vende-se uma casa no Ivete Vargas. A casa poss...,Destaque,1,245000
3,4,"Avenida Get√∫lio Vargas, Centro",250,3,,2,,,,Destaque,1,500000
4,5,"Estrada da Floresta, Floresta Sul",62,3,2,1,280,,O apartamento no bairro Floresta Sul tem 62 me...,Destaque,1,225000
...,...,...,...,...,...,...,...,...,...,...,...,...
643,20,"Rua 17, Taquarussu",300,4,4,6,,,"üß° Linda ch√°cara , √†s margens da PALMAS -TO a T...",Destaque,1,2200000
644,21,"Plano Diretor Norte, Palmas",68,3,2,2,,,Vende-se apartamento de 3/4 Sendo 68 m¬≤ muito...,Destaque,1,245000
645,22,"Plano Diretor Sul, Palmas",140,3,3,3,,,Casa nova na quadra 309 Sul com 140m2 de √°rea ...,Destaque,1,600000
646,23,"ARSO 42 Avenida LO 9, Plano Diretor Sul",73,3,2,2,,,Vendo agio referente o valor j√° pago da entrad...,Destaque,1,110000


In [14]:
comum_mask = df['Status'] == 'Comum'
comum_df = df.loc[comum_mask, :]
comum_df

Unnamed: 0,Posi√ß√£o,Endere√ßo,√Årea,Quartos,Banheiros,Vagas,Condom√≠nio,IPTU,Descri√ß√£o,Status,P√°gina,Pre√ßo
5,6,"Rua Acre, Vila da Amizade",50,2,1,1,,,"Aluga-se apartamento no Residencial Villacre, ...",Comum,1,150000
9,10,"Estrada do Calafate, Calafate",50,2,1,1,,,Vendo esse im√≥vel em condom√≠nio fechado. Apart...,Comum,1,89000
11,12,"Avenida Cear√°, Dom Giocondo",110,3,3,2,,,A casa est√° localizado no bairro Dom Giocondo ...,Comum,1,400000
14,15,"Rua S√£o Mateus, Nova Esperanca",80,3,2,2,,,O apartamento est√° localizado no bairro Nova E...,Comum,1,480000
18,19,"Rua Ant√¥nio Carlos, Sao Francisco",191,3,2,3,,,A casa no bairro S√£o Francisco tem 191 metros ...,Comum,1,335000
...,...,...,...,...,...,...,...,...,...,...,...,...
632,9,"Plano Diretor Sul, Palmas",103,3,3,2,,,1003 Sul; Lote: 180 m¬≤ √Årea constru√≠da: 103 m...,Comum,1,385000
635,12,"Plano Diretor Norte, Palmas",87,3,2,2,,,Vendo √Ågio de apartamento novo Pronto para Mor...,Comum,1,80000
636,13,"Plano Diretor Sul, Palmas",113,3,4,2,,,√Årea Privativa: 113m¬≤ 3 Su√≠tes plenas Sala am...,Comum,1,670000
640,17,"Jardim Aureny III, Palmas",120,3,2,2,,,Vendo casa de esquina localizada no Aureny III...,Comum,1,190000


In [15]:
construcao_mask = df['Status'] == 'Em constru√ß√£o'
construcao_df = df.loc[construcao_mask, :]
construcao_df

Unnamed: 0,Posi√ß√£o,Endere√ßo,√Årea,Quartos,Banheiros,Vagas,Condom√≠nio,IPTU,Descri√ß√£o,Status,P√°gina,Pre√ßo
26,3,"Rua Valdo Omena, Ponta Verde",37 - 79,1 - 2,1,1 - 2,,,Venha conhecer o Smart Stay.,Em constru√ß√£o,1,
98,3,"Rua Parambu, Santa Teresa",58,2,2,1,,,Residencial Santorini ‚Äì BRF Realiza√ß√µes Jardi...,Em constru√ß√£o,1,395000.0
121,2,"Rua Gon√ßalves Ledo, Centro",100,3,4,3,,,Venha morar onde o melhor da vida acontece! R...,Em constru√ß√£o,1,759000.0
122,3,"Rua Gon√ßalves Ledo, Centro",100,3,4,2,,,LAZER COMPLETO Piscina adulto e infantil com d...,Em constru√ß√£o,1,
144,1,"SQNW 302 Bloco C, Setor Noroeste",148,4,6,3,,,"Apartamento 4 quartos, sendo 4 suites √† venda ...",Em constru√ß√£o,1,2282226.0
145,2,"EQS 414/415, Asa Sul",67 - 188,2 - 3,,,,,O Reserva Parque Clube √© assim: a combina√ß√£o p...,Em constru√ß√£o,1,
192,1,"Rua 22, Setor Oeste",219,4,6,4,,,Adagio - Op√ß√£o de 3 su√≠tes com possibilidade d...,Em constru√ß√£o,1,1684727.0
193,2,"Rua 22, Setor Oeste",148,3 - 4,5,3,,,Moderato - Sala com mega esquadria e balc√£o qu...,Em constru√ß√£o,1,1088094.0
194,3,"Rua 22, Setor Oeste",135,2 - 3,5,2,,,Vivace - Layout da sala com possibilidade de a...,Em constru√ß√£o,1,
240,1,"Avenida Ipiranga, Porto",35 - 44,1 - 2,1,1,,,"Apartamentos de 2 quartos no Porto, em condom√≠...",Em constru√ß√£o,1,217990.0


In [16]:
planta_mask = df['Status'] == 'Na planta'
planta_df = df.loc[planta_mask, :]
planta_df

Unnamed: 0,Posi√ß√£o,Endere√ßo,√Årea,Quartos,Banheiros,Vagas,Condom√≠nio,IPTU,Descri√ß√£o,Status,P√°gina,Pre√ßo
24,1,"Avenida Comendador Gustavo Paiva, Mangabeiras",39 - 71,,2,,,,THE ICON PARK OFFICE Um EMPRESARIAL ao lado d...,Na planta,1,297394.0
73,2,"Rua Fulvio Pennanchi, Planalto",38 - 43,1 - 2,1,1,,,"Lazer equipado, Previs√£o para medi√ß√£o de √°gua ...",Na planta,1,176490.0
97,2,"Rua Doutor Gen√©sio Salles, Vila Laura",61 - 89,2 - 3,2 - 3,1 - 2,,,O melhor da Vila Laura para voc√™. Escolha mais...,Na planta,1,387480.0
120,1,"Rua Nogueira Acioli, Joaquim Tavora",51 - 65,2 - 3,2 - 3,1 - 2,,,"Modernidade, conforto e acessibilidade. Elemen...",Na planta,1,
168,1,"Rua das Marrecas, Centro",32 - 66,1,1,,,,Hub Coliving. Studios com √°rea de conviv√™ncia ...,Na planta,1,
170,3,"Rua Irineu Marinho, Centro",35,1 - 2,1,,,,Cores do Rio Centro da Cidade RJ: √â o primeiro...,Na planta,1,272000.0
216,1,"Avenida Dom Jos√© Delgado, Alemanha",39 - 42,2,1,1,,,"Apartamentos de 2 quartos no Alemanha, em cond...",Na planta,1,163990.0
218,3,"Avenida dos Holandeses, Ponta D'areia",81 - 90,3,1,2,,,Imagine alcan√ßar outro n√≠vel na sua qualidade ...,Na planta,1,889300.0
338,3,"Avenida Pombal, Mana√≠ra",41,1 - 3,1 - 2,1 - 2,,,"Localizado em Mana√≠ra, a 300 metros do mar, o ...",Na planta,1,263000.0
361,2,"Avenida Visconde de Guarapuava, Centro",32 - 72,1 - 2,1 - 2,1 - 3,,,"Conhe√ßa o Mont Tannat, o novo empreendimento d...",Na planta,1,258013.0


In [17]:
pronto_mask = df['Status'] == 'Pronto para morar'
pronto_df = df.loc[pronto_mask, :]
pronto_df

Unnamed: 0,Posi√ß√£o,Endere√ßo,√Årea,Quartos,Banheiros,Vagas,Condom√≠nio,IPTU,Descri√ß√£o,Status,P√°gina,Pre√ßo
25,2,"Rua Doutora Rosa Cab√∫s, Jati√∫ca",40 - 59,1 - 2,1 - 2,1,,,"Viva o presente, invista no futuro! Viver √© g...",Pronto para morar,1,
72,1,"Avenida Coronel Teixeira, Ponta Negra",66 - 88,2 - 3,2 - 3,1,,,Pronto para morar ao lado do Shopping Ponta Ne...,Pronto para morar,1,340000.0
74,3,"Avenida Coronel Teixeira, Ponta Negra",36 - 49,1 - 2,1,1,,,A regi√£o da Ponta Negra √© um dos pontos mais n...,Pronto para morar,1,
96,1,"3¬™ Travessa Paripiranga, Bairro da Paz",53 - 71,2 - 3,2,1,,,Pronto para morar pertinho da praia!Pronto par...,Pronto para morar,1,
146,3,"CLSW 105 Bloco A, Setor Sudoeste",97,,3,,,,"Lojas comerciais √† venda em Sudoeste, Bras√≠lia...",Pronto para morar,1,1965592.0
169,2,"Rua Ubaldino do Amaral, Centro",38 - 69,1 - 2,1 - 2,1,,,"A vida pr√°tica e moderna, como nas cidades mai...",Pronto para morar,1,349900.0
217,2,"Avenida da Hist√≥ria, Cohafuma",28 - 38,1,1,1,,,residencial cohafuma: do tamanho certo para vo...,Pronto para morar,1,145000.0
290,3,"Avenida √Ålvares Cabral, Lourdes",78 - 83,3,3,2 - 3,,,"Lumi√®re Residence Service, o reflexo dos seus ...",Pronto para morar,1,1149572.0
313,2,"Rua Timbiras, Jurunas",82,3,2,1,,,Venha conhecer os diferenciais incr√≠veis desse...,Pronto para morar,1,
362,3,"Avenida Marechal Floriano Peixoto, Centro",80,,,,,,Na esquina da Rua Marechal Floriano com Av. Se...,Pronto para morar,1,526316.0


In [18]:
# Acessar os dados salvos e criar um novo DataFrame sem os duplicados
def get_data_files() -> list:
    data_files = []
    cwd = str(os.getcwd())
    _, _, files = next(os.walk(cwd))
    for file in files:
        if 'data' in file:
            data_files.append(file)
    return data_files

def standard_dict() -> dict:
    return {'Posi√ß√£o': [],
            'Endere√ßo': [],
            '√Årea': [],
            'Quartos': [],
            'Banheiros': [],
            'Vagas': [],
            'Condom√≠nio': [],
            'IPTU': [],
            'Descri√ß√£o': [],
            'Status': [],
            'P√°gina': [],
            'Pre√ßo': []}

def generate_data() -> pd.DataFrame:
    dicio_vazio = standard_dict()
    memo_df = pd.DataFrame(dicio_vazio)
    data_files = get_data_files()
    
    for data in data_files:
        d = pd.read_csv(data)
        memo_df = pd.concat([memo_df, d])
        
    memo_df = memo_df.iloc[:, :-1]
    memo_df = memo_df.reset_index()
    memo_df = memo_df.drop('index', axis=1)
    memo_df = memo_df.drop_duplicates()
    return memo_df

In [19]:
memo_df = generate_data()
memo_df

Unnamed: 0,Posi√ß√£o,Endere√ßo,√Årea,Quartos,Banheiros,Vagas,Condom√≠nio,IPTU,Descri√ß√£o,Status,P√°gina,Pre√ßo
0,1.0,"Rodovia BR-364, Portal da Amazonia",420,1,1,,,,"ECOVILLE- Lindo lote a venda, plano, sol da ma...",Super destaque,1.0,389000.0
1,2.0,"Rodovia BR-364, Portal da Amazonia",429,,,,,,O lote/terreno est√° localizado no bairro Porta...,Super destaque,1.0,360000.0
2,3.0,"Rua Severina Maria de Sousa e Silva, Jardim Ma...",99,3,2,2,690.0,,O apartamento est√° localizado no bairro Jardim...,Super destaque,1.0,570000.0
3,4.0,"Estrada do Calafate, Calafate",50,2,1,1,,,Vendo esse im√≥vel em condom√≠nio fechado. Apart...,Comum,1.0,89000.0
4,5.0,"Rua C, LBA Vila Betel ll",336,2,2,1,,,?Casa na Vila Betel ! Vende-se uma casa no co...,Comum,1.0,185000.0
...,...,...,...,...,...,...,...,...,...,...,...,...
5707,20.0,"Rua Chocalho, Castanheira",250,4,3,2,,,VENDE-SE CASA NO BAIRRO CASTANHEIRAS Casa pos...,Destaque,1.0,160000.0
5708,21.0,"Rua Soledade, Marcos Freire",90,2,1,,,,Grande oportunidade para investidor Vila de c...,Comum,1.0,135000.0
5709,22.0,"Rua Get√∫lio Vargas, S√£o Jo√£o Bosco",250,4,4,4,,,Vendo esta excelente residencia na cidade de P...,Destaque,1.0,450000.0
5710,23.0,"Rua Jamary, Pedrinhas",120,3,4,2,,,A casa est√° localizado no bairro Pedrinhas tem...,Comum,1.0,550000.0


In [20]:
# Teste
for i in memo_df.duplicated():
    if i:
        print("Achou duplicado")