In [1]:
import pandas as pd
import numpy as np
import re
import inflection

## Load data

In [2]:
houses = pd.read_csv('/home/edilson07/projects/rp_housing/datasets/casas_links_complete.csv')
aps = pd.read_csv('/home/edilson07/projects/rp_housing/datasets/aps_links_complete.csv')

houses['tipo'] = 'casa'
aps['tipo'] = 'apartamento'


df_imob = pd.concat([houses, aps])

In [3]:
df_imob.shape

(50228, 10)

## Extract Comodos

In [4]:
df_imob["Quartos"] = df_imob["Comodos"].str.extract(r"(\d+Quartos|\d+|5 ou mais)Quartos?")
df_imob["Banheiros"] = df_imob["Comodos"].str.extract(r"(\d+Banheiros|\d+|5 ou mais)Banheiros?")
df_imob["Vagas de Garagem"] = df_imob["Comodos"].str.extract(r"(\d+)Vagas?")
df_imob["Área"] = df_imob["Comodos"].str.extract(r"(\d+)m²")

## Extract Custos

In [5]:
# Usando o método str.extract com expressões regulares para extrair o valor do Condomínio e IPTU
#df_imob[['Condominio', 'IPTU']] = df_imob['Custos'].str.extract(r'CondomínioR\$ ([\d,]+)IPTUR\$ ([\d,]+)')
df_imob[['Condominio', 'IPTU']] = df_imob['Custos'].str.extract(r'CondomínioR\$\s*([\d.]*)\s*IPTUR\$\s*([\d.]*)')
# Remover possíveis vírgulas nos valores
#df_imob['Condominio'] = df_imob['Condominio'].str.replace(',', '', regex=True)
#df_imob['IPTU'] = df_imob['IPTU'].str.replace(',', '', regex=True)

# Converter as colunas para tipo numérico (int), especificando 'downcast'
#df_imob['Condominio'] = pd.to_numeric(df_imob['Condominio'], errors='coerce', downcast='integer')
#df_imob['IPTU'] = pd.to_numeric(df_imob['IPTU'], errors='coerce', downcast='integer')

## Extract Localização

In [6]:
# Remova as aspas no início e os colchetes '[' no início e no final da string
df_imob['Localizacao'] = df_imob['Localizacao'].str.strip("[]").str.strip("'")

# Usando o método str.extract com expressões regulares para extrair o endereço e o CEP
df_imob[['Endereco', 'CEP']] = df_imob['Localizacao'].str.extract(r'(.*)(?:CEP: (\d+))')

In [7]:
pd.set_option('display.max_colwidth', 1000)
pd.set_option('display.max_columns',40)

## Extract Caracteristicas

In [8]:
# Lista de características
caracteristicas = [
    'Academia',
    'Aquecimento',
    'Ar condicionado',
    'Área de serviço',
    'Armários na cozinha',
    'Armários no quarto',
    'Banheiro no quarto',
    'Churrasqueira',
    'Internet',
    'Mobiliado',
    'Piscina',
    'Porteiro 24h',
    'Quarto de serviço',
    'Salão de festas',
    'Tv a cabo',
    'Varanda',
    'Área murada',
    'Condomínio fechado',
    'Elevador',
    'Permitido animais',
    'Piscina',
    'Portão eletrônico',
    'Portaria',
    'Salão de festas',
    'Segurança 24h'
]

# Função para verificar se a característica está presente
def verificar_caracteristica(caracteristicas_imovel, caracteristica):
    if caracteristica in caracteristicas_imovel:
        return True
    else:
        return False

# Criar colunas para cada característica
for caracteristica in caracteristicas:
    df_imob[caracteristica] = df_imob['Caracteristicas do Imovel'].apply(verificar_caracteristica, caracteristica=caracteristica)

# Remover a coluna original 'Caracteristicas do Imovel'
#df_imob = df_imob.drop('Caracteristicas do Imovel', axis=1)

In [9]:
df_imob.isna().sum()

Comodos                         0
Caracteristicas do Imovel       0
Localizacao                     0
Custos                          0
Preco                           0
Titulo                          0
Data de Publicacao              0
Descricao                       0
Link                            0
tipo                            0
Quartos                       904
Banheiros                     903
Vagas de Garagem             5526
Área                          913
Condominio                   1152
IPTU                         1152
Endereco                        0
CEP                             0
Academia                        0
Aquecimento                     0
Ar condicionado                 0
Área de serviço                 0
Armários na cozinha             0
Armários no quarto              0
Banheiro no quarto              0
Churrasqueira                   0
Internet                        0
Mobiliado                       0
Piscina                         0
Porteiro 24h  

In [10]:
df_imob = df_imob.dropna()

In [11]:
len(df_imob.loc[df_imob['IPTU'] == '0',:])

24280

In [12]:
df_imob.shape

(43849, 41)

In [13]:
df_imob.sample(15)

Unnamed: 0,Comodos,Caracteristicas do Imovel,Localizacao,Custos,Preco,Titulo,Data de Publicacao,Descricao,Link,tipo,Quartos,Banheiros,Vagas de Garagem,Área,Condominio,IPTU,Endereco,CEP,Academia,Aquecimento,...,Área de serviço,Armários na cozinha,Armários no quarto,Banheiro no quarto,Churrasqueira,Internet,Mobiliado,Piscina,Porteiro 24h,Quarto de serviço,Salão de festas,Tv a cabo,Varanda,Área murada,Condomínio fechado,Elevador,Permitido animais,Portão eletrônico,Portaria,Segurança 24h
3033,['2Quartos60m²Área útil1Vaga1Banheiro'],"['Churrasqueira', 'Salão de festas']","Rua Jamil Kfouri - de 1101/1102 ao fim Residencial Macedo Teles I - São José do Rio Preto, SPCEP: 15040531",['CondomínioR$ 245IPTUR$ 0'],R$ 148.000,"Apartamento com 2 dorms, Residencial Macedo Teles I, São José do Rio Preto - R$ 148.000,00",Publicado em 08/08 às 05:21,"Código do anúncio: 3340\n\nCÓDIGO 3340\n\nGostou do imóvel?\n\nPara facilitar a sua compra, contamos com financiamentos nos seguintes bancos: Santander, Caixa Econômica Federal, Bradesco, Itaú e Banco do Brasil.\n\nPara mais informações, acesse nosso site ou entre em contato conosco...\n\nwww.hallimoveis.com.br\n\nFixo \n\nWhatsApp HALL Imóveis (17)... ver número\n\nO Maior Portal Imobiliário do Noroeste Paulista!",https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/apartamento-com-2-dorms-residencial-macedo-teles-i-sao-jose-do-rio-preto-r-148-000-00-1219718015,apartamento,2,1,1,60,245,0,"Rua Jamil Kfouri - de 1101/1102 ao fim Residencial Macedo Teles I - São José do Rio Preto, SP",15040531,False,False,...,False,False,False,False,True,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False
27297,['3Quartos113m²Área útil4Vagas1Banheiro'],['Área de serviçoVaranda'],"Rua São Paulo - de 1500/1501 ao fim Vila Maceno - São José do Rio Preto, SPCEP: 15060035",['CondomínioR$ 0IPTUR$ 193'],R$ 500.000,Casa Padrão em São José do Rio Preto,Publicado em 02/08 às 00:21,"Código do anúncio: V186\n\nVila Maceno - Casa de 03 dormitórios, sala, cozinha com gabinete, varanda com área de serviço, 01 w.c, quintal, 04 vagas de. ref. 186 atualizado em 10/10.",https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-padrao-em-sao-jose-do-rio-preto-1217430765,casa,3,1,4,113,0,193,"Rua São Paulo - de 1500/1501 ao fim Vila Maceno - São José do Rio Preto, SP",15060035,False,False,...,True,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False
11395,['1Quarto43m²Área útil1Vaga1Banheiro'],"['AcademiaAr condicionadoChurrasqueiraMobiliado', 'AcademiaSalão de festas']","Avenida José Munia - até 5801 - lado ímpar Jardim Redentor - São José do Rio Preto, SPCEP: 15085350",['CondomínioR$ 350IPTUR$ 35'],R$ 450.000,Viva com Estilo e Conforto no Condomínio Unique Residence - Apartamento Mobiliado à Venda.,Publicado em 04/09 às 23:23,"Código do anúncio: P9000\n\nEste aconchegante apartamento de 43m², localizado no Condomínio Unique Residence, está pronto para recebê-lo em grande estilo. Totalmente mobiliado, oferece uma experiência de vida de conforto e conveniente.\n\nAo entrar, você será recebido por uma espaçosa sala de estar, dividida em dois ambientes, com uma atmosfera acolhedora. O ar-condicionado mantém a temperatura ideal durante todo o ano. Um elegante painel de TV, uma televisão de alta qualidade e um sofá convidativo tornam este espaço perfeito para relaxar e entreter.\n\nA cozinha é uma verdadeira joia, equipada com armários planejados que oferecem amplo espaço de armazenamento. Você encontrará uma geladeira, um micro-ondas e um fogão de quatro bocas, permitindo que você prepare suas refeições com facilidade e elegância. O quarto principal é um retiro de tranquilidade, com uma cama de casal confortável, uma poltrona para momentos de leitura e um generoso armário embutido para armazenamento organizad...",https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/viva-com-estilo-e-conforto-no-condominio-unique-residence-apartamento-mobiliado-a-venda-1230283069,apartamento,1,1,1,43,350,35,"Avenida José Munia - até 5801 - lado ímpar Jardim Redentor - São José do Rio Preto, SP",15085350,True,False,...,False,False,False,False,True,False,True,False,False,False,True,False,False,False,False,False,False,False,False,False
5704,['3Quartos180m²Área útil4Vagas4Banheiros'],"['Área de serviçoChurrasqueiraPiscina', 'Condomínio fechadoPiscina']","Avenida José da Silva Sé - de 1000 a 1998 - lado par Village Damha Rio Preto III - São José do Rio Preto, SPCEP: 15056110",['CondomínioR$ 420IPTUR$ 150'],R$ 1.390.000,"Casa com 3 dormitórios à venda, 180 m² por R$ 1.390.000,00 - Village Damha Rio Preto III -",Publicado em 26/05 às 04:47,"Código do anúncio: CA5349\n\nDescrição\nCasa térrea - Village Damha III - 3 Dormitórios\n\nA tranquilidade de viver em um empreendimento Damha. Localizado em uma região que se valoriza a cada ano, o condomínio conta com todos os diferenciais de qualidade que se tornaram referência nos produtos da empresa, como a segurança planejada, a concepção urbanística que favorece a integração com a natureza, o respeito às normas ambientais e uma completa estrutura de lazer.\n\nConheça as características desta linda casa:\n\n- 180 m² de construção\n- Terreno 285 metros\n- 3 Dormitórios todos suíte\n- Lavabo\n-Cozinha Gourmet\n- Sala para 2 ambientes\n- Piscina Aquecida\n- Garagens\n\nDiferenciais Exclusivos no Condomínio:\n\n- Salão de Festas\n- Playground\n- Pista de caminhada\n- Quadra de tênis\n- Academia\n- Quadra poliesportiva\n- Quadra de areia\n- Campo de futebol\n- Conveniência 24h\n- Lago\n- Acesso por biometria e segurança 24h\n\nQue tal agendar uma visita hoje mesmo para conhecer es...",https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-com-3-dormitorios-a-venda-180-m-por-r-1-390-000-00-village-damha-rio-preto-iii-1190284748,casa,3,4,4,180,420,150,"Avenida José da Silva Sé - de 1000 a 1998 - lado par Village Damha Rio Preto III - São José do Rio Preto, SP",15056110,False,False,...,True,False,False,False,True,False,False,True,False,False,False,False,False,False,True,False,False,False,False,False
17577,['3Quartos200m²Área útil3Vagas3Banheiros'],['Área de serviçoChurrasqueira'],"Rua Amador Rodrigues Parque das Aroeiras - São José do Rio Preto, SPCEP: 15042082",['CondomínioR$ 0IPTUR$ 0'],R$ 350.000,Lindo Imóvel venha conferir,Publicado em 22/06 às 12:45,"Código do anúncio: 13151\n\nExcelente Casa - Parque das Aroeiras\n\n3 dormitórios, sendo uma suíte, todos com ar condicionado\n\nSala ampla com duas copas\n\nÁrea de serviço fechada\n\nÁrea gourmet com churrasqueira, forno a lenha\n\n3 banheiros\n\n3 vagas de garagem\n\nPortão e campainha eletrônicos",https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/lindo-imovel-venha-conferir-1201215637,casa,3,3,3,200,0,0,"Rua Amador Rodrigues Parque das Aroeiras - São José do Rio Preto, SP",15042082,False,False,...,True,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
11478,['3Quartos150m²Área útil2Vagas2Banheiros'],['Varanda'],"Rua Santa Cruz - até 99999 - lado ímpar Centro - Mirassol, SPCEP: 15130001",['CondomínioR$ 150IPTUR$ 0'],R$ 420.000,"Apartamento 3 quartos para Venda Centro, Mirassol",Publicado em 05/07 às 01:21,"Código do anúncio: 7131V-ZAP_PLUS\n\n3 dormitórios com armário embutido, sendo 1 com WC\nSala para 2 ambientes com sacada\nCozinha planejada + área de serviço\nElevador\nPortões automáticos\n2 vagas de garagem",https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/apartamento-3-quartos-para-venda-centro-mirassol-1206347827,apartamento,3,2,2,150,150,0,"Rua Santa Cruz - até 99999 - lado ímpar Centro - Mirassol, SP",15130001,False,False,...,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False,False,False
5059,['2Quartos52m²Área útil1Vaga1Banheiro'],"['Ar condicionadoÁrea de serviçoArmários na cozinhaArmários no quartoVaranda', 'Condomínio fechadoElevadorPermitido animaisPortariaSalão de festasSegurança 24h']","Avenida de Maio - até 3099 - lado ímpar Vila São Judas Tadeu - São José do Rio Preto, SPCEP: 15075350",['CondomínioR$ 364IPTUR$ 31'],R$ 235.000,Vende se apartamento,Publicado em 02/09 às 17:38,"Vende se apartamento com 02 dormitórios, 01 WC, com armários planejados, 01 vaga de garagem, com elevador, salão de festas, 4 andar de frente para a avenida principal/entrada, próximo ao supermercado Carrefour",https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/vende-se-apartamento-1229525036,apartamento,2,1,1,52,364,31,"Avenida de Maio - até 3099 - lado ímpar Vila São Judas Tadeu - São José do Rio Preto, SP",15075350,False,False,...,True,True,True,False,False,False,False,False,False,False,True,False,True,False,True,True,True,False,True,True
8220,['4Quartos318m²Área útil4Vagas5 ou maisBanheiros'],['Condomínio fechado'],"Rua Tenente Ivano Pedro Rodrigues Quinta do Golfe Jardins - São José do Rio Preto, SPCEP: 15093355",['CondomínioR$ 770IPTUR$ 450'],R$ 3.600.000,"Casa com 4 dormitórios à venda, 318 m² por R$ 3.600.000,00 - Quinta do Golfe Jardins - São",Publicado em 06/04 às 21:37,Código do anúncio: CA0536\n\n4 SUÍTES SENDO 2 COM CLOSET\nHOME\nESCRITÓRIO\nÁREA GOURMET\nBALCÃO REFRIGERADO\nPISCINA -,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-com-4-dormitorios-a-venda-318-m-por-r-3-600-000-00-quinta-do-golfe-jardins-sao-1169410317,casa,4,5 ou mais,4,318,770,450,"Rua Tenente Ivano Pedro Rodrigues Quinta do Golfe Jardins - São José do Rio Preto, SP",15093355,False,False,...,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False
2452,['2Quartos45m²Área útil1Vaga1Banheiro'],"['Churrasqueira', 'Salão de festas']","Avenida Doutor Ernani Pires Domingues - de 4102 a 5998 - lado par Residencial Macedo Teles I - São José do Rio Preto, SPCEP: 15040548",['CondomínioR$ 226IPTUR$ 376'],R$ 180.000,"Apartamento com 2 dorms, Residencial Macedo Teles I, São José do Rio Preto - R$ 180 mil, C",Publicado em 08/08 às 05:29,"Código do anúncio: 11951\n\nExcelente apartamento no Condomínio Rio das Hortências na cidade de São José do Rio Preto.\n\n2 quartos.\n1 banheiro.\nSala 2 ambientes.\nCozinha.\nÁrea de serviço.\n1 vaga de garagem.\nÁrea útil de 45m².\n\nO lazer do condomínio conta com playground, espaço gourmet, salão de festas e afins.\n\nAceita financiamento.\n\nGostou do imóvel?\n\nPara facilitar a sua compra, contamos com financiamentos nos seguintes bancos: Santander, Caixa Econômica Federal, Bradesco, Itaú e Banco do Brasil.\n\nPara mais informações, acesse nosso site ou entre em contato conosco...\n\nwww.hallimoveis.com.br\n\nFixo \n\nWhatsApp HALL Imóveis (17)... ver número\n\nO Maior Portal Imobiliário do Noroeste Paulista!\n11951",https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/apartamento-com-2-dorms-residencial-macedo-teles-i-sao-jose-do-rio-preto-r-180-mil-c-1219720792,apartamento,2,1,1,45,226,376,"Avenida Doutor Ernani Pires Domingues - de 4102 a 5998 - lado par Residencial Macedo Teles I - São José do Rio Preto, SP",15040548,False,False,...,False,False,False,False,True,False,False,False,False,False,True,False,False,False,False,False,False,False,False,False
12689,['3Quartos246m²Área útil4Vagas4Banheiros'],"['Área de serviçoChurrasqueiraPiscinaVaranda', 'Piscina']","Avenida Miguel Damha - de 1999 a 2499 - lado ímpar Residencial Marcia - São José do Rio Preto, SPCEP: 15061800",['CondomínioR$ 400IPTUR$ 0'],R$ 1.900.000,Casa Condomínio em São José do Rio Preto,Publicado em 22/12 às 16:47,"Código do anúncio: V4726\n\nDAMHA III - Térrea 03 dormitórios, 01 suíte e 02 apartamentos, armários, closet, sala ampla para 02 ambientes, escritório, home, varanda com churrasqueira, piscina, toda em porcelanato. 246,50 m² de construção em terreno de 405. ref. 4726 atualizado em 10/10.",https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-condominio-em-sao-jose-do-rio-preto-1124775119,casa,3,4,4,246,400,0,"Avenida Miguel Damha - de 1999 a 2499 - lado ímpar Residencial Marcia - São José do Rio Preto, SP",15061800,False,False,...,True,False,False,False,True,False,False,True,False,False,False,False,True,False,False,False,False,False,False,False


## Drop Unecessary columns

In [14]:
cols_drop = ['Comodos',
             'Caracteristicas do Imovel',
             'Localizacao',
             'Custos',
             'Titulo',
             'Data de Publicacao',
             'Descricao',
             'Link']


df_imob = df_imob.drop(cols_drop, axis=1)

In [15]:
df_imob.head()

Unnamed: 0,Preco,tipo,Quartos,Banheiros,Vagas de Garagem,Área,Condominio,IPTU,Endereco,CEP,Academia,Aquecimento,Ar condicionado,Área de serviço,Armários na cozinha,Armários no quarto,Banheiro no quarto,Churrasqueira,Internet,Mobiliado,Piscina,Porteiro 24h,Quarto de serviço,Salão de festas,Tv a cabo,Varanda,Área murada,Condomínio fechado,Elevador,Permitido animais,Portão eletrônico,Portaria,Segurança 24h
0,R$ 230.000,casa,2,1,2,80,0,68,"Rua Padre Augusto Cherubini Vila Anchieta - São José do Rio Preto, SP",15050100,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
1,R$ 239.000,casa,3,2,2,67,0,0,"Rua Antônio Sérgio Fogaça Residencial Morada do Sol - São José do Rio Preto, SP",15045766,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
2,R$ 220.000,casa,2,2,2,120,0,0,"Rua Santo Inácio de Loyola Vila Anchieta - São José do Rio Preto, SP",15050140,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
3,R$ 245.000,casa,2,1,2,151,0,0,"Rua Independência - de 3420/3421 a 4298/4299 Vila Santo Antônio - São José do Rio Preto, SP",15014400,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
4,R$ 200.000,casa,2,2,3,120,0,50,"Rua Doutor Alceu de Assis Jardim Maria Lúcia - São José do Rio Preto, SP",15047087,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False


# Data Description

In [16]:
df1 = df_imob.copy()

In [17]:
df1.columns = df1.columns.map(lambda x: inflection.parameterize(x, separator='_'))

## Check Na

In [18]:
df1.isna().sum()

preco                  0
tipo                   0
quartos                0
banheiros              0
vagas_de_garagem       0
area                   0
condominio             0
iptu                   0
endereco               0
cep                    0
academia               0
aquecimento            0
ar_condicionado        0
area_de_servico        0
armarios_na_cozinha    0
armarios_no_quarto     0
banheiro_no_quarto     0
churrasqueira          0
internet               0
mobiliado              0
piscina                0
porteiro_24h           0
quarto_de_servico      0
salao_de_festas        0
tv_a_cabo              0
varanda                0
area_murada            0
condominio_fechado     0
elevador               0
permitido_animais      0
portao_eletronico      0
portaria               0
seguranca_24h          0
dtype: int64

## Data Types

In [19]:
df1.dtypes

preco                  object
tipo                   object
quartos                object
banheiros              object
vagas_de_garagem       object
area                   object
condominio             object
iptu                   object
endereco               object
cep                    object
academia                 bool
aquecimento              bool
ar_condicionado          bool
area_de_servico          bool
armarios_na_cozinha      bool
armarios_no_quarto       bool
banheiro_no_quarto       bool
churrasqueira            bool
internet                 bool
mobiliado                bool
piscina                  bool
porteiro_24h             bool
quarto_de_servico        bool
salao_de_festas          bool
tv_a_cabo                bool
varanda                  bool
area_murada              bool
condominio_fechado       bool
elevador                 bool
permitido_animais        bool
portao_eletronico        bool
portaria                 bool
seguranca_24h            bool
dtype: obj

In [20]:
#Remove R$ Sign from preco
df1['preco'] = df1['preco'].apply(lambda x: x.split()[1]).str.replace('.', '').str.replace(',', '.').astype(float)

In [21]:
def handle_thousand_separator(val):
    if isinstance(val, str) and val.count('.') > 1:
        return float(val.replace('.', ''))
    return val

In [22]:
df1['area'] = df1['area'].astype(float)

df1['iptu'] = df1['iptu'].apply(handle_thousand_separator)
df1['iptu'] = df1['iptu'].astype(float)
df1['condominio'] = df1['condominio'].apply(handle_thousand_separator)
df1['condominio'] = df1['condominio'].astype(float)



In [23]:
df1['banheiros'] = df1['banheiros'].apply(lambda x: x.split()[0])
df1['banheiros'] = df1['banheiros'].astype(int)

In [24]:
df1['vagas_de_garagem'] = df1['vagas_de_garagem'].astype(int)
df1['quartos'] = df1['quartos'].apply(lambda x: x.split()[0]).astype(int)

In [25]:
df1.head()

Unnamed: 0,preco,tipo,quartos,banheiros,vagas_de_garagem,area,condominio,iptu,endereco,cep,academia,aquecimento,ar_condicionado,area_de_servico,armarios_na_cozinha,armarios_no_quarto,banheiro_no_quarto,churrasqueira,internet,mobiliado,piscina,porteiro_24h,quarto_de_servico,salao_de_festas,tv_a_cabo,varanda,area_murada,condominio_fechado,elevador,permitido_animais,portao_eletronico,portaria,seguranca_24h
0,230000.0,casa,2,1,2,80.0,0.0,68.0,"Rua Padre Augusto Cherubini Vila Anchieta - São José do Rio Preto, SP",15050100,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
1,239000.0,casa,3,2,2,67.0,0.0,0.0,"Rua Antônio Sérgio Fogaça Residencial Morada do Sol - São José do Rio Preto, SP",15045766,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
2,220000.0,casa,2,2,2,120.0,0.0,0.0,"Rua Santo Inácio de Loyola Vila Anchieta - São José do Rio Preto, SP",15050140,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
3,245000.0,casa,2,1,2,151.0,0.0,0.0,"Rua Independência - de 3420/3421 a 4298/4299 Vila Santo Antônio - São José do Rio Preto, SP",15014400,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False
4,200000.0,casa,2,2,3,120.0,0.0,50.0,"Rua Doutor Alceu de Assis Jardim Maria Lúcia - São José do Rio Preto, SP",15047087,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False


# EDA

In [26]:
df1.loc[df1['condominio_fechado'] == True,:]

Unnamed: 0,preco,tipo,quartos,banheiros,vagas_de_garagem,area,condominio,iptu,endereco,cep,academia,aquecimento,ar_condicionado,area_de_servico,armarios_na_cozinha,armarios_no_quarto,banheiro_no_quarto,churrasqueira,internet,mobiliado,piscina,porteiro_24h,quarto_de_servico,salao_de_festas,tv_a_cabo,varanda,area_murada,condominio_fechado,elevador,permitido_animais,portao_eletronico,portaria,seguranca_24h
10,210000.0,casa,3,1,1,65.0,200.00,50.00,"Avenida José da Silva Sé - de 451 ao fim - lado ímpar Condomínio Residencial Parque da Liberdade VI - São José do Rio Preto, SP",15056670,False,False,True,True,True,True,False,False,False,True,False,False,False,False,False,False,False,True,False,True,False,False,True
43,158000.0,casa,2,2,1,49.0,160.00,130.00,"Cedral, SP",15895000,False,False,False,True,True,False,False,False,False,False,False,False,False,False,False,False,True,True,False,False,True,False,False
69,135000.0,casa,2,1,1,150.0,150.00,100.00,"Avenida Francisco Munia - até 1320 - lado par Residencial Jardim das Acácias - São José do Rio Preto, SP",15051405,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,True,False,False,False,False,False
88,230000.0,casa,2,2,1,90.0,0.00,0.00,"Rua Antonio Carlos de Oliveira Bottas Vila Borguese - São José do Rio Preto, SP",15041570,False,False,False,False,False,False,False,True,False,False,True,False,False,False,False,False,False,True,False,False,False,False,False
91,52900.0,casa,3,2,2,88.0,350.00,80.00,"Avenida José da Silva Sé - de 2000 ao fim - lado par Condomínio Residencial Parque da Liberdade I - São José do Rio Preto, SP",15056750,True,False,True,False,False,False,False,True,False,False,True,True,False,False,False,True,False,True,False,True,True,False,False
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
17242,535000.0,apartamento,2,2,2,71.0,500.00,65.00,"Rua Luiz Figueiredo Filho Vila Nossa Senhora do Bonfim - São José do Rio Preto, SP",15084180,True,False,True,True,False,False,False,True,False,False,True,False,False,True,False,True,False,True,True,True,False,False,False
17248,1800000.0,apartamento,3,5,4,174.0,1.45,390.00,"Avenida Presidente Juscelino Kubitschek de Oliveira - de 4200/4201 ao fim Iguatemi - São José do Rio Preto, SP",15093340,False,False,False,True,False,False,False,False,False,False,True,False,False,False,False,True,False,True,False,False,False,False,False
17265,595000.0,apartamento,2,2,2,77.0,520.00,0.00,"Avenida Doutor Aniloel Nazareth - de 5000 ao fim - lado par Parque Residencial Comendador Mançor Daud - São José do Rio Preto, SP",15070565,True,False,True,True,True,True,False,True,False,False,True,False,False,True,False,False,False,True,False,False,False,True,False
17273,890000.0,apartamento,3,5,2,147.0,626.00,1.44,"Rua Serafim Correa Andrade Pinheiros - São José do Rio Preto, SP",15091360,True,False,True,False,False,False,False,True,False,False,True,False,False,True,False,True,False,True,True,True,False,True,True


In [27]:
import requests

def geocode_address(address, api_key):
    url = f"https://maps.googleapis.com/maps/api/geocode/json?address={address}&key={api_key}"
    response = requests.get(url)
    data = response.json()
    
    if data['status'] == "OK":
        location = data['results'][0]['geometry']['location']
        return location['lat'], location['lng']
    else:
        return None, None

# Exemplo:
address = "Avenida José da Silva Sé - de 2000 ao fim - lado par Condomínio Residencial Parque da Liberdade I - São José do Rio Preto, SP"
api_key = "AIzaSyBN6nHVeWl8xQk6Zxokq7XOjb2EcEHF3PU"
latitude, longitude = geocode_address(address, api_key)
print(latitude, longitude)

-20.7728625 -49.3318835


In [28]:
df1['endereco'].nunique()

3447

In [29]:
# import time

# def geocode_unique_addresses(df, api_key, column_name='endereco'):
#     # Extract unique addresses
#     unique_addresses = df[column_name].dropna().unique()

#     # Geocode the unique addresses
#     mapping = {}
#     for address in unique_addresses:
#         lat, lng = geocode_address(address, api_key)
#         mapping[address] = (lat, lng)
        
#         # Pause for a short time to avoid hitting the rate limit
#         time.sleep(0.1)

#     # Apply the mapping to the dataframe
#     df['latitude'] = df[column_name].map(lambda x: mapping.get(x, (None, None))[0])
#     df['longitude'] = df[column_name].map(lambda x: mapping.get(x, (None, None))[1])
    
#     return df

# # Exemplo:
# df_region = geocode_unique_addresses(df1, api_key)

KeyboardInterrupt: 

In [None]:
#df_region.to_csv('df_regioned_latlong_new_cleaning.csv', index=False)

In [30]:
df_region = pd.read_csv('/home/edilson07/projects/rp_housing/notebooks/df_cleaned_latlong_new_cleaning.csv')

In [31]:
df_region

Unnamed: 0,preco,link,quartos,banheiros,vagas_de_garagem,area,condominio,iptu,endereco,cep,academia,aquecimento,ar_condicionado,area_de_servico,armarios_na_cozinha,armarios_no_quarto,banheiro_no_quarto,churrasqueira,internet,mobiliado,piscina,porteiro_24h,quarto_de_servico,salao_de_festas,tv_a_cabo,varanda,area_murada,condominio_fechado,elevador,permitido_animais,portao_eletronico,portaria,seguranca_24h,latitude,longitude
0,230000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-para-venda-vila-anchieta-2-dormitorios-sala-cozinha-com-gabinete-quintal-garage-1168282910,2,1,2,80.0,0.0,68.0,"Rua Padre Augusto Cherubini Vila Anchieta - São José do Rio Preto, SP",15050100,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,-20.798119,-49.373160
1,239000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-com-3-dormitorios-a-venda-67-m-por-r-239-000-00-residencial-morada-do-sol-sao-1228019106,3,2,2,67.0,0.0,0.0,"Rua Antônio Sérgio Fogaça Residencial Morada do Sol - São José do Rio Preto, SP",15045766,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,-20.747144,-49.394809
2,220000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-padrao-em-sao-jose-do-rio-preto-1154040388,2,2,2,120.0,0.0,0.0,"Rua Santo Inácio de Loyola Vila Anchieta - São José do Rio Preto, SP",15050140,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,-20.795802,-49.372459
3,245000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-lago-sul-bady-bassitt-1082793367,2,1,2,151.0,0.0,0.0,"Rua Independência - de 3420/3421 a 4298/4299 Vila Santo Antônio - São José do Rio Preto, SP",15014400,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,-20.821258,-49.379740
4,200000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-em-jardim-maria-lucia--sao-jose-do-rio-preto-1225906965,2,2,3,120.0,0.0,50.0,"Rua Doutor Alceu de Assis Jardim Maria Lúcia - São José do Rio Preto, SP",15047087,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,-20.767672,-49.401775
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
27725,775000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-padrao-em-sao-jose-do-rio-preto-1120944510,3,3,4,236.0,0.0,226.0,"Rua República do Líbano - até 2699/2700 Jardim Tarraf II - São José do Rio Preto, SP",15092440,False,False,True,True,False,False,False,True,False,False,True,False,False,False,False,True,False,False,False,False,False,False,False,-20.836122,-49.414458
27726,850000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/sao-jose-do-rio-preto-residencial-condominio-residencial-maria-julia-1171119164,3,2,2,130.0,0.0,0.0,"Avenida Nívea Dulce Tedeschi Conforti - de 2 a 99998 - lado par Residencial Maria Júlia - São José do Rio Preto, SP",15063200,False,False,False,True,True,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,-20.804205,-49.321216
27727,930000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-com-3-dormitorios-a-venda-156-m-por-r-930-000-00-residencial-maria-julia-sao-j-1237628501,3,4,4,156.0,250.0,0.0,"Avenida Nívea Dulce Tedeschi Conforti - de 2 a 99998 - lado par Residencial Maria Júlia - São José do Rio Preto, SP",15063200,False,False,False,True,False,False,False,True,False,False,True,False,False,False,False,False,False,True,False,True,False,False,False,-20.804205,-49.321216
27728,750000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/sua-casa-pronta-em-4-meses-999311951,2,3,2,160.0,0.0,0.0,"Avenida Projetada 1 Terras Alphaville Mirassol - Mirassol, SP",15134150,True,False,False,False,False,False,False,True,False,False,True,True,False,False,False,False,False,True,False,False,True,False,False,-20.826136,-49.524288


In [32]:
df_region.isna().sum()

preco                  0
link                   0
quartos                0
banheiros              0
vagas_de_garagem       0
area                   0
condominio             0
iptu                   0
endereco               0
cep                    0
academia               0
aquecimento            0
ar_condicionado        0
area_de_servico        0
armarios_na_cozinha    0
armarios_no_quarto     0
banheiro_no_quarto     0
churrasqueira          0
internet               0
mobiliado              0
piscina                0
porteiro_24h           0
quarto_de_servico      0
salao_de_festas        0
tv_a_cabo              0
varanda                0
area_murada            0
condominio_fechado     0
elevador               0
permitido_animais      0
portao_eletronico      0
portaria               0
seguranca_24h          0
latitude               0
longitude              0
dtype: int64

In [None]:
import folium

# Coordenadas atualizadas fornecidas pelo usuário
regioes_coords_atualizadas = {
    'HB': [
        (-20.816000, -49.449000), (-20.825000, -49.406000), (-20.825000, -49.368000), (-20.842000, -49.353000),
        (-20.852000, -49.366000), (-20.869000, -49.352000), (-20.875000, -49.355000), (-20.876000, -49.349000),
        (-20.880000, -49.345000), (-20.891000, -49.355000), (-20.904000, -49.345000), (-20.930000, -49.348000),
        (-20.906000, -49.445000), (-20.816000, -49.449000)
    ],
    'Cidade das Crianças': [
        (-20.814000, -49.450000), (-20.790000, -49.459000), (-20.781000, -49.416000), (-20.790000, -49.413000),
        (-20.779000, -49.402000), (-20.791000, -49.388000), (-20.806000, -49.409000), (-20.816000, -49.411000),
        (-20.823000, -49.419000), (-20.814000, -49.450000)
    ],
    'Pinheirinho': [
        (-20.790000, -49.459000), (-20.689000, -49.469000), (-20.716000, -49.463000), (-20.684000, -49.462000),
        (-20.705000, -49.423000), (-20.730000, -49.428000), (-20.766000, -49.411000), (-20.767000, -49.386000),
        (-20.777000, -49.386000), (-20.785000, -49.379000), (-20.791000, -49.388000), (-20.779000, -49.402000),
        (-20.789000, -49.412000), (-20.781000, -49.417000), (-20.790000, -49.459000)
    ],
    'CEU': [
        (-20.723000, -49.424000), (-20.709000, -49.387000), (-20.749000, -49.375000), (-20.710000, -49.387000), (-20.750000, -49.374000),
        (-20.779000, -49.382000), (-20.768000, -49.385000), (-20.766000, -49.411000), (-20.723000, -49.424000)
    ],
    'BOSQUE': [
        (-20.710000, -49.387000), (-20.725000, -49.382000), (-20.749000, -49.375000), (-20.778000, -49.383000),
        (-20.791000, -49.364000), (-20.781000, -49.353000), (-20.742000, -49.338000), (-20.666000, -49.341000),
        (-20.635000, -49.354000), (-20.672000, -49.362000), (-20.679000, -49.347000), (-20.723000, -49.370000),
        (-20.710000, -49.387000)
    ],
    'Talhados': [
        (-20.666000, -49.341000), (-20.739000, -49.338000), (-20.774000, -49.349000), (-20.762000, -49.306000),
        (-20.769000, -49.282000), (-20.680000, -49.266000), (-20.666000, -49.341000)
    ],
    'Represa': [
        (-20.773000, -49.351000), (-20.761000, -49.307000), (-20.770000, -49.282000), (-20.843000, -49.265000),
        (-20.843000, -49.281000), (-20.828000, -49.288000), (-20.837000, -49.314000), (-20.826000, -49.307000),
        (-20.818000, -49.325000), (-20.828000, -49.335000), (-20.811000, -49.356000), (-20.773000, -49.351000)
    ]
}

regioes_coords_atualizadas['Vila Toninho'] = [
    (-20.811000, -49.356000), (-20.831000, -49.361000), (-20.841000, -49.353000), (-20.852000, -49.365000),
    (-20.876000, -49.349000), (-20.847000, -49.312000), (-20.837000, -49.315000), (-20.826000, -49.307000),
    (-20.819000, -49.324000), (-20.827000, -49.344000), (-20.811000, -49.356000)
]

regioes_coords_atualizadas['Schimidt'] = [
    (-20.931000, -49.348000), (-20.876000, -49.348000), (-20.846000, -49.308000), (-20.829000, -49.289000),
    (-20.844000, -49.280000), (-20.844000, -49.263000), (-20.864000, -49.256000), (-20.915000, -49.314000),
    (-20.931000, -49.348000)
]

regioes_coords_atualizadas['Centro'] = [
    (-20.824000, -49.42000), (-20.806000, -49.411000), (-20.788000, -49.381000), (-20.782000, -49.381000),
    (-20.781000, -49.368000), (-20.791000, -49.364000), (-20.781000, -49.352000), (-20.832000, -49.359000),
    (-20.825000, -49.373000), (-20.824000, -49.420000)
]

In [39]:
regioes_test = {
    'Talhados':
[(-20.680000, -49.266000), 
(-20.770000, -49.279000),
#bordas com represa 
(-20.769000, -49.287000),
(-20.765000, -49.298000),
(-20.765000, -49.301000),
(-20.763000, -49.306000),
(-20.761000, -49.306000),
(-20.765000, -49.316000),
(-20.760000, -49.317000),
(-20.762000, -49.321000),
(-20.760000, -49.323000),
(-20.766000, -49.328000),
(-20.764000, -49.329000),
(-20.774000, -49.349000),
(-20.773000, -49.351000),
 #fim borda represa
(-20.751000, -49.341000),
(-20.750000, -49.340000),
(-20.748000, -49.340000),
(-20.742000, -49.338000),
(-20.665000, -49.341000),
(-20.680000, -49.266000)

],
'Represa':[
(-20.770000, -49.282000),
(-20.843000, -49.254000),
(-20.843000, -49.281000),
(-20.828000, -49.289000),
(-20.839000, -49.305000),
(-20.838000, -49.315000),
(-20.826000, -49.307000),
(-20.819000, -49.324000),
(-20.821000, -49.329000),
(-20.828000, -49.335000),
(-20.827000, -49.339000),
(-20.826000, -49.343000),
(-20.828000, -49.343000),
(-20.825000, -49.348000),
(-20.817000, -49.350000),
(-20.811000, -49.357000),
(-20.781000, -49.354000),
(-20.776000, -49.353000),
#bordas com talhados    
(-20.772000, -49.351000),
(-20.774000, -49.349000),
(-20.765000, -49.332000),
(-20.764000, -49.329000),
(-20.766000, -49.328000),
(-20.760000, -49.323000),
(-20.762000, -49.321000),
(-20.760000, -49.317000),
(-20.765000, -49.315000),
(-20.761000, -49.306000),
(-20.763000, -49.306000),
(-20.763000, -49.302000),
(-20.765000, -49.300000),
(-20.765000, -49.289000),
(-20.769000, -49.286000),
(-20.770000, -49.282000),
],
    'Vila Toninho':[
(-20.811000, -49.356000),
(-20.817000, -49.350000),
(-20.825000, -49.348000),
(-20.827000, -49.344000),
(-20.826000, -49.344000),
(-20.827000, -49.338000),
(-20.828000, -49.335000),
(-20.821000, -49.329000),
(-20.818000, -49.324000),
(-20.826000, -49.307000),
(-20.837000, -49.315000),
(-20.838000, -49.309000),
(-20.846000, -49.308000),
(-20.848000, -49.313000),
(-20.846000, -49.314000),
(-20.846000, -49.315000),
(-20.844000, -49.315000),
(-20.846000, -49.323000),
(-20.845000, -49.326000),
(-20.852000, -49.330000),
(-20.853000, -49.328000),
(-20.860000, -49.335000),
(-20.863000, -49.332000),
(-20.876000, -49.349000),
(-20.876000, -49.354000),
(-20.874000, -49.355000),
(-20.870000, -49.353000),
(-20.855000, -49.363000),
(-20.853000, -49.365000),
(-20.845000, -49.358000),
(-20.841000, -49.352000),
(-20.831000, -49.362000),
(-20.826000, -49.359000),
(-20.824000, -49.358000),
(-20.811000, -49.357000),
],

    'Schimidt': [
(-20.838000, -49.309000),
(-20.839000, -49.305000),
(-20.828000, -49.289000),
(-20.844000, -49.281000),
(-20.843000, -49.263000),
(-20.852000, -49.254000),
(-20.864000, -49.255000),
(-20.943000, -49.346000),
(-20.931000, -49.348000),
(-20.928000, -49.348000),
(-20.921000, -49.351000),
(-20.912000, -49.349000),
(-20.910000, -49.347000),
(-20.906000, -49.347000),
(-20.905000, -49.341000),
(-20.890000, -49.355000),
(-20.885000, -49.352000),
(-20.884000, -49.348000),
(-20.882000, -49.347000),
(-20.881000, -49.345000),
(-20.876000, -49.349000),
(-20.863000, -49.332000),
(-20.859000, -49.335000),
(-20.853000, -49.329000),
(-20.852000, -49.330000),
(-20.845000, -49.326000),
(-20.845000, -49.324000),
(-20.845000, -49.323000),
(-20.844000, -49.315000),
(-20.846000, -49.314000),
(-20.846000, -49.313000),
(-20.848000, -49.313000),
(-20.846000, -49.308000),
(-20.838000, -49.309000),


]
    

}

In [53]:
regioes_test = {
    'Talhados':
[(-20.680000, -49.266000), 
(-20.770000, -49.279000),
#bordas com represa 
(-20.769000, -49.287000),
(-20.765000, -49.298000),
(-20.765000, -49.301000),
(-20.763000, -49.306000),
(-20.761000, -49.306000),
(-20.765000, -49.316000),
(-20.760000, -49.317000),
(-20.762000, -49.321000),
(-20.760000, -49.323000),
(-20.766000, -49.328000),
(-20.764000, -49.329000),
(-20.774000, -49.349000),
(-20.773000, -49.351000),
 #fim borda represa
(-20.751000, -49.341000),
(-20.750000, -49.340000),
(-20.748000, -49.340000),
(-20.742000, -49.338000),
(-20.665000, -49.341000),
(-20.680000, -49.266000)

],
'Represa':[
(-20.770000, -49.279000),
(-20.843000, -49.254000),
#inicio limites schimitdt
(-20.843000, -49.264000),
(-20.843000, -49.281000),
(-20.828000, -49.289000),
(-20.839000, -49.305000),
(-20.838000, -49.309000),
#fim limites schimitd
#inicio vila toninho  
(-20.838000, -49.309000),
(-20.826000, -49.307000),
(-20.819000, -49.324000),
(-20.821000, -49.329000),
(-20.828000, -49.335000),
(-20.827000, -49.339000),
(-20.826000, -49.343000),
(-20.828000, -49.343000),
(-20.825000, -49.348000),
(-20.817000, -49.350000),
(-20.811000, -49.357000),
#fim vila toninho
#começo borda centro
(-20.811000, -49.357000),
(-20.781000, -49.354000),
#fim borda centro
#unica borda com bosque    
(-20.776000, -49.353000),
#fim borda bosque    
#bordas com talhados    
(-20.773000, -49.351000),
(-20.774000, -49.349000),
(-20.764000, -49.329000),
(-20.766000, -49.328000),
(-20.760000, -49.323000),
(-20.762000, -49.321000),
(-20.760000, -49.317000),
(-20.765000, -49.316000),
(-20.761000, -49.306000),
(-20.763000, -49.306000),
(-20.765000, -49.301000),
(-20.765000, -49.298000),
(-20.770000, -49.279000),
#(-20.769000, -49.286000),
#(-20.770000, -49.282000),
],
    'Vila Toninho':[
#limites com represa        
(-20.811000, -49.357000),
(-20.817000, -49.350000),
(-20.825000, -49.348000),
(-20.828000, -49.343000),
(-20.826000, -49.343000),
(-20.827000, -49.339000),
(-20.828000, -49.335000),
(-20.821000, -49.329000),
(-20.819000, -49.324000),
(-20.826000, -49.307000),
(-20.838000, -49.309000),
#fim limites represa    
#Inicio schimidt        
(-20.838000, -49.309000),        
(-20.846000, -49.308000),
(-20.848000, -49.313000),
(-20.846000, -49.314000),
(-20.846000, -49.315000),
(-20.844000, -49.315000),
(-20.846000, -49.323000),
(-20.845000, -49.326000),
(-20.852000, -49.330000),
(-20.853000, -49.328000),
(-20.860000, -49.335000),
(-20.863000, -49.332000),
(-20.876000, -49.349000),
#fim limite schmidt
#começo HB
(-20.876000, -49.349000),
(-20.876000, -49.354000),
(-20.874000, -49.355000),
(-20.870000, -49.353000),
(-20.855000, -49.363000),
(-20.853000, -49.365000),
(-20.845000, -49.358000),
(-20.841000, -49.352000),
(-20.831000, -49.362000),
#fim limite hb
#inicio centro
(-20.831000, -49.362000),
(-20.826000, -49.359000),
(-20.824000, -49.358000),
(-20.811000, -49.357000),
#fim centro        
],

    'Schimidt': [
#inicio represa
(-20.843000, -49.264000),
(-20.843000, -49.281000),
(-20.828000, -49.289000),
(-20.839000, -49.305000),
(-20.838000, -49.309000),
#fim represa
#inicio toninho
(-20.838000, -49.309000),        
(-20.846000, -49.308000),
(-20.848000, -49.313000),
(-20.846000, -49.314000),
(-20.846000, -49.315000),
(-20.844000, -49.315000),
(-20.846000, -49.323000),
(-20.845000, -49.326000),
(-20.852000, -49.330000),
(-20.853000, -49.328000),
(-20.860000, -49.335000),
(-20.863000, -49.332000),
(-20.876000, -49.349000),
#fim toninho
#inicio HB   
(-20.876000, -49.349000),


]
    

}

In [54]:
import folium

# Crie um mapa centralizado em São José do Rio Preto
m = folium.Map(location=[-20.8118, -49.3802], zoom_start=12)

# Adicione polígonos ao mapa para cada região
for regiao, coordenadas in regioes_test.items():
    folium.Polygon(
        locations=coordenadas,
        fill=True,
        popup=regiao,
        color="blue",
        fill_color="blue"
    ).add_to(m)

  # Salva o mapa como um arquivo HTML
m  # Exibe o mapa

In [271]:
import folium
from folium import plugins

# Crie um mapa
m = folium.Map(location=[-20.8118, -49.3802], zoom_start=12)

# Adicione o plugin de desenho ao mapa
draw = plugins.Draw(export=True)
draw.add_to(m)

# Exiba o mapa
m.save('map_with_draw.html')

In [259]:
import folium

# Centro de São José do Rio Preto
latitude_centro = -20.8196
longitude_centro = -49.3797

# Criar mapa centrado em São José do Rio Preto
m = folium.Map(location=[latitude_centro, longitude_centro], zoom_start=12)

# Adicionar polígonos das regiões ao mapa
for regiao, coords in regioes_coords_atualizadas.items():
    folium.Polygon(
        locations=coords,
        color="blue",
        fill=True,
        fill_opacity=0.4,
        popup=regiao
    ).add_to(m)

# Adicionar os primeiros 100 pontos do dataframe ao mapa
for idx, row in df_region.head(100).iterrows():
    folium.Marker(
        location=(row['latitude'], row['longitude']),
        popup=f"{row['endereco']}",
        icon=folium.Icon(icon="cloud"),
    ).add_to(m)

m

In [260]:
from shapely.geometry import Point
from shapely.geometry import Polygon

# Dicionário para armazenar os polígonos das regiões
regioes_poligonos = {regiao: Polygon(coords) for regiao, coords in regioes_coords_atualizadas.items()}

def determinar_regiao(row, regioes_poligonos):
    ponto = Point(row['latitude'], row['longitude'])
    
    for regiao, poligono in regioes_poligonos.items():
        if poligono.contains(ponto):
            return regiao
    return None

# Adicionar coluna de região ao dataframe
df_region['regiao'] = df_region.apply(lambda row: determinar_regiao(row, regioes_poligonos), axis=1)

In [261]:
df_region.head()

Unnamed: 0,preco,link,quartos,banheiros,vagas_de_garagem,area,condominio,iptu,endereco,cep,academia,aquecimento,ar_condicionado,area_de_servico,armarios_na_cozinha,armarios_no_quarto,banheiro_no_quarto,churrasqueira,internet,mobiliado,piscina,porteiro_24h,quarto_de_servico,salao_de_festas,tv_a_cabo,varanda,area_murada,condominio_fechado,elevador,permitido_animais,portao_eletronico,portaria,seguranca_24h,latitude,longitude,regiao
0,230000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-para-venda-vila-anchieta-2-dormitorios-sala-cozinha-com-gabinete-quintal-garage-1168282910,2,1,2,80.0,0.0,68.0,"Rua Padre Augusto Cherubini Vila Anchieta - São José do Rio Preto, SP",15050100,False,False,False,True,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,-20.798119,-49.37316,Centro
1,239000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-com-3-dormitorios-a-venda-67-m-por-r-239-000-00-residencial-morada-do-sol-sao-1228019106,3,2,2,67.0,0.0,0.0,"Rua Antônio Sérgio Fogaça Residencial Morada do Sol - São José do Rio Preto, SP",15045766,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,-20.747144,-49.394809,CEU
2,220000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-padrao-em-sao-jose-do-rio-preto-1154040388,2,2,2,120.0,0.0,0.0,"Rua Santo Inácio de Loyola Vila Anchieta - São José do Rio Preto, SP",15050140,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,-20.795802,-49.372459,Centro
3,245000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-lago-sul-bady-bassitt-1082793367,2,1,2,151.0,0.0,0.0,"Rua Independência - de 3420/3421 a 4298/4299 Vila Santo Antônio - São José do Rio Preto, SP",15014400,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,-20.821258,-49.37974,Centro
4,200000.0,https://sp.olx.com.br/regiao-de-sao-jose-do-rio-preto/imoveis/casa-em-jardim-maria-lucia--sao-jose-do-rio-preto-1225906965,2,2,3,120.0,0.0,50.0,"Rua Doutor Alceu de Assis Jardim Maria Lúcia - São José do Rio Preto, SP",15047087,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,False,-20.767672,-49.401775,Pinheirinho


In [262]:
df_region.isna().sum()

preco                     0
link                      0
quartos                   0
banheiros                 0
vagas_de_garagem          0
area                      0
condominio                0
iptu                      0
endereco                  0
cep                       0
academia                  0
aquecimento               0
ar_condicionado           0
area_de_servico           0
armarios_na_cozinha       0
armarios_no_quarto        0
banheiro_no_quarto        0
churrasqueira             0
internet                  0
mobiliado                 0
piscina                   0
porteiro_24h              0
quarto_de_servico         0
salao_de_festas           0
tv_a_cabo                 0
varanda                   0
area_murada               0
condominio_fechado        0
elevador                  0
permitido_animais         0
portao_eletronico         0
portaria                  0
seguranca_24h             0
latitude                  0
longitude                 0
regiao              

In [266]:
null_locations = df_region.loc[df_region['regiao'].isnull(),:]

In [268]:
# Criar mapa centrado em São José do Rio Preto
m = folium.Map(location=[latitude_centro, longitude_centro], zoom_start=12)

# Adicionar polígonos das regiões ao mapa
for regiao, coords in regioes_coords_atualizadas.items():
    folium.Polygon(
        locations=coords,
        color="blue",
        fill=True,
        fill_opacity=0.4,
        popup=regiao
    ).add_to(m)

# Adicionar os primeiros 100 pontos do dataframe ao mapa
for idx, row in null_locations.iterrows():
    folium.Marker(
        location=(row['latitude'], row['longitude']),
        popup=f"{row['endereco']}",
        icon=folium.Icon(icon="cloud"),
    ).add_to(m)

m.save('nulls_map.html')

In [None]:
df_region

In [None]:
df_region = df_region.dropna()

In [None]:
df_