In [113]:
import pandas as pd

file_path = '../data/Lista_imoveis_geral.csv'
# Lê o arquivo ignorando as duas primeiras linhas e definindo a terceira como cabeçalho
df = pd.read_csv(
    file_path,
    sep=';',               # Especifica o delimitador de campo
    encoding='latin1',     # Define a codificação para evitar erros de caracteres especiais
    skiprows=2,            # Pula as duas primeiras linhas
)

# Exibe as primeiras linhas para verificar o DataFrame
df.head()

Unnamed: 0,N° do imóvel,UF,Cidade,Bairro,Endereço,Preço,Valor de avaliação,Desconto,Descrição,Modalidade de venda,Link de acesso
0,10176203,AC,CRUZEIRO DO SUL,SABOEIRO,"RUA DO BREU, N. SN, QT 502 LT 01","194.712,83","318.000,00",38.77,"Terreno, 0.00 de área total, 0.00 de área priv...",Venda Direta Online,https://venda-imoveis.caixa.gov.br/sistema/det...
1,10176204,AC,CRUZEIRO DO SUL,SABOEIRO,"RUA DO BREU, N. SN, QT 602 LT 01","194.712,83","318.000,00",38.77,"Terreno, 0.00 de área total, 0.00 de área priv...",Venda Direta Online,https://venda-imoveis.caixa.gov.br/sistema/det...
2,1444419970935,AC,CRUZEIRO DO SUL,ZONA RURAL,"ESTRADA DO CANELA FINA, N. SN, PARTE 19, DESME...","250.000,00","250.000,00",0.0,"Terreno, 0.00 de área total, 0.00 de área priv...",Leilão SFI - Edital Único,https://venda-imoveis.caixa.gov.br/sistema/det...
3,1555537633582,AC,RIO BRANCO,CONJUNTO BELA VISTA,"RUA JAIME PEREIRA, N. 114, QUADRA 11 LOTE 10","238.133,72","400.000,00",40.47,"Casa, 0.00 de área total, 316.00 de área priva...",Venda Online,https://venda-imoveis.caixa.gov.br/sistema/det...
4,10170137,AC,RIO BRANCO,MORADA DO SOL,"ESTRADA DA USINA, N. S/N, AO LADO DO RESIDENCI...","290.844,64","475.000,00",38.77,"Terreno, 0.00 de área total, 0.00 de área priv...",Venda Direta Online,https://venda-imoveis.caixa.gov.br/sistema/det...


In [125]:
import re
from datetime import datetime

def get_data_geracao(file_path):
    data_geracao = None  # Valor padrão caso não encontre a data

    with open(file_path, 'r', encoding='latin1') as file:
        for line in file:
            date_match = re.search(r'\d{2}/\d{2}/\d{4}', line)
            if date_match:
                data_geracao = datetime.strptime(date_match.group(), "%d/%m/%Y").strftime("%d/%m/%Y")
                break  # Interrompe a leitura ao encontrar a data

    if data_geracao is None:
        raise ValueError("Data de geração não encontrada no arquivo.")
    
    return data_geracao
# Exibe a data extraída
print("Data de geração:", get_data_geracao(file_path))

Data de geração: 06/11/2024


In [115]:
# Função para extrair rua e número
def extract_street_and_number(address):
    # Expressão regular para encontrar o padrão de rua e número
    match = re.match(r'([A-Za-z\s\d\.]+),\s*N\.\s*(\d+|SN)', address)
    match = re.match(r'(.+?),\s*N\.\s*(\d+|SN)', address)
    
    if match:
        street = match.group(1).strip()
        number = match.group(2).strip()
        return street, number
    else:
        return "Desconhecido", "Desconhecido"  # Retorna None caso não encontre o padrão

# Aplicar a função para extrair rua e número
df[['Rua', 'Número']] = df['Endereço'].apply(lambda x: pd.Series(extract_street_and_number(x)))

df.head()


Unnamed: 0,N° do imóvel,UF,Cidade,Bairro,Endereço,Preço,Valor de avaliação,Desconto,Descrição,Modalidade de venda,Link de acesso,Rua,Número
0,10176203,AC,CRUZEIRO DO SUL,SABOEIRO,"RUA DO BREU, N. SN, QT 502 LT 01","194.712,83","318.000,00",38.77,"Terreno, 0.00 de área total, 0.00 de área priv...",Venda Direta Online,https://venda-imoveis.caixa.gov.br/sistema/det...,RUA DO BREU,SN
1,10176204,AC,CRUZEIRO DO SUL,SABOEIRO,"RUA DO BREU, N. SN, QT 602 LT 01","194.712,83","318.000,00",38.77,"Terreno, 0.00 de área total, 0.00 de área priv...",Venda Direta Online,https://venda-imoveis.caixa.gov.br/sistema/det...,RUA DO BREU,SN
2,1444419970935,AC,CRUZEIRO DO SUL,ZONA RURAL,"ESTRADA DO CANELA FINA, N. SN, PARTE 19, DESME...","250.000,00","250.000,00",0.0,"Terreno, 0.00 de área total, 0.00 de área priv...",Leilão SFI - Edital Único,https://venda-imoveis.caixa.gov.br/sistema/det...,ESTRADA DO CANELA FINA,SN
3,1555537633582,AC,RIO BRANCO,CONJUNTO BELA VISTA,"RUA JAIME PEREIRA, N. 114, QUADRA 11 LOTE 10","238.133,72","400.000,00",40.47,"Casa, 0.00 de área total, 316.00 de área priva...",Venda Online,https://venda-imoveis.caixa.gov.br/sistema/det...,RUA JAIME PEREIRA,114
4,10170137,AC,RIO BRANCO,MORADA DO SOL,"ESTRADA DA USINA, N. S/N, AO LADO DO RESIDENCI...","290.844,64","475.000,00",38.77,"Terreno, 0.00 de área total, 0.00 de área priv...",Venda Direta Online,https://venda-imoveis.caixa.gov.br/sistema/det...,Desconhecido,Desconhecido


In [117]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 27817 entries, 0 to 27816
Data columns (total 13 columns):
 #   Column               Non-Null Count  Dtype  
---  ------               --------------  -----  
 0    N° do imóvel        27817 non-null  int64  
 1   UF                   27817 non-null  object 
 2   Cidade               27817 non-null  object 
 3   Bairro               27817 non-null  object 
 4   Endereço             27817 non-null  object 
 5   Preço                27817 non-null  object 
 6   Valor de avaliação   27817 non-null  object 
 7   Desconto             27817 non-null  float64
 8   Descrição            27817 non-null  object 
 9   Modalidade de venda  27817 non-null  object 
 10  Link de acesso       27817 non-null  object 
 11  Rua                  27817 non-null  object 
 12  Número               27817 non-null  object 
dtypes: float64(1), int64(1), object(11)
memory usage: 2.8+ MB


In [None]:
from geopy.geocoders import Nominatim
from geopy.exc import GeocoderTimedOut
from geopy.extra.rate_limiter import RateLimiter
import time

# Carregar o CSV
df_coord = df

# Função para geocodificar com RateLimiter
def get_coordinates(row):
    # Concatena as colunas para formar o endereço completo
    address_completo = f"{row['Rua']},{row['Número']}, {row['Bairro']}, {row['Cidade']}, {row['UF']}, Brazil"
    address_sem_num = f"{row['Rua']}, {row['Bairro']}, {row['Cidade']}, {row['UF']}, Brazil"
    address_bairro = f"{row['Bairro']}, {row['Cidade']}, {row['UF']}, Brazil"
    address_cidade = f"{row['Cidade']}, {row['UF']}, Brazil"
    
    # Instancia o geolocalizador
    geolocator = Nominatim(user_agent="geolocator")
    geocode = RateLimiter(geolocator.geocode, min_delay_seconds=1)  # Delay de 1 segundo

    # Função auxiliar para tentar geocodificar com tratamento de timeout
    def try_geocode(address):
        try:
            location = geocode(address)
            return location.latitude, location.longitude if location else (None, None)
        except GeocoderTimedOut:
            print(f"Timeout para o endereço: {address}")
            return None, None

    # Tenta geocodificar o endereço completo
    latitude, longitude = try_geocode(address_completo)
    if latitude and longitude:
        return latitude, longitude

    # Tenta geocodificar o endereço sem número
    latitude, longitude = try_geocode(address_sem_num)
    if latitude and longitude:
        return latitude, longitude

    # Tenta geocodificar o bairro
    latitude, longitude = try_geocode(address_bairro)
    if latitude and longitude:
        return latitude, longitude

    # Tenta geocodificar a cidade
    latitude, longitude = try_geocode(address_cidade)
    if latitude and longitude:
        return latitude, longitude

    # Se nenhuma tentativa teve sucesso, retorna None
    return None, None


# Criar uma lista para armazenar as coordenadas
coordenadas = []

# Iterar sobre o DataFrame e geocodificar os endereços

for _, row in df_coord.iterrows():
    lat, lon = get_coordinates(row)
    coordenadas.append((lat, lon))
    time.sleep(1)  # Atraso de 1 segundo entre as requisições para evitar rate limit

# Adicionar as coordenadas ao DataFrame
df_coord['Latitude'] = [coord[0] for coord in coordenadas]
df_coord['Longitude'] = [coord[1] for coord in coordenadas]

# Mostrar o DataFrame com as coordenadas
df_coord.head()


In [None]:
df_coord.to_csv('../data/lista_imoveis_geral_coordenadas.csv')

In [None]:
import folium

save_script = """
<script>
    function saveProperty(imovelId) {
        fetch('/save_property', {
            method: 'POST',
            headers: {
                'Content-Type': 'application/json',
            },
            body: JSON.stringify({ id: imovelId }),
        }).then(response => {
            if (response.ok) {
                alert('Imóvel salvo com sucesso!');
            } else {
                alert('Erro ao salvar imóvel.');
            }
        });
    }
</script>
"""

# Função para adicionar marcadores de imóveis ao mapa
def adicionar_marcadores(map, df):
    for _, row in df.iterrows():
        popup_content = f"""
            <strong>Descrição:</strong> : {row['Descrição']}<br>
            <strong>Endereço:</strong> {row['Endereço']}<br>
            <strong>Bairro:</strong> {row['Bairro']}<br>
            <strong>Cidade:</strong> {row['Cidade']}<br>
            <strong>UF:</strong> {row['UF']}<br>
            <strong>Preço:</strong> R$ {row['Preço']}<br>
            <strong>Valor de avaliação:</strong> R$ {row['Valor de avaliação']}<br>
            <strong>Desconto:</strong> {row['Desconto']}%<br>
            <strong>Modalidade de venda:</strong> : {row['Modalidade de venda']}<br>
            <strong>Link de acesso:</strong> : <a href="{row['Link de acesso']}" target="_blank">Mais informações</a>
        """
        folium.Marker(
            location=[row['Latitude'], row['Longitude']],
            popup=folium.Popup(popup_content, max_width=300)
        ).add_to(map)

# Configuração do mapa centralizado na média das coordenadas
centro_lat = df_coord['Latitude'].mean()
centro_lon = df_coord['Longitude'].mean()
mapa = folium.Map(location=[centro_lat, centro_lon], zoom_start=8)

# Criação de grupos de imóveis filtrados por modalidade
modalidades = df_coord['Modalidade de venda'].unique()

for modalidade in modalidades:
    grupo_modalidade = folium.FeatureGroup(name=f"Modalidade: {modalidade}")
    mapa.add_child(grupo_modalidade)

    # Filtra os imóveis por modalidade
    df_modalidade = df_coord[df_coord['Modalidade de venda'] == modalidade]

    # Adiciona os marcadores de imóveis dessa modalidade
    adicionar_marcadores(grupo_modalidade, df_modalidade)

# Adiciona controle de camadas para o usuário escolher a modalidade de venda
folium.LayerControl(collapsed=False).add_to(mapa)

# Salva o mapa em um arquivo HTML
mapa.save("html/mapa_imoveis_leilao_geral.html")

print("Mapa gerado e salvo como 'mapa_imoveis_leilao_geral.html'")

Mapa gerado e salvo como 'mapa_imoveis_leilao.html'


In [110]:
def get_coordinates_str(str):
    # Concatena as colunas para formar o endereço completo
    address = str
    # Instancia o geolocalizador
    geolocator = Nominatim(user_agent="geolocator")
    
    # Usando o RateLimiter para evitar atingir o limite de requisições
    geocode = RateLimiter(geolocator.geocode, min_delay_seconds=1)  # Delay de 1 segundo
    
    try:
        # Geocodificando o endereço completo
        location = geocode(address)
        
        if location:
            return location.latitude, location.longitude
        
        # Se não encontrou nenhuma das opções, retorna None
        return None, None

    except GeocoderTimedOut:
        # Caso de timeout, retorna None
        print(f"Timeout para o endereço: {address}")
        return None, None
    
[lat, lon] = get_coordinates_str(' BOEHMERWALDT, JOINVILLE, SC')
print(lat, lon)

-26.3630351 -48.823415313817165
