# Importar as Biblioteas 

In [None]:
import os
import time
import json
import fiona
import urllib
import shapely
import requests
import psycopg2
import geoalchemy2
import pandas as pd
import geopandas as gpd
from selenium import webdriver
from sqlalchemy import create_engin
from selenium.webdriver.common.by import By
from pyproj import Proj, transform, Transformer
from selenium.webdriver.common.keys import Keys 

# Funções para Extração dos Dados

- Pega as categorias, faz a pesquisa, cria os arquivos e junta eles tranformandos em excel

In [None]:
keywords = ['dentista', 'clínica de estética'] # aqui vc coloca as categorias que quer pesquisar 

for keyword in keywords:


    def csv_to_point(non_spatial_data):

        #crie o geodataframe e exporte-o como um arquivo de ponto
        del non_spatial_data['Tags']
        spatial_df = gpd.GeoDataFrame(non_spatial_data, geometry=gpd.points_from_xy(non_spatial_data.Longitude, non_spatial_data.Latitude))
        spatial_df.to_csv("point_data.csv")
        print(spatial_df)
        spatial_df.to_file("point_data.shp")

        #cria um arquivo de projeção que corresponde ao local de onde os dados foram retirados
        prj = open("point_data.prj", "w")
        epsg = 'GEOGCS["GCS_WGS_1984",DATUM["D_WGS_1984",SPHEROID["WGS_1984",6378137,298.257223563]],PRIMEM["Greenwich",0],UNIT["Degree",0.017453292519943295]]'
        prj.write(epsg)
        prj.close()

        return(spatial_df)

    def find_locations(search_url, api_key):


        #lista de listas para todos os dados
        final_data = []

        #while loop para solicitar e analisar os arquivos JSON solicitados
        while True:
            respon = requests.get(search_url)
            jj = json.loads(respon.text)
            results = jj['results']
            #analise todas as informações necessárias
            for result in results:
                name = result['name']
                place_id = result ['place_id']
                lat = result['geometry']['location']['lat']
                longi = result['geometry']['location']['lng']
                rating = result['rating']
                types = result['types']
                data = [name, place_id, lat, longi, rating, types]
                final_data.append(data)
            
             #se houver uma próxima página, o loop será reiniciado com uma url atualizada
             #se não houver próxima página, o programa grava em um csv e salva em df    
            if 'next_page_token' not in jj:
                labels = ['Place Name','ID_Field', 'Latitude', 'Longitude', 'Rating', 'Tags']
                location_df = pd.DataFrame.from_records(final_data, columns=labels)
                location_df.to_csv('location.csv')
                break
            else:
                next_page_token = jj['next_page_token']
                search_url = 'https://maps.googleapis.com/maps/api/place/nearbysearch/json?key='+str(api_key)+'&pagetoken='+str(next_page_token)

        return(final_data, location_df)

    def find_details(final_data, api_key):

        final_detailed_data =[]

        #Usa o ID exclusivo de cada local para usar outra solicitação de API para obter informações de telefone e site de cada empresa.
        for places in final_data:
            id_field = places[1]
            req_url = 'https://maps.googleapis.com/maps/api/place/details/json?place_id='+str(id_field)+'&fields=name,formatted_phone_number,website&key='+str(api_key)
            respon = requests.get(req_url)
            jj = json.loads(respon.text)
            print(jj)
            results = jj['result']
            identification = id_field
            try:
                phone = results["formatted_phone_number"]
            except KeyError:
                continue
            try:
                website = results["website"]
            except KeyError:
                continue
            title = results["name"]
            detailed_data = [title, identification, phone, website]
            final_detailed_data.append(detailed_data)

        columns = ["Business", "ID_Field","Phone", "Website"]
        details_df = pd.DataFrame.from_records(final_detailed_data, columns=columns)
        details_df.to_csv('further_details.csv')
        
        return details_df

    def join_data(details_df,location_df):

        final_sheet = location_df.join(details_df.set_index('ID_Field'), on='ID_Field')

        final_sheet.to_csv(str(keyword) + ".csv")

        print(final_sheet)

        return final_sheet

        
    def main():
        #assigning Parâmetros para pesquisa de localização
        api_key = 'AIzaSyBBnqihmtHiPEWREzUzFEiAd0yhkjtvsGo' #AQUI api do google maps 
        search_radius = '100000'
        
        coords = '-26.996527444438925, -48.62762931857461' # AQUI vc tem que colocar as cordenadas do lugar onde quer pesquisar
        request_url = 'https://maps.googleapis.com/maps/api/place/nearbysearch/json?location='+coords+'&radius='+str(search_radius)+'&keyword='+str(keyword)+'&key='+str(api_key)

        #encontre os locais dos estabelecimentos desejados no google maps
        final_data, location_df = find_locations(request_url, api_key)

        #encontre site, telefone e avaliações de estabelecimentos
        details_df = find_details(final_data, api_key)

        #junte os dois dataframes para ter um produto final
        non_spatial_data = join_data(details_df,location_df)

        spatial_df = csv_to_point(non_spatial_data)



    if __name__ == "__main__":
        main()



In [None]:
#COLOCAR O LOCAL ONDE ESTÁ OS EXCELS SALVOS
path = r'C:\####\###\####\###\###'  

# use compreensão de lista para criar uma lista de arquivos csv
csv_files = [file for file in os.listdir(path) if file.endswith('.csv')]

# cria uma lista vazia para armazenar os DataFrames
df_list = []

# iterar pelos arquivos csv
for csv_file in csv_files:
    # lê o arquivo csv atual em um DataFrame
    df = pd.read_csv(os.path.join(path, csv_file))
    # adiciona uma nova coluna 'file_name' com o nome do arquivo csv atual
    df['name'] = os.path.basename(csv_file)
    # anexa o DataFrame atual à lista
    df_list.append(df)

# concatenar todos os DataFrames em um único DataFrame
merged_df = pd.concat(df_list)

# grava o DataFrame mesclado em um novo arquivo csv
merged_df.to_excel("all.xlsx", index=False) 

In [None]:
contatos = pd.read_excel('all.xlsx')
contatos

# Envio de mensagem

In [None]:
driver_path = '/####/###/####/chromedriver_win32/chromedriver.exe' #AQUI coloca onde está seu chromedriver

navegador = webdriver.Chrome(driver_path)

navegador.get("https://web.whatsapp.com/") # abre o whatsapp web

while len(navegador.find_elements(By.ID,"side")) < 1: # espera ate logar
    time.sleep(1)

# envia a mensagem 
for i, mensagem in enumerate(contatos['Mensagem']):
    numero = contatos.loc[i,"Phone"]
    nome = contatos.loc[i,"Place Name"]
    texto = urllib.parse.quote(f"Oi {nome}! {mensagem}")
    link = f"https://web.whatsapp.com/send?phone={numero}&text={texto}"
    navegador.get(link)
   
    while len(navegador.find_elements(By.ID,"side")) < 1:
        time.sleep(1)

    navegador.find_element(By.XPATH,'//*[@id="main"]/footer/div[1]/div/span[2]/div/div[2]/div[1]/div/div[1]/p').send_keys(Keys.ENTER)
    time.sleep(10) # Aqui voce coloca o tempo de espera da mensagem