# Capturar os Pontos de Interesse utilizando a API do Google Maps

## Bibliotecas Usadas

In [1]:
import googlemaps as gm
import pandas as pd
import requests
import json
import time
import numpy as np
from math import sqrt
from shapely.geometry import Polygon, Point
import pyproj
import osmnx as ox
from osmnx import pois
from tqdm import tqdm

## Chave da API

Coloque sua chave de API aqui

In [2]:
chave = 'AIzaSyBi1FGvzKojekauflxTPwKjSWjycWxFefo'

## Funções

### Para fazer uma consulta

A função findPlaces faz uma consulta na API Google Places e ja retorna o resultado completo, caso os resultados tenham mais de uma página. O máximo retornado são 60 resultados por consulta (3 páginas com 20 resultados)

In [3]:
def findPlaces(APIKEY,loc=None,radius=None, pagetoken = None, type = None):
    
    #lista de resultados das consultas
    locais = []
    
    
    while True:
        
        #lat e lon do centro da circunferencia em que sera feita a busca
        lat, lng = loc
    
        #url de busca, ela foi montada usando a documentacao
        url = "https://maps.googleapis.com/maps/api/place/nearbysearch/json?location={lat},{lng}&radius={radius}&type={type}&key={APIKEY}{pagetoken}".format(lat = lat, lng = lng, radius = radius, type = type,APIKEY = APIKEY, pagetoken = "&pagetoken="+pagetoken if pagetoken else "")
        
        #fazendo a requisicao
        response = requests.get(url)
        
        #carregando o json
        res = json.loads(response.text)

        #coletando os resultados
        locais = [*locais, *res['results']]
        
        #existe proxima pagina?
        pagetoken = res.get("next_page_token",None)
        
        if not pagetoken:
            return locais
        
        #dando um tempo para nao estourar a chave
        time.sleep(6)

In [None]:
# Exemplo
# p = -3.743421, -38.536239
# raio = 1000

# dado = findPlaces(chave, loc=p, radius=raio, type='restaurant')
# print(len(dado))
    
# with open('restaurant.json', 'w') as fout:
#     json.dump(dado, fout)

### Função de conversão de coluna

Para transformar a coluna "THE_GEOM" dos limites municipais de Fortaleza de string para o tipo Poligon, foi utilizada a função abaixo

In [4]:
def Mapeador(poligono):
    limite = poligono.replace('POLYGON','').replace('(','').replace(')','')
    limite = limite.split(sep=',')
    
    pontos = []
    for ponto in limite:
        coordenada_str = ponto.split(sep=' ')[1:]
    
        pontos.append( tuple( [np.float(coordenada_str[0]), np.float(coordenada_str[1])] ) )
    return Polygon(pontos)

In [5]:
ds = pd.read_csv('limitebairro.csv')

In [6]:
ds['THE_GEOM'] = ds['THE_GEOM'].map(Mapeador)

In [7]:
ds.head()

Unnamed: 0,FID,GID,THE_GEOM,NOME
0,Limite Bairro.fid-2be50750_153af4824fe_2e1c,6,POLYGON ((-38.53981906785994 -3.79553710684326...,PASSARE
1,Limite Bairro.fid-2be50750_153af4824fe_2e1d,21,POLYGON ((-38.47933449523109 -3.72091269867228...,CAIS DO PORTO
2,Limite Bairro.fid-2be50750_153af4824fe_2e1e,22,POLYGON ((-38.46764750686253 -3.74968323005262...,CIDADE 2000
3,Limite Bairro.fid-2be50750_153af4824fe_2e1f,23,POLYGON ((-38.51716445420212 -3.76997951516616...,ALTO DA BALANCA
4,Limite Bairro.fid-2be50750_153af4824fe_2e20,17,POLYGON ((-38.56887758295916 -3.70168935573553...,BARRA DO CEARA


### Função para gerar os centros das circunferências de uma consulta

Essa função foi elaborada para, dado um poligono, gerar circunferencias com o centro dentro dele.

In [8]:
def GerarCentros(poligono, numero_de_particoes):
    minx, miny, maxx, maxy = poligono.bounds
    
    if numero_de_particoes == 1:
        centro = poligono.centroid.coords[0]
        raio = -1
        
        pc = Point(centro[0], centro[1])
        
        for ponto in [ Point(x[0], x[1]) for x in poligono.exterior.coords]:
            
            geod = pyproj.Geod(ellps='WGS84')
            _,_,raio_especulativo = geod.inv(pc.x, pc.y, ponto.x, ponto.y)
            
            
            if raio_especulativo > raio:
                raio = raio_especulativo
        
        return (raio, [centro])
                
        
        
        
    P1 = Point(maxx, maxy)
    P2 = Point(maxx, miny)
    P3 = Point(minx, miny)
    P4 = Point(minx, maxy)
    
    passo_x = ( P4.distance(P1) ) / (numero_de_particoes)
    passo_y = ( P4.distance(P3) ) / (numero_de_particoes)
    
    lat_centro = minx + (passo_x/2)
    lon_centro = miny + (passo_y/2)
    
    centros = []
    count = 0
    while lat_centro < maxx:
        lon_centro = miny + (passo_y/2)
        while lon_centro < maxy:
            
            if poligono.contains(Point(lat_centro, lon_centro)):
                centros.append( (lat_centro, lon_centro) )
            
            lon_centro += passo_y
        lat_centro += passo_x
    
    lat_centro = minx + (passo_x/2)
    lon_centro = miny + (passo_y/2)
    
    primeiro_centro = Point(lat_centro, lon_centro)
   
    origem = Point(minx, miny)
    
    geod = pyproj.Geod(ellps='WGS84')
    _,_,raio = geod.inv(primeiro_centro.x, primeiro_centro.y, origem.x, origem.y)

    return (raio, centros)

### Função para realizar buscas em um polígono

In [9]:
def BuscaPorPoligonos( APIKEY, dataset, type = None ):
    
    lista_de_poligonos = list(dataset['THE_GEOM'])
    lista_de_nomes = list(dataset['NOME'])
    
    #lista de jsons final
    RETORNO = [] 
    
    #laco para percorrer todos os bairros
    
    pbar = tqdm(total=len(lista_de_nomes))

    for nome, bairro in zip(lista_de_nomes, lista_de_poligonos):
        
        pbar.set_description("Bairro atual: {}".format(nome))
        
        
        #granularidade inicial
        granularidade = 1
        
        #flag de status
        limite_ultrapassado = False
        
        #laco para percorrer a grid gerada
        while True:
            
            #lista definitiva de buscas em uma grid
            resultado_buscas = []
            
            raio, centros = GerarCentros(bairro, granularidade)
            
            for centro in centros:
                
                p = centro[1], centro[0]
                
                #coleta de resultados de uma celula da grid
                resultado_parcial = findPlaces(APIKEY, loc=p, radius=raio, type = type)
                
                #se passou o limite
                if len(resultado_parcial) == 60:
                    limite_ultrapassado = True
                    break
                
                else:
                    resultado_buscas  = [*resultado_buscas, *resultado_parcial]
            
            if limite_ultrapassado:
                
                #voltar para fazer uma grid com celulas menores
                limite_ultrapassado = False
                granularidade += 1
            
            else:
                #sair do laco de percorrer grid
                break
        
        RETORNO = [*RETORNO, *resultado_buscas]   
        
        pbar.update(1)
    
    return RETORNO                

### Função final para consultar e salvar resultados

In [10]:
def ConsultarArquivar(chave, ds, type, arquivo_de_saida):
    
    dado = BuscaPorPoligonos(chave, ds, type = type)
    
    with open(arquivo_de_saida, 'w') as fout:
        json.dump(dado, fout)

## Captura dos Pontos de Interesse

In [11]:
path = 'Pontos de Interesse por Categoria/'

In [12]:
def CapturaPontosPorCategoria(chave, dataset, vet_categorias):   
    
    count = 0
    
    for cat in vet_categorias :
        count += 1
        output_file = path + cat + '.json'
        print(str(count) + '. ' + cat + ':\n')
        ConsultarArquivar(chave, ds, cat, output_file)

### A

Categorias:
1. accounting
* airport
* amusement_park
* aquarium
* art_gallery
* atm

In [30]:
categorias_a = ['accounting', 'airport', 'amusement_park', 'aquarium', 'art_gallery', 'atm']

CapturaPontosPorCategoria(chave, ds, categorias_a)

1. accounting:



Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  # This is added back by InteractiveShellApp.init_path()


HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. airport:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

3. amusement_park:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

4. aquarium:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

5. art_gallery:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

6. atm:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

### B

Categorias:
1. bakery
* bank
* bar
* beauty_salon
* bicycle_store
* book_store
* bowling_alley
* bus_station

In [15]:
categorias_b_1 = ['bakery', 'beauty_salon', 'bicycle_store']
categorias_b_2 = ['bank', 'bar']
categorias_b_3 = ['book_store', 'bowling_alley', 'bus_station']

In [39]:
CapturaPontosPorCategoria(chave, ds, categorias_b_1)

1. bakery:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. beauty_salon:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

3. bicycle_store:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

In [16]:
CapturaPontosPorCategoria(chave, ds, categorias_b_2)

1. bank:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. bar:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

In [17]:
CapturaPontosPorCategoria(chave, ds, categorias_b_3)

1. book_store:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. bowling_alley:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

3. bus_station:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

### C

Categorias:
1. cafe
* campground
* car_dealer
* car_rental
* car_repair
* car_wash
* casino
* cemetery
* church
* city_hall
* clothing_store
* convenience_store
* courthouse

In [13]:
categorias_c_1 = ['cafe', 'campground']
categorias_c_2 = ['car_dealer', 'car_rental', 'car_repair', 'car_wash']
categorias_c_3 = ['casino', 'cemetery', 'clothing_store']
categorias_c_4 = ['church', 'city_hall']
categorias_c_5 = ['convenience_store', 'courthouse']

In [19]:
CapturaPontosPorCategoria(chave, ds, categorias_c_1)

1. cafe:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. campground:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

In [20]:
CapturaPontosPorCategoria(chave, ds, categorias_c_2)

1. car_dealer:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. car_rental:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

3. car_repair:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

4. car_wash:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

In [21]:
CapturaPontosPorCategoria(chave, ds, categorias_c_3)

1. casino:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. cemetery:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

3. clothing_store:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

ConnectionError: HTTPSConnectionPool(host='maps.googleapis.com', port=443): Max retries exceeded with url: /maps/api/place/nearbysearch/json?location=-3.7557184756822344,-38.48925879849655&radius=103.20312780141789&type=clothing_store&key=AIzaSyAq-zpBKyxNH8Xmc4SQTfL4oTmCTaX4U20&pagetoken=CtQDxQEAAMben3zivEl2y6SdQAgJMPmBFZngJKSMxgaBh5XTkxfEULr2NaMS78FRmJtpvp26g-Tuz9-MsrXD8ya3HoUDdPCbos9frC-SGc5kB970dQvQrHF0P44GrOLtxFJ16RvajEi6Ui6n3yKCo-dkynj4m9ib2r4ispMJiQNKSVaTQQOvoJwts0UBJEhIUdb_gjpS7tJ_G4QO44FHc1gqrmcWwu1h8FWHe_FCF7RH1sPpkdjufDGojOmMQCq27bR72lCV8MPPzc98YpZu_C713ZCyTHUmzxEfuyQegTqMPJ6UYy4gpFjgIHQQY5Pu1AwebRqmm7FFIldcinqK7t68knMJcc1_F-Zc-i4ik5qQfiCS0lkcW7mkI2sBH17ayNHr-dtu51XiAGZI7ESzU1R_njrzu4bgQNVfhwcQQby6gdhIJNucKs_MqVsr6Rr6kJCm2Nm6n7Nb_kH9hb2jhEJON24rPgk-JgXlYU_B8S8YvlRLKBbBWwYia5d83Pbo0adlXU5sgofuiLOpnOvZSk0LbWAd35jsn3watjMnUiDjgMYGquwFokFboUoRHqyUKpDFjhBnjEeWeGTm8kFxrow-Tmf0K9o8uVZrqepxceWMmbhv7H03EhDgL0TuhXpgtBY03CiLQlFtGhR74StSb-qzWnXiVw5na912RbsNHg (Caused by NewConnectionError('<urllib3.connection.VerifiedHTTPSConnection object at 0x7fe6d6803390>: Failed to establish a new connection: [Errno -3] Temporary failure in name resolution'))

In [None]:
# Conexão caiu duas vezes ao consultar clothing_store
file_clothing_s = 'Pontos de Interesse por Categoria/clothing_store'
ConsultarArquivar(chave, ds, 'clothing_store', file_clothing_s)

In [14]:
CapturaPontosPorCategoria(chave, ds, categorias_c_4)

1. church:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. city_hall:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

In [15]:
CapturaPontosPorCategoria(chave, ds, categorias_c_5)

1. convenience_store:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. courthouse:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

### D 

Categorias:
1. dentist
* department_store
* doctor
* drugstore

In [17]:
categorias_d_1 = ['dentist', 'department_store']
categorias_d_2 = ['doctor', 'drugstore']

In [18]:
CapturaPontosPorCategoria(chave, ds, categorias_d_1)

1. dentist:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. department_store:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

In [20]:
CapturaPontosPorCategoria(chave, ds, categorias_d_2)

1. doctor:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. drugstore:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

### E

Categorias:
1. electrician
* electronics_store
* embassy

In [15]:
categorias_e_1 = ['electrician']
categorias_e_2 = ['electronics_store', 'embassy']

In [14]:
CapturaPontosPorCategoria(chave, ds, categorias_e_1)

1. electrician:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. electronics_store:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

ConnectionError: ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))

In [16]:
CapturaPontosPorCategoria(chave, ds, categorias_e_2)

1. electronics_store:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. embassy:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

### F
Categorias:
1. fire_station
* florist
* funeral_home
* furniture_store


In [18]:
categorias_f_1 = ['fire_station', 'florist']
categorias_f_2 = ['funeral_home', 'furniture_store']

In [19]:
CapturaPontosPorCategoria(chave, ds, categorias_f_1)

1. fire_station:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. florist:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

In [20]:
CapturaPontosPorCategoria(chave, ds, categorias_f_2)

1. funeral_home:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. furniture_store:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

### G
Categorias:
1. gas_station
* grocery_or_supermarket
* gym


In [13]:
categorias_g_1 = ['gas_station']
categorias_g_2 = ['gym']
categorias_g_3 = ['grocery_or_supermarket']

In [22]:
CapturaPontosPorCategoria(chave, ds, categorias_g_1)

1. gas_station:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. gym:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

ConnectionError: ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))

In [17]:
CapturaPontosPorCategoria(chave, ds, categorias_g_2)

1. gym:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

In [18]:
CapturaPontosPorCategoria(chave, ds, categorias_g_3)

1. grocery_or_supermarket:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

### H
Categorias:
1. hair_care
* hardware_store
* hindu_temple
* home_goods_store
* hospital

In [19]:
categorias_h_1 = ['hair_care']
categorias_h_2 = ['hardware_store', 'hindu_temple']
categorias_h_3 = ['home_goods_store', 'hospital']

In [21]:
CapturaPontosPorCategoria(chave, ds, categorias_h_1)

1. hair_care:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

In [23]:
CapturaPontosPorCategoria(chave, ds, categorias_h_2)

1. hardware_store:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. hindu_temple:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

In [24]:
CapturaPontosPorCategoria(chave, ds, categorias_h_3)

1. home_goods_store:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. hospital:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

### I
Categoria:
1. insurance_agency

In [25]:
categoria_i = ['insurance_agency']

In [26]:
CapturaPontosPorCategoria(chave, ds, categoria_i)

1. insurance_agency:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

### J
Categoria:
1. jewelry_store

In [27]:
categoria_j = ['jewelry_store']

In [28]:
CapturaPontosPorCategoria(chave, ds, categoria_j)

1. jewelry_store:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

### L
Categorias:
1. laundry
* lawyer
* library
* light_rail_station
* liquor_store
* local_government_office
* locksmith
* lodging

In [32]:
categorias_j_1 = ['laundry']
categorias_j_2 = ['lawyer', 'library', 'light_rail_station']
categorias_j_3 = ['liquor_store', 'local_government_office', 'locksmith', 'lodging']

In [31]:
CapturaPontosPorCategoria(chave, ds, categorias_j_1)

1. laundry:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

2. lawyer:



HBox(children=(IntProgress(value=0, max=119), HTML(value='')))

ConnectionError: ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))

In [None]:
CapturaPontosPorCategoria(chave, ds, categorias_j_2)