In [1]:
from bs4 import BeautifulSoup
import requests
import csv
from collections import namedtuple
import googlemaps


In [2]:
url='https://pt.wikipedia.org/wiki/Lista_de_universidades_federais_do_Brasil'
#URL da página que vamos utilizar para puxar as informações das faculdades.

In [3]:
r=requests.get(url)
#Aqui usando a biblioteca requests, vamos fazer uma requisição para o link da Wikipedia

In [4]:
soup = BeautifulSoup(r.text, 'html.parser')
#Pegamos todo o arquivo HTML


In [5]:
tabela=soup.find('tbody')
#Aqui pego somente a parte que importa, no caso a tbody que é a que traz a lista.

In [6]:
rows=tabela.find_all('tr')

In [7]:
columns=['num','Região',
 'Unidade_federativa',
 'Nome',
 'Sigla',
 'Discentes_de_graduação',
 'Discentes_de_pós_graduação',
 'Fundação' ]

In [8]:
def lertudo():
    UF = namedtuple('UF',columns)
    for i in range(1,len(rows)):
        tds=rows[i].find_all('td')
        campo=([td.text.replace('\n','').replace('\xa0','') for td in tds])
        yield UF(*campo)
            
#Aqui faço a leitura dos campos e faço o armazenamento dos dados numa namedtuple.

it = ([(d.num, d.Região,d.Unidade_federativa,d.Nome,d.Sigla,d.Discentes_de_graduação,d.Discentes_de_pós_graduação,d.Fundação)
         for d in lertudo()])   

### def gerar_rest

Responsável pera geração dos dados dos restaurantes. Ela recebe uma lista que é a lat e long das universidades e faz uma busca pelos restaurantes próximos. A lista pode ter vários casos, no caso, precisamos de apenas 3. 

Com places_result temos o resultado da busca, no laço for fazemos a leitura dos dados, buscando pelo chave no dicionário places_result.






In [9]:
gmaps = googlemaps.Client(key = 'AIzaSyDSWmQBwzpFI_18voBBqWKZaSsHHnlqW4k')

def gerar_rest(lat):
    retorno=[]
    for i in range(len(lat)):
        places_result  = gmaps.places_nearby(location=lat[i], radius = 450, open_now =False , type = 'restaurant')
        for place in places_result['results']:
            my_place_id = place['place_id']
            my_fields = ['name']
            places_details  = gmaps.place(place_id= my_place_id , fields= my_fields)
            retorno.append((places_details['result']['name']))
        return (retorno[0:3])
#Aqui, por mais que não tenha dado certo iria trazer os restaurantes próximos, a ideia para mostrar a distância entre o restaurante 
#e a faculdade seria usar a API distancematrix, e faria uma requisição passando a talvez o nome da faculdade e o nome do restaurante
#ou a lat, long da faculdade e a do restaurante.

### def gerar_end

Responsável pera geração dos dados das universidades. Ela recebe uma lista que é o nome das universidades e faz uma busca.
Temos como retorno os dados como latitude e longitude da universidade.

In [10]:
def gerar_end(univ):
    enderecos=[]
    params={'key':'AIzaSyDSWmQBwzpFI_18voBBqWKZaSsHHnlqW4k','address':univ}
    base_url='https://maps.googleapis.com/maps/api/geocode/json?'
    response=requests.get(base_url,params=params).json() #Fazendo a requisição a API.
    response.keys()
    if response['status']=='OK':
        geometry=response['results'][0]['geometry']
        enderecos.append([geometry['location']['lat'],geometry['location']['lng']])
        
    return enderecos

#Essa parte, como na outra recebe uma lista e faz uma resquisição a API geocode, e me retorna os dados como lat e long
#da faculdade, os dados são armazenados numa lista.

In [17]:
def arrumar(lat,long,_all,i,end):
    lat=str(lat).replace('(','').replace(')','')
    long=str(long).replace('(','').replace(')','')
    end=str(end).strip('[]').replace('(','').replace(')','').replace('\u2013','').strip(',')
    wor=(str(it[i]).strip('[]').replace('(','').replace(')','').replace('"',''),lat,long,end)
    #Aqui é tão somente para tirar alguns caractéres das palavras.
    return wor

### def gerar_csv

Responsável pela criação do CSV contendo as informações necessárias.

In [18]:
def gerar_csv():
    arq = open('Atividade_Final.csv', 'w', newline='', encoding='iso-8859-1')
    #Abertura do arquivo CSV (Que sempre vai sobrescrever)
    obj = csv.writer(arq)
    head=['Número','Região','Unidade Federativa','Nome','Sigla','Discentes de graduação','Discentes de pós graduação','Fundação','Lat','Long','Restaurantes']
    #Aqui eu salvo o cabeçario das colunas.
    obj.writerow(head)
    i=0
    for u in lertudo():
        #Aqui faço a abertura da namedtuple.
        lat,long=(zip(*gerar_end(u.Nome)))
        end=gerar_rest((gerar_end(u.Nome)))
        #Aqui chamo a função que me mostra os endereços e passo como argumento a namedtuple UF com os nomes da faculdades.
        #Isso me gera um arquivo compactado, faço uso do zip* para descompactar e colocar nas respectivas variáveis
        obj.writerow(arrumar(lat,long,list(it),i,end))
        i=i+1
        #Escrevo os dados que foram gerados acima, mas antes passo pela função arrumar que vai fazer uma limpeza nos dados.
    
    arq.close()
    #O arquivo então é encerrado e a mensagem aparece.
    print("Exportação concluida.")

In [19]:
gerar_csv()




Exportação concluida.
