# Como utilizar a API Pytrends

Para detalhes mais teóricos, veja o README no github sobre o PyTrends: [README](https://github.com/larissafv/grupoa/tree/master/Tutoriais/PyTrends)

## PARTE 1: Funções básicas

### Instalações e Biblitecas usadas

O comando abaixo instala a biblioteca da API. Pode ser executado como uma célula do notebook, ou pode ser colado no terminal do sistema operacional, sem o ponto de exclamação (!) do início.

In [None]:
!pip install pytrends

In [1]:
from pytrends.request import TrendReq #importa a biblioteca pytrends
import pandas as pd #alguns resultados são retornados em pandas.DataFrame

### Conexão com o GoogleTrends

In [2]:
pytrends = TrendReq(hl='pt-BR', tz=3) #define a hostlanguage e a timezone (fuso horário) de pesquisa

In [3]:
kw_list = ['gripe', 'falta de ar', 'tosse', 'paladar', 'swab'] #definição dos termos de pesquisa. kw = keywords (palavras-chave)

pytrends.build_payload(kw_list, cat=0, timeframe='today 12-m', geo='', gprop='') #construimos a solicitação de pesquisa 

### Métodos da API

In [4]:
pytrends.interest_over_time() #retorna o interesse em relação ao tempo das palavas buscadas

Unnamed: 0_level_0,gripe,falta de ar,tosse,paladar,swab,isPartial
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2019-09-08,11,2,10,2,3,False
2019-09-15,11,2,10,3,3,False
2019-09-22,11,2,10,2,3,False
2019-09-29,11,2,10,2,3,False
2019-10-06,11,1,10,2,3,False
2019-10-13,11,2,11,2,3,False
2019-10-20,12,2,10,2,3,False
2019-10-27,11,2,10,2,3,False
2019-11-03,12,2,9,2,3,False
2019-11-10,11,1,9,3,3,False


In [5]:
pytrends.get_historical_interest(kw_list, year_start=2020, month_start=9, day_start=1, hour_start=0, year_end=2020, month_end=9, day_end=2, hour_end=0, cat=0, geo='BR', gprop='', sleep=0)
#retorna o interesse a cada hora de pesquisa numa data qualquer 

Unnamed: 0_level_0,gripe,falta de ar,tosse,paladar,swab,isPartial
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2020-09-01 00:00:00,42,25,38,16,6,False
2020-09-01 01:00:00,39,28,44,17,5,False
2020-09-01 02:00:00,37,35,47,14,4,False
2020-09-01 03:00:00,38,42,52,17,4,False
2020-09-01 04:00:00,39,51,65,14,20,False
2020-09-01 05:00:00,45,51,87,13,3,False
2020-09-01 06:00:00,43,62,88,18,5,False
2020-09-01 07:00:00,52,64,95,10,2,False
2020-09-01 08:00:00,42,36,74,9,6,False
2020-09-01 09:00:00,43,21,53,11,6,False


In [9]:
pytrends.interest_by_region(resolution='COUNTRY', inc_low_vol=True)
#retorna o interesse em relação á região

Unnamed: 0_level_0,gripe,falta de ar,tosse,paladar,swab
geoName,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
Afeganistão,0,0,0,0,100
Albânia,25,0,62,0,13
Alemanha,47,1,21,4,27
Andorra,100,0,0,0,0
Angola,50,5,41,4,0
...,...,...,...,...,...
Zimbábue,43,0,0,0,57
Zâmbia,35,0,0,0,65
África do Sul,57,0,1,0,42
Áustria,54,0,15,4,27


In [7]:
pytrends.related_queries() #retorna termos relacionados à pesquisa
pytrends.related_topics()  #retorna tópicos relacionados (só funciona com um termo na kw_list por vez)
pytrends.trending_searches(pn='brazil') #retorna os termos mais procurados do momento
pytrends.suggestions('gripe') #sugere outros assuntos (funciona de forma independente da solicitação de pesquisa pytrends)

[{'mid': '/m/0cycc', 'title': 'Gripe', 'type': 'Doença'},
 {'mid': '/m/01c751', 'title': 'Gripe espanhola', 'type': 'Pandemia'},
 {'mid': '/m/057c6k', 'title': 'Gripe suína', 'type': 'Doença'},
 {'mid': '/m/05zs0_7',
  'title': 'Pandemia de gripe A',
  'type': 'Pandemia de gripe'},
 {'mid': '/m/0416v7', 'title': 'Vacina contra a gripe', 'type': 'Vacina'}]

***OBS: É importante lembrar que a construção de uma solicitação de pesquisa com uma lista direta de palavras, leva a API a retornar o interesse comparado de termos.***

***Por isso, estamos definindo na Parte 2 funções que podem retornar o interesse individual de uma lista de palavras.***

## PARTE 2: Implementação de funções   

### Como adquirir dados de pesquisa individual de termos em uma localidade pré-determinada

In [8]:
listkeywords = ['olfato','tosse','paladar','garganta','falta de ar']
liststate = ['BR-AC','BR-AL','BR-AP','BR-AM','BR-BA','BR-CE','BR-DF','BR-ES','BR-GO','BR-MA','BR-MT','BR-MS','BR-MG','BR-PA','BR-PB','BR-PR','BR-PE','BR-PI','BR-RJ','BR-RN','BR-RS','BR-RO','BR-RR','BR-SC','BR-SP','BR-SE','BR-TO']
#definição dos termos de pesquisa o dos códigos geográficos usados pela API

In [9]:
datarequest = TrendReq(hl='pt-BR', tz=3)
#realizamos uma nova conexão por questões de organização

In [10]:
def gerarcsv1(listkw, georef, timef): 
    data = pd.DataFrame()
    for i in listkw:
        newkw = []
        newkw.append(i)
        datarequest.build_payload(newkw, cat=0, timeframe=timef, geo=georef ,gprop='')
        if data.empty:
            data = datarequest.interest_over_time().drop(columns=['isPartial'])
        else:
            data = data.merge(datarequest.interest_over_time(), how = 'inner', on = 'date').drop(columns=['isPartial'])
            
    data.to_csv('googletrends'+'_'+georef+'.csv',index=True)
    return data
        

In [11]:
result_one = gerarcsv1(listkeywords,'BR-MG','2017-11-01 2018-07-19')
result_one

Unnamed: 0_level_0,olfato,tosse,paladar,garganta,falta de ar
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
2017-11-01,35,18,53,54,24
2017-11-02,42,27,52,55,58
2017-11-03,38,37,46,40,29
2017-11-04,0,24,44,51,58
2017-11-05,84,23,26,60,44
...,...,...,...,...,...
2018-07-15,0,92,58,79,0
2018-07-16,35,73,36,76,32
2018-07-17,34,64,21,70,23
2018-07-18,0,67,21,62,47


### Como adquirir dados de pesquisa de termos individuais por Estado

In [13]:
def gerarcsv2(listkw, listgr, timef): 
    data = pd.DataFrame()
    for i in listkw:
        newkw = []
        newkw.append(i)
        auxiliar = pd.DataFrame()
        for j in range(len(listgr)):
            datarequest.build_payload(newkw, cat=0, timeframe=timef, geo=listgr[j] ,gprop='')
            if auxiliar.empty:
                auxiliar = datarequest.interest_over_time().assign(UF = listgr[j].split('-')[1]).drop(columns=['isPartial'])
            else:
                auxiliar = auxiliar.append(datarequest.interest_over_time().assign(UF = listgr[j].split('-')[1])).drop(columns=['isPartial'])
        if data.empty:
            data = auxiliar.copy(deep=True)
        else:
            data = data.merge(auxiliar,how = 'inner', left_on = ['date','UF'], right_on = ['date','UF'])

    data.to_csv('googletrends_por_estado.csv',index=True)
    return data

In [14]:
result_two = gerarcsv2(listkeywords,liststate,'2017-11-01 2018-07-19')
result_two

Unnamed: 0_level_0,olfato,UF,tosse,paladar,garganta,falta de ar
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2017-11-01,0,AC,42,0,37,0
2017-11-02,0,AC,0,0,0,0
2017-11-03,0,AC,0,0,40,0
2017-11-04,0,AC,0,0,0,0
2017-11-05,0,AC,0,0,0,0
...,...,...,...,...,...,...
2018-07-15,0,TO,0,0,100,0
2018-07-16,0,TO,0,0,34,47
2018-07-17,0,TO,60,0,64,0
2018-07-18,0,TO,0,0,32,0
