# 02 - API, XML e Notícias

### Quais notícias falaram sobre a Marcha do Empoderamento Crespo em Salvador?

<img src="imagens/marcha.png">

Onde achar essa informação?
- [Google News RSS](https://news.google.com/rss/search?q=marcha%20empoderamento%20salvador&hl=pt-BR&gl=BR&ceid=BR:pt-419
)

#### Vamos começar!

In [1]:
import requests

#### Definindo urls e chaves de busca

In [2]:
url = 'https://news.google.com/rss/search?q='

In [3]:
chave_busca = ['"marcha" and "crespo" and "salvador"',
               '"marcha" and "empoderamento" and  "crespo" and "salvador"',
               '"marcha" and "empoderamento crespo" and "salvador"']

In [4]:
parametros = '&hl=pt-BR&gl=BR&ceid=BR:pt-419'

In [5]:
url_final = url + chave_busca[0] + parametros
url_final

'https://news.google.com/rss/search?q="marcha" and "crespo" and "salvador"&hl=pt-BR&gl=BR&ceid=BR:pt-419'

#### Vamos testar? 

Fazendo uma requisição no rss e pesquisando pela primeira chave de busca

In [6]:
response = requests.get(url_final)

In [7]:
response.status_code

200

#### Beleza! Mas qual é o resultado dessa requisição?

In [8]:
response.content

b'<?xml version="1.0" encoding="UTF-8" standalone="yes"?><rss version="2.0" xmlns:media="http://search.yahoo.com/mrss/"><channel><generator>NFE/5.0</generator><title>""marcha" and "crespo" and "salvador"" - Google Not\xc3\xadcias</title><link>https://news.google.com/search?q=%22marcha%22+and+%22crespo%22+and+%22salvador%22&amp;hl=pt-BR&amp;gl=BR&amp;ceid=BR:pt-419</link><language>pt-BR</language><webMaster>news-webmaster@google.com</webMaster><copyright>2019 Google Inc.</copyright><lastBuildDate>Tue, 26 Nov 2019 16:44:01 GMT</lastBuildDate><description>Google Not\xc3\xadcias</description><item><title>Mestre Moa do Katend\xc3\xaa ter\xc3\xa1 escultura no Dique do Toror\xc3\xb3 - Jornal Correio</title><link>https://www.correio24horas.com.br/noticia/nid/mestre-moa-do-katende-tera-escultura-no-dique-do-tororo/</link><guid isPermaLink="false">CAIiEKcyCP6RPHxlSCWPjm7QSyAqGQgEKhAIACoHCAow1uGNCzDOg6ADMO6lqQY</guid><pubDate>Mon, 25 Nov 2019 20:37:00 GMT</pubDate><description>&lt;a href="https:/

#### Igualzinho a um csv, né?

<img src="https://media.giphy.com/media/fpXxIjftmkk9y/giphy.gif" align="left">

#### Vamos precisar de ajuda aqui...

In [9]:
from xml.etree import ElementTree

In [10]:
tree = ElementTree.fromstring(response.content)

In [11]:
type(tree)

xml.etree.ElementTree.Element

In [12]:
tree.tag

'rss'

In [13]:
tree.find('channel').findtext('title')

'""marcha" and "crespo" and "salvador"" - Google Notícias'

In [14]:
channel = tree.find('channel')

In [15]:
noticias = channel.getchildren()
len(noticias)

59

In [16]:
noticias = noticias[8:]

In [17]:
len(noticias)

51

In [18]:
for noticia in noticias:
    print('    ')
    print("Titulo: " + noticia.findtext('title'))
    print("Data da Publicação: " + noticia.findtext('pubDate'))
    print("Link: " + noticia.findtext('link'))
    print("Canal: " + noticia.findtext('source'))

    
Titulo: Mestre Moa do Katendê terá escultura no Dique do Tororó - Jornal Correio
Data da Publicação: Mon, 25 Nov 2019 20:37:00 GMT
Link: https://www.correio24horas.com.br/noticia/nid/mestre-moa-do-katende-tera-escultura-no-dique-do-tororo/
Canal: Jornal Correio
    
Titulo: Dia da Consciência Negra: confira a programação completa - A Tarde On Line
Data da Publicação: Wed, 20 Nov 2019 09:00:00 GMT
Link: http://atarde.uol.com.br/bahia/noticias/2109499-dia-da-consciencia-negra-confira-a-programacao-completa
Canal: A Tarde On Line
    
Titulo: É preciso encrespar! Marcha influencia cabeças no Centro da cidade - Jornal Correio
Data da Publicação: Sun, 09 Dec 2018 08:00:00 GMT
Link: https://www.correio24horas.com.br/noticia/nid/e-preciso-encrespar-marcha-influencia-cabecas-no-centro-da-cidade/
Canal: Jornal Correio
    
Titulo: Cultura às 14:51 Quarta edição da Marcha do Empoderamento Crespo acontece no próximo domingo Da - A Tarde On Line
Data da Publicação: Thu, 29 Nov 2018 08:00:00 G

## Organizando nosso script

#### Criando um método

Primeiro vamos juntar o que fizemos em células separadas lá em cima em um método chamado pesquisar notícias

In [19]:
def pesquisar_noticias(string):
    
    print('\n>>>>>>>>>>>>>>>>> Extraindo notícias para a string {0}'.format(string))
    url_final = url + string + parametros
    response = requests.get(url_final)
    
    if response.status_code == 200:
        
        noticias = ElementTree.fromstring(response.content).find('channel').getchildren()
        noticias = noticias[8:] # As 8 primeiras posições são metadados
        
        print('Foram encontrados {0} resultados'.format(len(noticias)))
        
        for noticia in noticias:
            print("\nTitulo: " + noticia.findtext('title'))
            print("Data da Publicação: " + noticia.findtext('pubDate'))
            print("Link: " + noticia.findtext('link'))
            print("Canal: " + noticia.findtext('source'))
            

#### Agora vamos fazer a pesquisa para todas as chave de busca

In [20]:
for chave in chave_busca:
    
    pesquisar_noticias(chave)


>>>>>>>>>>>>>>>>> Extraindo notícias para a string "marcha" and "crespo" and "salvador"
Foram encontrados 51 resultados

Titulo: Mestre Moa do Katendê terá escultura no Dique do Tororó - Jornal Correio
Data da Publicação: Mon, 25 Nov 2019 20:37:00 GMT
Link: https://www.correio24horas.com.br/noticia/nid/mestre-moa-do-katende-tera-escultura-no-dique-do-tororo/
Canal: Jornal Correio

Titulo: Dia da Consciência Negra: confira a programação completa - A Tarde On Line
Data da Publicação: Wed, 20 Nov 2019 09:00:00 GMT
Link: http://atarde.uol.com.br/bahia/noticias/2109499-dia-da-consciencia-negra-confira-a-programacao-completa
Canal: A Tarde On Line

Titulo: É preciso encrespar! Marcha influencia cabeças no Centro da cidade - Jornal Correio
Data da Publicação: Sun, 09 Dec 2018 08:00:00 GMT
Link: https://www.correio24horas.com.br/noticia/nid/e-preciso-encrespar-marcha-influencia-cabecas-no-centro-da-cidade/
Canal: Jornal Correio

Titulo: Cultura às 14:51 Quarta edição da Marcha do Empoderament

Foram encontrados 34 resultados

Titulo: Mestre Moa do Katendê terá escultura no Dique do Tororó - Jornal Correio
Data da Publicação: Mon, 25 Nov 2019 20:37:00 GMT
Link: https://www.correio24horas.com.br/noticia/nid/mestre-moa-do-katende-tera-escultura-no-dique-do-tororo/
Canal: Jornal Correio

Titulo: Dia da Consciência Negra: confira a programação completa - A Tarde On Line
Data da Publicação: Wed, 20 Nov 2019 09:00:00 GMT
Link: http://atarde.uol.com.br/bahia/noticias/2109499-dia-da-consciencia-negra-confira-a-programacao-completa
Canal: A Tarde On Line

Titulo: É preciso encrespar! Marcha influencia cabeças no Centro da cidade - Jornal Correio
Data da Publicação: Sun, 09 Dec 2018 08:00:00 GMT
Link: https://www.correio24horas.com.br/noticia/nid/e-preciso-encrespar-marcha-influencia-cabecas-no-centro-da-cidade/
Canal: Jornal Correio

Titulo: Cultura às 14:51 Quarta edição da Marcha do Empoderamento Crespo acontece no próximo domingo Da - A Tarde On Line
Data da Publicação: Thu, 29 Nov

Foram encontrados 32 resultados

Titulo: Mestre Moa do Katendê terá escultura no Dique do Tororó - Jornal Correio
Data da Publicação: Mon, 25 Nov 2019 20:37:00 GMT
Link: https://www.correio24horas.com.br/noticia/nid/mestre-moa-do-katende-tera-escultura-no-dique-do-tororo/
Canal: Jornal Correio

Titulo: Dia da Consciência Negra: confira a programação completa - A Tarde On Line
Data da Publicação: Wed, 20 Nov 2019 09:00:00 GMT
Link: http://atarde.uol.com.br/bahia/noticias/2109499-dia-da-consciencia-negra-confira-a-programacao-completa
Canal: A Tarde On Line

Titulo: É preciso encrespar! Marcha influencia cabeças no Centro da cidade - Jornal Correio
Data da Publicação: Sun, 09 Dec 2018 08:00:00 GMT
Link: https://www.correio24horas.com.br/noticia/nid/e-preciso-encrespar-marcha-influencia-cabecas-no-centro-da-cidade/
Canal: Jornal Correio

Titulo: Cultura às 14:51 Quarta edição da Marcha do Empoderamento Crespo acontece no próximo domingo Da - A Tarde On Line
Data da Publicação: Thu, 29 Nov

Pronto! Temos uma lista das noticias sobre a marcha.

Mas poderíamos salvar esses dados, né? 
Em um formato que nos torne mais fácil a análise deles?


Vamos ver se conseguimos fazer isso no próximo notebook :)

### Anterior:

#### [1 - Introdução](https://github.com/Lorenaps/entre-crawlers-apis/blob/master/notebooks/1_intro.ipynb)

### Próximo:

#### [3 - API, Crawler, JSON e HTML](https://github.com/Lorenaps/entre-crawlers-apis/blob/master/notebooks/3_api_crawler_html.ipynb)