## Web scraping das lojas que vendem produtos pegada

"Imagine que você precise de endereço e telefone de todas lojas que vendam produtos de uma determinada marca. Você entra no site da empresa, e encontra uma sessão que mostra as lojas que vendem os produtos dessa marca. Porém são muitas lojas em várias cidades e estados diferentes, e pesquisar manualmente levaria muito tempo."

Utilizamos então da técnica de webscraping para conseguir todos esses dados.

A página web que encontram os dados esta em [Pegada](https://www.pegada.com.br/onde-encontrar).

#### Imports das bibliotecas utilizadas e inicialização da lista

In [1]:
import json
import requests

lojas = []

#### Scraping das lojas exclusivas

Existem duas sessões, uma de lojas exclusivas e outra de lojas multimarcas, no código abaixo pegamos apenas as lojas exclusivas.

In [2]:
lojas_exclusivas = requests.get('https://admin.pegada.com.br/pegada-admin/items/stores?limit=-1&filter[lang_id][eq]=3&filter[type_id][eq]=1&filter[status][eq]=published&fields=*.*,city_id.*,city_id.state_id.*,city_id.state_id.country_id.*')
lojas_exclusivas = json.loads(lojas_exclusivas.text)

for loja in lojas_exclusivas.get('data'):
    lojas.append({'nome':loja.get('name'), 'descricao':loja.get('desc'), 'cidade':loja.get('city_id').get('nome_pt'), 'estado':loja.get('city_id').get('state_id').get('nome_pt'), 'exclusiva':'Sim' if loja.get('type_id').get('name').lower() == 'exclusivas' else 'Não'})

#### Scraping das lojas multimarcas

No código abaixo pegamos as lojas multimarcas.

In [3]:
lojas_multimarcas = requests.get('https://admin.pegada.com.br/pegada-admin/items/stores?limit=-1&filter[lang_id][eq]=3&filter[type_id][eq]=2&filter[status][eq]=published&fields=*.*,city_id.*,city_id.state_id.*,city_id.state_id.country_id.*')
lojas_multimarcas = json.loads(lojas_multimarcas.text)

for loja in lojas_multimarcas.get('data'):
    lojas.append({'nome':loja.get('name'), 'descricao':loja.get('desc'), 'cidade':loja.get('city_id').get('nome_pt'), 'estado':loja.get('city_id').get('state_id').get('nome_pt'), 'exclusiva':'Sim' if loja.get('type_id').get('name').lower() == 'exclusivas' else 'Não'})

#### Quantidade de lojas encontradas

In [4]:
len(lojas)

11367