# Aula 01

# Resumo da Aula

Nesta aula, abordamos técnicas de web scraping utilizando Python. Abaixo estão os principais tópicos discutidos:

## Tecnologias e Ferramentas Utilizadas

- **Requests**: Biblioteca para fazer requisições HTTP.
- **BeautifulSoup**: Biblioteca para parseamento de HTML e extração de dados.
- **Pandas**: Biblioteca para manipulação e análise de dados.

## Passos Realizados

1. **Introdução ao Web Scraping**:
    - Explicação sobre a importância de entender HTML e a estrutura das páginas web.
    - Discussão sobre a ética e as implicações legais do web scraping.
2. **Configuração do Ambiente**:
    - Criação de um projeto básico em Python.
    - Instalação das bibliotecas necessárias (`requests`, `beautifulsoup4`, `pandas`).
3. **Primeira Requisição**:
    - Realização de uma requisição simples para obter o IP da máquina.
    - Explicação sobre o status code e a resposta da requisição.
4. **Extração de Dados do Mercado Livre**:
    - Construção de uma URL de busca dinâmica.
    - Parseamento do HTML retornado utilizando BeautifulSoup.
    - Extração de informações específicas como título, preço, marca e link dos produtos.
    - Armazenamento dos dados extraídos em um DataFrame do Pandas.
5. **Discussão sobre Técnicas Avançadas**:
    - Introdução ao uso de ferramentas como Selenium e Puppeteer para automação de navegadores.
    - Planejamento para futuras aulas, incluindo a criação de um objeto dinâmico para requisições paralelas e técnicas de login automatizado.

## Exemplo de scraping:

* **Instalando as libs**:

In [17]:
!poetry add bs4 pandas -q

* **Codigo exemplo:**

In [16]:
# Código de Exemplo
import requests
from bs4 import BeautifulSoup
import pandas as pd

# URL de busca no Mercado Livre

url = "https://lista.mercadolivre.com.br/shampoo"

# Realiza a requisição

response = requests.get(url)

# Verifica se a requisição foi bem-sucedida

if response.status_code == 200:
    soup = BeautifulSoup(response.text, 'html.parser')
    data = []
    # Encontra todos os produtos na página
    for item in soup.find_all('div', class_='ui-search-result__content'):
        title = item.find('h2', class_='ui-search-item__title').text.strip()
        price = item.find('span', class_='andes-money-amount ui-search-price__part ui-search-price__part--medium andes-money-amount--cents-superscript').text.strip()
        link = item.find('a', class_='ui-search-link')['href']
        data.append({'Título': title, 'Preço': price, 'Link': link})

    # Cria um DataFrame com os dados extraídos
    df = pd.DataFrame(data)
    display(df)

else:
    print("Erro na requisição")


Unnamed: 0,Título,Preço,Link
0,Kit Shampoo E Condicionador Antiqueda Aq-01,R$79,https://www.mercadolivre.com.br/kit-shampoo-e-...
1,Kit Shampoo + Máscara Matizadora Black Home Ca...,"R$75,90",https://www.mercadolivre.com.br/kit-shampoo-ma...
2,Doctar Plus Shampoo Anticaspa 240ml - Darrow,"R$94,90",https://www.mercadolivre.com.br/doctar-plus-sh...
3,Shampoo Redutor De Grisalhos Grecin Control Gx...,"R$63,82",https://www.mercadolivre.com.br/shampoo-reduto...
4,Shampoo Anticaspa Men Ice Cool Menthol 400ml C...,"R$22,90",https://www.mercadolivre.com.br/shampoo-antica...
5,Keune Man Shampoo Fortify 250ml,"R$71,99",https://www.mercadolivre.com.br/keune-man-sham...
6,Vichy Dercos Thechnique Shampoo Antiqueda 400 g,"R$118,73",https://www.mercadolivre.com.br/vichy-dercos-t...
7,Kit Zap Me Leva Black + Shampoo Detox 500ml,"R$42,90",https://www.mercadolivre.com.br/kit-zap-me-lev...
8,Shampoo Anticaspa Intensivo Dercos Cabelos Sec...,"R$66,90",https://www.mercadolivre.com.br/shampoo-antica...
9,Shampoo Esfoliante Anticaspa Vichy Dercos Micr...,"R$77,42",https://www.mercadolivre.com.br/shampoo-esfoli...



## Próximos Passos
- Transformar a classe de scraping em um objeto dinâmico.
- Implementar requisições paralelas.
- Explorar técnicas de automação de navegadores e login automatizado.

## Conclusão
A aula forneceu uma base sólida para iniciar com web scraping em Python, utilizando bibliotecas populares e abordando tanto aspectos técnicos quanto éticos da prática.
