## Web Scraping: Dados de Concursos
- Estudante: Lucca de Sena Barbosa - Turma 2
- Curso de Extensão: CD-IA-Generativa-com-Agentes

### **1. Importação de Bibliotecas e alguns Parâmetros:**

In [None]:
import requests
from bs4 import BeautifulSoup
import json

estados = ["acre", "alagoas", "amazonas", "amapa", "bahia", "ceara", "distrito-federal", "espirito-santo", "goias", "maranhao", "minas-gerais", "mato-grosso-do-sul", "para", "paraiba", "pernambuco", "piaui", "parana", "rio-de-janeiro", "rio-grande-do-norte", "rondonia", "roraima", "rio-grande-do-sul", "santa-catarina"]

# Lista final que vai guardar todos os concursos
concursos_abertos = []
concursos_andamento= []

index = 0

### **2. Scraping de Concursos Abertos (06/09/2025):**

In [None]:
for estado in estados:
    SITE_URL = f"https://www.acheconcursos.com.br/concursos-{estado}"
    response = requests.get(SITE_URL)

    if response.status_code == 200:
        soup = BeautifulSoup(response.text, "html.parser")
        items = soup.find_all("div", class_="wrap-tbl-conc")

        if not items:
            print(f"Nenhuma tabela encontrada para {estado}")
            continue

        tabela = items[0].select("tr")

        for idx in range(1, len(tabela)):  # pula o cabeçalho
            index += 1
            concurso = tabela[idx].select_one("a").get_text(strip=True)
            link_concurso = tabela[idx].select_one("a")["href"]
            nivel = tabela[idx].select_one("span.vagas").get_text(strip=True)
            vagas = tabela[idx].select_one("span.numero_vagas").get_text(strip=True)
            salarios = tabela[idx].select_one("span.sal_max").get_text(strip=True)

            concursos_abertos.append({
                "codigo": f"{index}",  # cria um ID único com estado+index
                "descricao": concurso,
                "linkConcurso": link_concurso,
                "dadosSobre": {
                    "Estado": estado,
                    "NivelEscolaridade": nivel,
                    "NumeroVagas": vagas,
                    "SalarioAte": salarios
                }
            })
    else:
        print(f"Erro ao acessar {SITE_URL}: {response.status_code}")

# Salvar tudo em JSON só no final
with open("concursos_abertos.json", "w", encoding="utf-8") as f:
    json.dump(concursos_abertos, f, ensure_ascii=False, indent=2)

print("Scraping concluído! Dados salvos em concursos_abertos.json")



Scraping concluído! Dados salvos em concursos_abertos.json


### **3. Scraping de Concursos Andamento (06/09/2025):**

In [None]:
index = 0
for estado in estados:
    SITE_URL = f"https://www.acheconcursos.com.br/concursos-{estado}"
    response = requests.get(SITE_URL)

    if response.status_code == 200:
        soup = BeautifulSoup(response.text, "html.parser")
        items = soup.find_all("div", class_="wrap-tbl-conc")

        if not items:
            print(f"Nenhuma tabela encontrada para {estado}")
            continue

        tabela = items[1].select("tr")

        for idx in range(1, len(tabela)):  # pula o cabeçalho
            index += 1
            concurso = tabela[idx].select_one("a").get_text(strip=True)
            link_concurso = tabela[idx].select_one("a")["href"]
            nivel = tabela[idx].select_one("span.vagas").get_text(strip=True)
            vagas = tabela[idx].select_one("span.numero_vagas").get_text(strip=True)
            salarios = tabela[idx].select_one("span.sal_max").get_text(strip=True)

            concursos_andamento.append({
                "codigo": f"{index}",  # cria um ID único com estado+index
                "descricao": concurso,
                "linkConcurso": link_concurso,
                "dadosSobre": {
                    "Estado": estado,
                    "NivelEscolaridade": nivel,
                    "NumeroVagas": vagas,
                    "SalarioAte": salarios
                }
            })
    else:
        print(f"Erro ao acessar {SITE_URL}: {response.status_code}")

# Salvar tudo em JSON só no final
with open("concursos_andamento.json", "w", encoding="utf-8") as f:
    json.dump(concursos_andamento, f, ensure_ascii=False, indent=2)

print("Scraping concluído! Dados salvos em concursos_andamento.json")

Scraping concluído! Dados salvos em concursos_abertos.json
