#  Coleta Autom√°tica de Pre√ßos de A√ß√µes com Python

Este notebook coleta automaticamente os pre√ßos de a√ß√µes da B3 utilizando o Yahoo Finance e armazena os dados em um arquivo CSV. O processo √© cont√≠nuo e ocorre a cada 15 minutos, permitindo a constru√ß√£o de um hist√≥rico de pre√ßos ao longo do dia.

---

## Objetivo:

- Buscar os pre√ßos das a√ß√µes (ex: PETR4.SA, VALE3.SA)
- Armazenar os dados com hor√°rio da coleta
- Repetir esse processo a cada 15 minutos automaticamente

## Etapa 1 ‚Äì Bibliotecas utilizadas

| Biblioteca      | Fun√ß√£o                                                                 |
|----------------|------------------------------------------------------------------------|
| `yfinance`      | Buscar pre√ßos das a√ß√µes diretamente do Yahoo Finance                   |
| `pandas`        | Organizar os dados em tabelas e salvar em CSV                          |
| `schedule`      | Agendar tarefas autom√°ticas de coleta a cada X minutos                 |
| `datetime`      | Gerar data e hora da coleta                                            |
| `time`          | Controlar o tempo de espera entre coletas                              |
| `os`            | Verificar se o arquivo j√° existe para atualizar sem sobrescrever       |

In [None]:
!pip install schedule --quiet

In [None]:
# Instale o yfinance caso ainda n√£o tenha
!pip install yfinance --quiet

import yfinance as yf
import pandas as pd
import time
import schedule
import os
from datetime import datetime


## Etapa 2 ‚Äì Configura√ß√£o inicial

Definimos:
- Quais a√ß√µes vamos monitorar
- O nome do arquivo onde os dados ser√£o armazenados


In [None]:
acoes = ['PETR4.SA', 'VALE3.SA', 'ITUB4.SA']  # A√ß√µes que queremos monitorar
arquivo_saida = 'dados_acoes.csv'            # Nome do arquivo que guardar√° os dados

## Etapa 3 ‚Äì Fun√ß√£o de coleta de dados

Essa fun√ß√£o:
- Coleta o pre√ßo mais recente de cada a√ß√£o
- Registra o hor√°rio da coleta
- Salva ou atualiza o arquivo `dados_acoes.csv`


In [15]:
def coletar_dados():
    agora = datetime.now().strftime("%Y-%m-%d %H:%M:%S")
    dados = []

    for acao in acoes:
        info = yf.Ticker(acao).history(period='1d', interval='1m')
        if not info.empty:
            preco_atual = info['Close'].iloc[-1]
            dados.append({'timestamp': agora, 'acao': acao, 'preco': preco_atual})

    df_novo = pd.DataFrame(dados)

    if os.path.exists(arquivo_saida):
        df_existente = pd.read_csv(arquivo_saida)
        df_total = pd.concat([df_existente, df_novo], ignore_index=True)
    else:
        df_total = df_novo

    df_total.to_csv(arquivo_saida, index=False)
    print(f"[{agora}] Dados coletados e salvos.")


## Etapa 4 ‚Äì Agendamento da coleta

Vamos configurar para coletar dados a cada 15 minutos automaticamente.

In [16]:
schedule.every(15).minutes.do(coletar_dados)

print("‚è≥ Iniciando o monitoramento. Pressione STOP para encerrar a execu√ß√£o.")

while True:
    schedule.run_pending()
    time.sleep(60)

‚è≥ Iniciando o monitoramento. Pressione STOP para encerrar a execu√ß√£o.
[2025-06-08 15:19:06] Dados coletados e salvos.
[2025-06-08 15:20:07] Dados coletados e salvos.
[2025-06-08 15:21:08] Dados coletados e salvos.


KeyboardInterrupt: 

In [17]:
pd.read_csv('dados_acoes.csv')

Unnamed: 0,timestamp,acao,preco
0,2025-06-08 15:11:16,PETR4.SA,29.690001
1,2025-06-08 15:11:16,VALE3.SA,52.93
2,2025-06-08 15:11:16,ITUB4.SA,36.52
3,2025-06-08 15:12:39,PETR4.SA,29.690001
4,2025-06-08 15:12:39,VALE3.SA,52.93
5,2025-06-08 15:12:39,ITUB4.SA,36.52
6,2025-06-08 15:19:06,PETR4.SA,29.690001
7,2025-06-08 15:19:06,VALE3.SA,52.93
8,2025-06-08 15:19:06,ITUB4.SA,36.52
9,2025-06-08 15:20:07,PETR4.SA,29.690001


## Cookie Clicker Exemplo

Neste exemplo, eu tentei criar um programa que automatizava a produ√ß√£o de cookies do jogo Cookie Cliekers todavia, enfrentei problemas constantes de CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart)

In [12]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.chrome.options import Options
import time
import random

# Configura√ß√µes para "disfar√ßar" o Selenium
chrome_options = Options()
chrome_options.add_argument("--disable-blink-features=AutomationControlled")
chrome_options.add_argument("--disable-infobars")
chrome_options.add_argument("--disable-extensions")
chrome_options.add_argument("--profile-directory=Default")
chrome_options.add_argument("--start-maximized")
chrome_options.add_argument("--incognito")

# Finge que √© um navegador comum
chrome_options.add_argument("user-agent=Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36")

# Caminho do ChromeDriver
service = Service(executable_path="chromedriver.exe")
driver = webdriver.Chrome(service=service, options=chrome_options)

# Acessa o Google
driver.get("https://www.google.com")

# Espera a barra de busca aparecer
WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.NAME, "q"))
)

# Digita "tech with tim" e pressiona ENTER
search_input = driver.find_element(By.NAME, "q")
search_input.clear()
search_input.send_keys("Pesquisa Automatizada" + Keys.ENTER)

# Espera o carregamento da p√°gina de resultados
time.sleep(random.uniform(3, 5))

# Fecha o navegador
driver.quit()


## Sobre o C√≥digo:

O `webdriver` √© o componente do Selenium que permite controlar o navegador de forma programada. No nosso c√≥digo, ele est√° sendo utilizado para abrir o Google Chrome, acessar o site google.com, digitar uma busca automaticamente e simular o comportamento de um usu√°rio humano. Ele faz isso a partir da linha `driver = webdriver.Chrome(...)`, onde o navegador √© iniciado com uma s√©rie de op√ß√µes definidas anteriormente.

Essas op√ß√µes s√£o a chave para burlar o CAPTCHA do Google. Usamos argumentos como `--disable-blink-features=AutomationControlled` e um `user-agent` realista para evitar que o navegador revele que est√° sendo controlado por um script. Tamb√©m abrimos o navegador em modo an√¥nimo para simular melhor o comportamento humano. Com esses ajustes, conseguimos enganar os mecanismos de detec√ß√£o autom√°tica do Google, que normalmente ativariam um CAPTCHA ao perceberem que a navega√ß√£o est√° sendo feita por um rob√¥.

Ao fim, o c√≥digo simula o ato de pesquisar no Google por ‚ÄúPesquisa Automatizada‚Äù e espera alguns segundos antes de encerrar o navegador. O segredo para evitar o CAPTCHA foi justamente "camuflar" a automa√ß√£o com configura√ß√µes que fazem o navegador parecer leg√≠timo e humano.

![Pesquisa_Automatizada](pesquisa_auto.png)


In [11]:
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
import time

# === User-Agent que voc√™ copiou do seu navegador ===
USER_AGENT = "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Safari/537.36"

# === Cookie cf_clearance ===
COOKIES = [
    {
        "name": "cf_clearance",
        "value": "cbiV8HjN2qWQbySx3w3itHOslkOS7ga4Feh_Y.YDF2c-1749405576-1.2.1.1-qL0k6H1C5xr9.la33PwXMsYbCseBFOxvDKeWOUM7Gen0SUL5c19GW5Y0hUwwMxUCHKB_UzfZvy4.DowfxcgsSQeh3jmv9jKuAmXhcXl2JMyqYFTJlt7WLFObPlwEdkULvG5C9qGXUdVLTDjvujJuDljjPuq_k6YpraJ4rFxgWzBs_T7FW4Ri70TqwPtIoVr0po0Sf.5z7h5BiIHfcpH0U3aHSjErBDNSPFN3INRM8R70ljwbucLj5tDK5GMqO5CfYdpjV3M9zVF3BiN0U1KBRr8fg4BrIMS1AP2vu562aUELP7DhrreJm8.p_DJiAOGXXb7.aK2OLSVkK7oGXZhtMAFV8fZX6oSZnrKN00trrCY",
        "domain": ".dashnet.org",
        "path": "/",
        "secure": True,
        "httpOnly": True
    }
]

# === Configura√ß√µes do navegador ===
chrome_options = Options()
chrome_options.add_argument(f"user-agent={USER_AGENT}")
chrome_options.add_argument("--disable-blink-features=AutomationControlled")
chrome_options.add_argument("--incognito")
chrome_options.add_argument("--start-maximized")

# === Inicializa o Chrome ===
service = Service(executable_path="chromedriver.exe")
driver = webdriver.Chrome(service=service, options=chrome_options)

# === Primeiro acesso ao dom√≠nio (obrigat√≥rio para setar cookies) ===
driver.get("https://orteil.dashnet.org")

# === Adiciona o cookie manualmente ===
for cookie in COOKIES:
    driver.add_cookie(cookie)

# === Agora acessa o jogo com a sess√£o autenticada ===
driver.get("https://orteil.dashnet.org/cookieclicker")

# === Aguarda o bot√£o de idioma aparecer e clica ===
WebDriverWait(driver, 15).until(
    EC.presence_of_element_located((By.XPATH, "//*[contains(text(), 'English')]"))
)
driver.find_element(By.XPATH, "//*[contains(text(), 'English')]").click()

# === Aguarda o cookie aparecer e interage ===
WebDriverWait(driver, 15).until(
    EC.presence_of_element_located((By.ID, "bigCookie"))
)
cookie = driver.find_element(By.ID, "bigCookie")

# === Loop de cliques com compra autom√°tica b√°sica ===
product_price_prefix = "productPrice"
product_prefix = "product"

while True:
    cookie.click()
    time.sleep(0.01)

    cookies_count = driver.find_element(By.ID, "cookies").text.split(" ")[0]
    cookies_count = int(cookies_count.replace(",", ""))

    for i in range(4):
        try:
            price_el = driver.find_element(By.ID, product_price_prefix + str(i)).text.replace(",", "")
            if not price_el.isdigit():
                continue
            price = int(price_el)

            if cookies_count >= price:
                driver.find_element(By.ID, product_prefix + str(i)).click()
                break
        except:
            continue


InvalidSessionIdException: Message: invalid session id: session deleted as the browser has closed the connection
from disconnected: not connected to DevTools
  (Session info: chrome=137.0.7151.69)
Stacktrace:
	GetHandleVerifier [0x0x7ff7d550fea5+79173]
	GetHandleVerifier [0x0x7ff7d550ff00+79264]
	(No symbol) [0x0x7ff7d52c9e5a]
	(No symbol) [0x0x7ff7d52b5c25]
	(No symbol) [0x0x7ff7d52dac44]
	(No symbol) [0x0x7ff7d53503c5]
	(No symbol) [0x0x7ff7d5370922]
	(No symbol) [0x0x7ff7d5348743]
	(No symbol) [0x0x7ff7d53114c1]
	(No symbol) [0x0x7ff7d5312253]
	GetHandleVerifier [0x0x7ff7d57da2dd+3004797]
	GetHandleVerifier [0x0x7ff7d57d472d+2981325]
	GetHandleVerifier [0x0x7ff7d57f3380+3107360]
	GetHandleVerifier [0x0x7ff7d552aa2e+188622]
	GetHandleVerifier [0x0x7ff7d55322bf+219487]
	GetHandleVerifier [0x0x7ff7d5518df4+115860]
	GetHandleVerifier [0x0x7ff7d5518fa9+116297]
	GetHandleVerifier [0x0x7ff7d54ff558+11256]
	BaseThreadInitThunk [0x0x7ffda1ffe8d7+23]
	RtlUserThreadStart [0x0x7ffda397c34c+44]


## Explicando o C√≥digo

Esse c√≥digo tenta automatizar o jogo Cookie Clicker acessando diretamente o site e adicionando manualmente o cookie `cf_clearance`, que √© gerado quando voc√™ resolve o CAPTCHA da Cloudflare manualmente. A l√≥gica √© parecida com a usada para burlar o CAPTCHA do Google: camuflar o navegador como humano com user-agent, abrir o site previamente e inserir o cookie de autoriza√ß√£o. No entanto, neste caso, n√£o funcionou como esperado porque a Cloudflare possui mecanismos de seguran√ßa mais avan√ßados que n√£o se limitam apenas √† presen√ßa do cookie.

O que acontece √© que, mesmo com o cookie v√°lido, a Cloudflare pode solicitar uma nova verifica√ß√£o se ela detectar que o navegador √© automatizado, o que √© comum com Selenium. Isso ocorre porque, al√©m do cookie, ela analisa fatores como movimenta√ß√£o de mouse, tempo de resposta, headers detalhados e principalmente a presen√ßa da vari√°vel `navigator.webdriver`, que denuncia que o navegador est√° sendo controlado por um script. Como o c√≥digo n√£o simula comportamento humano com realismo suficiente, a Cloudflare entende que aquilo ainda pode ser um bot e reapresenta o CAPTCHA.

Existem solu√ß√µes profissionais para contornar isso, como o servi√ßo Bright Data ([https://brightdata.com/](https://brightdata.com/)), que oferece acesso a proxies rotativos e ferramentas capazes de driblar detec√ß√µes de bot como as da Cloudflare. No entanto, esse servi√ßo √© pago e pode ser caro para uso pessoal ou testes simples, o que fez com que essa alternativa fosse descartada aqui.

![Cookie_erro](CAPTCHA.png)




## Previs√£o do Tempo - Exemplo


In [None]:
import requests

api_key = 'f059fb26f708b9fe76ffa9e2a6664e11'

user_input = input("Enter city: ")

weather_data = requests.get(
    f"https://api.openweathermap.org/data/2.5/weather?q={user_input}&units=metric&APPID={api_key}")  # <- "metric"

if weather_data.json()['cod'] == '404':
    print("No City Found")
else:
    weather = weather_data.json()['weather'][0]['main']
    temp = round(weather_data.json()['main']['temp'])

    print(f"The weather in {user_input} is: {weather}")
    print(f"The temperature in {user_input} is: {temp}¬∫C")  


The weather in rio de janeiro is: Clouds
The temperature in rio de janeiro is: 25¬∫C


## Explicando o C√≥digo

Esse c√≥digo em Python realiza uma automa√ß√£o simples e poderosa que consulta a previs√£o do tempo de uma cidade espec√≠fica usando a API p√∫blica do site OpenWeatherMap. A biblioteca `requests` √© o principal recurso utilizado, pois permite enviar uma requisi√ß√£o HTTP para o endere√ßo da API, que retorna dados atualizados em formato JSON. O OpenWeatherMap √© um servi√ßo online que disponibiliza dados meteorol√≥gicos em tempo real de milhares de cidades no mundo todo, e a API key √© a chave de acesso individual que autentica o uso da plataforma para cada usu√°rio. Essa automa√ß√£o √© √∫til porque elimina a necessidade de procurar manualmente o clima no navegador, facilitando integra√ß√µes com sistemas maiores, relat√≥rios autom√°ticos ou aplica√ß√µes inteligentes. A verifica√ß√£o do c√≥digo de resposta `'cod' == '404'` garante que o nome da cidade foi reconhecido corretamente, e, em caso positivo, o programa extrai a condi√ß√£o do clima e a temperatura atual, convertida diretamente em Celsius. Esse tipo de automa√ß√£o √© um exemplo claro de como integrar APIs com scripts personalizados para coletar, tratar e exibir dados de maneira pr√°tica e r√°pida.


In [None]:
import requests
import csv
import json

api_key = 'f059fb26f708b9fe76ffa9e2a6664e11'
country_code = input("Enter country code (e.g., BR, US, FR): ").strip().upper()

# Carrega o arquivo de cidades
with open("city.list.json", encoding="utf-8") as file:
    all_cities = json.load(file)

# Filtra cidades do pa√≠s desejado
cities_in_country = [city for city in all_cities if city["country"] == country_code]

# Prepara o CSV
with open(f"{country_code}_weather.csv", "w", newline='', encoding='utf-8') as csvfile:
    writer = csv.writer(csvfile)
    writer.writerow(["City", "Country", "Weather", "Temperature (C)"])

    for city in cities_in_country[:100]:  # Limite de 100 para evitar bloqueios de API
        city_id = city["id"]
        name = city["name"]

        url = f"https://api.openweathermap.org/data/2.5/weather?id={city_id}&appid={api_key}&units=metric"
        response = requests.get(url)
        if response.status_code == 200:
            data = response.json()
            weather = data["weather"][0]["main"]
            temp = round(data["main"]["temp"])
            writer.writerow([name, country_code, weather, temp])
        else:
            print(f"Could not fetch weather for {name}")


## Explicando o Codigo

Esse c√≥digo automatiza a coleta de dados clim√°ticos de diversas cidades de um pa√≠s usando a API do OpenWeatherMap e grava as informa√ß√µes em um arquivo CSV. Ele come√ßa pedindo ao usu√°rio o c√≥digo do pa√≠s (como BR para Brasil), e em seguida carrega um arquivo JSON chamado `city.list.json`, que cont√©m uma lista com todas as cidades cadastradas na base de dados da OpenWeatherMap, incluindo seus nomes, identificadores e pa√≠s. O arquivo JSON √© essencial nesse processo porque funciona como uma base local estruturada que o c√≥digo utiliza para filtrar apenas as cidades do pa√≠s desejado, permitindo chamadas mais precisas e organizadas √† API. A API, por sua vez, fornece as informa√ß√µes de temperatura e clima atual de cada cidade a partir de seu identificador √∫nico. O motivo pelo qual o c√≥digo pode dar problema ao tentar consultar todas as cidades do Brasil √© que a OpenWeather imp√µe um limite de requisi√ß√µes por minuto na vers√£o gratuita (normalmente at√© 60 chamadas), o que significa que fazer centenas ou milhares de chamadas em sequ√™ncia pode causar bloqueio tempor√°rio do IP ou falhas na execu√ß√£o. Al√©m disso, sem intervalos entre as chamadas, o c√≥digo corre o risco de parar de funcionar no meio da execu√ß√£o, perdendo parte dos dados ou gerando um CSV incompleto. Por isso, embora o script seja √∫til e eficiente para automatizar relat√≥rios clim√°ticos em escala, ele exige ajustes como pausas (`sleep`) e controle de requisi√ß√µes para funcionar com grandes volumes de cidades.

![Planilha_clima_tempo](dados_clima.png)
![Planilha_clima_tempo_python](planilha_clima_python.png)

# An√°lise Automatizada de Curr√≠culos em PDF

Este notebook automatiza a leitura de curr√≠culos em PDF, localizados na pasta `INF1515/curriculos`, e verifica quais candidatos mencionam institui√ß√µes espec√≠ficas como:

- **PUC-Rio**
- **Pontif√≠cia Universidade Cat√≥lica do Rio de Janeiro**

O objetivo √© filtrar automaticamente os arquivos relevantes para facilitar a triagem de candidatos.


In [16]:
!pip install pymupdf



In [17]:
import os
import PyPDF2
import fitz  # PyMuPDF

### Leitura autom√°tica de curr√≠culos em PDF

Esta automa√ß√£o percorre todos os arquivos PDF dentro da pasta `curriculos/` e verifica se o conte√∫do menciona "PUC-Rio" ou "Pontif√≠cia Universidade Cat√≥lica do Rio de Janeiro".

Se encontrar, imprime o nome do arquivo (ou salva numa lista para posterior triagem).


In [12]:
# Caminho da pasta
pasta_curriculos = "C:/Users/pedro/INF1515/curriculos"

# Palavras-chave para buscar nos curr√≠culos
palavras_chave = ["PUC-Rio", "Pontif√≠cia Universidade Cat√≥lica do Rio de Janeiro"]


In [13]:
curriculos_filtrados = []

for nome_arquivo in os.listdir(pasta_curriculos):
    if nome_arquivo.endswith(".pdf"):
        caminho_completo = os.path.join(pasta_curriculos, nome_arquivo)
        doc = fitz.open(caminho_completo)
        texto = ""
        
        for pagina in doc:
            texto += pagina.get_text()
        
        if any(palavra in texto for palavra in palavras_chave):
            curriculos_filtrados.append(nome_arquivo)

# Resultado
print("Curr√≠culos que mencionam PUC-Rio ou equivalente:")
for nome in curriculos_filtrados:
    print("-", nome)


Curr√≠culos que mencionam PUC-Rio ou equivalente:
- candidato1.pdf
- candidato3.pdf
- candidato5.pdf


## Ultimo passo - salvar nomes candidatos num arquivo excel


In [18]:
import pandas as pd

df = pd.DataFrame(curriculos_filtrados, columns=["Curr√≠culos aprovados"])
df.to_excel("curriculos_filtrados.xlsx", index=False)
print("üìÑ Arquivo salvo como curriculos_filtrados.xlsx")


üìÑ Arquivo salvo como curriculos_filtrados.xlsx
