# Escuela Politécnica Nacional
## Facultad de Ingeniería en Sistemas
## Materia: Métodos Numéricos
## Nombre: Daniel Ismael Flores Espín

In [9]:
import requests
from bs4 import BeautifulSoup

def obtener_datos_financieros(ticker):
    url = f"https://finance.yahoo.com/quote/{ticker}?p={ticker}"

    response = requests.get(url)
    if response.status_code == 200:
        soup = BeautifulSoup(response.content, "html.parser")

        precio_actual = soup.find("fin-streamer", {"data-field": "regularMarketPrice"})
        if precio_actual:
            return precio_actual.text
        else:
            return "Precio no disponible"
    else:
        return f"Error al acceder a la página: {response.status_code}"

# Lista de empresas
tickers = ["KO", "AAPL", "MSFT", "TSLA", "GOOGL"]

for ticker in tickers:
    precio = obtener_datos_financieros(ticker)
    print(f"{ticker}: {precio}")

KO: 62.84
AAPL: 258.20
MSFT: 439.33
TSLA: 462.28
GOOGL: 196.11


### Librerías utilizadas:

1. **requests**:
   - Es una biblioteca en Python diseñada para hacer solicitudes HTTP de manera simple.
   - En el ejemplo, se usa para realizar una solicitud GET a la página de Yahoo Finance y obtener el contenido HTML de la URL que corresponde a un ticker específico.

2. **BeautifulSoup**:
   - Es una biblioteca utilizada para analizar y extraer datos de contenido HTML o XML.
   - En este caso, se utiliza para analizar el contenido HTML de la página web y localizar elementos específicos relacionados con el precio del mercado regular de una acción.


### Explicación de código: 
#### Función: obtener_datos_financieros
- **Parámetros**:
  - Recibe un argumento ticker, que es el símbolo bursátil de la empresa (por ejemplo, "KO" para Coca-Cola).
  
- **Flujo de la función**:
  1. **Construcción de la URL**:
     - Forma la URL de Yahoo Finance utilizando el ticker proporcionado, por ejemplo, https://finance.yahoo.com/quote/AAPL?p=AAPL para Apple.
  2. **Solicitud GET**:
     - Usa requests.get(url) para obtener el contenido HTML de la página web.
     - Verifica si la respuesta tiene un código de estado 200 (lo que indica éxito).
  3. **Análisis del contenido HTML**:
     - Usa BeautifulSoup para procesar el contenido HTML de la respuesta.
     - Busca en el documento HTML un elemento <fin-streamer> que tiene un atributo data-field igual a "regularMarketPrice". Este elemento contiene el precio actual de la acción.
  4. **Devolver el precio**:
     - Si encuentra el precio, devuelve el texto de ese elemento (precio actual).
     - Si no, informa que el precio no está disponible.
  5. **Manejo de errores**:
     - Si la solicitud HTTP falla (no es código 200), devuelve un mensaje de error con el código de estado.

#### Lista de tickers:
- Define una lista con los símbolos bursátiles de varias empresas: ["KO", "AAPL", "MSFT", "TSLA", "GOOGL"].

#### Bucle para consultar precios:
- Itera por cada ticker en la lista.
- Llama a la función obtener_datos_financieros para obtener el precio de la acción correspondiente.
- Imprime el ticker junto con el precio obtenido.

In [2]:
import mechanicalsoup

# Lista de empresas
tickers = ["KO", "AAPL", "MSFT", "TSLA", "GOOGL"]

navegador = mechanicalsoup.StatefulBrowser()

for t in tickers:
    url = f"https://finance.yahoo.com/quote/{t}"

    navegador.open(url)
    pagina = navegador.get_current_page()
    etiqueta_precio = pagina.select_one('fin-streamer[data-field="regularMarketPrice"]')
    
    if etiqueta_precio:
        precio_actual = etiqueta_precio.text
        print(f"{t}: {precio_actual}")
    else:
        print(f"No se encontró el elemento con el precio para {t}.")

KO: 62.84
AAPL: 258.20
MSFT: 439.33
TSLA: 462.28
GOOGL: 196.11


### **Librería utilizada:**

1. **mechanicalsoup**:
   - Es una biblioteca en Python que combina la funcionalidad de BeautifulSoup (para analizar contenido HTML) y un navegador simulado para realizar solicitudes HTTP y mantener el estado entre solicitudes.
   - Permite interactuar con páginas web de manera sencilla, incluyendo formularios y navegación entre páginas.
   - En este ejemplo, se usa para abrir páginas de Yahoo Finance y extraer el precio de mercado regular de las acciones.

### Explicación de Código:

#### **Configuración del navegador:**
- Se crea una instancia de un navegador con mechanicalsoup.StatefulBrowser(). Este navegador simulado permite abrir URLs, mantener cookies y analizar el contenido HTML de las páginas.

#### **Lista de tickers:**
- Define una lista con los símbolos bursátiles de las empresas (por ejemplo, "KO" para Coca-Cola y "AAPL" para Apple).

#### **Bucle para extraer datos:**
1. **Construcción de la URL**:
   - Para cada ticker en la lista, forma la URL específica de Yahoo Finance, por ejemplo, https://finance.yahoo.com/quote/AAPL para Apple.
2. **Abrir la página web**:
   - Usa navegador.open(url) para acceder a la URL.
   - El contenido de la página actual se almacena en pagina utilizando navegador.get_current_page().
3. **Buscar el precio de la acción**:
   - Utiliza el método select_one de BeautifulSoup para buscar un elemento <fin-streamer> con el atributo data-field="regularMarketPrice", que contiene el precio actual de la acción.
   - Si encuentra la etiqueta, extrae el precio con .text.
4. **Mostrar el resultado**:
   - Imprime el ticker junto con el precio encontrado.
   - Si no encuentra el precio, imprime un mensaje indicando que el elemento no fue localizado.

### **Ventajas de usar mechanicalsoup:**
- **Manejo del estado**:
  - Al ser un navegador con estado, puede manejar cookies, encabezados y autenticación automáticamente, algo que requests no hace directamente.
- **Integración con BeautifulSoup**:
  - Permite acceder al contenido HTML y analizarlo fácilmente para extraer información específica.

Existen varias bibliotecas para hacer web scraping porque cada una está diseñada para satisfacer necesidades específicas, manejar diferentes niveles de complejidad y adaptarse a casos de uso variados.

No todos los proyectos de scraping son iguales. Algunos solo requieren descargar y analizar contenido HTML simple, mientras que otros necesitan manejar JavaScript dinámico, autenticación, o navegación compleja. Diferentes bibliotecas ofrecen herramientas especializadas para cada caso:
- **requests + BeautifulSoup**: Perfecto para proyectos simples donde solo necesitas extraer datos de HTML estático.
- **Selenium**: Ideal para manejar sitios con contenido dinámico generado por JavaScript o para automatizar interacciones como clics y entradas de texto.
- **mechanicalsoup**: Excelente para manejar formularios y mantener el estado sin la complejidad de un navegador completo.
- **Scrapy**: Diseñada para proyectos grandes y estructurados, con características como crawling avanzado y manejo eficiente de datos.