# Extracción y Análisis de Datos Públicos del Perú

Este notebook tiene como objetivo extraer datos públicos del Perú relacionados a Noticias, Temperatura y Tipo de Cambio, así como analizar su calidad para determinar su viabilidad en soluciones analíticas empresariales.


## Extracción de Datos

In [None]:
# Librerías necesarias
import pandas as pd
import requests
from bs4 import BeautifulSoup
from datetime import datetime


### Noticias del Perú (Ejemplo con RPP)

In [None]:
# Ejemplo simple de scraping de titulares de RPP
url = "https://rpp.pe/peru"
response = requests.get(url)
soup = BeautifulSoup(response.content, "html.parser")

headlines = [h2.get_text(strip=True) for h2 in soup.find_all("h2")]
headlines[:5]  # Mostrar los primeros 5 titulares


### Temperatura en Lima (Ejemplo usando OpenWeatherMap)

In [None]:
# Simulación: Requiere una API Key real
# url = f"http://api.openweathermap.org/data/2.5/weather?q=Lima,PE&appid=YOUR_API_KEY&units=metric"
# response = requests.get(url)
# data = response.json()
# data['main']['temp']

# Simulación sin API
temperatura_lima = 24.5  # valor de ejemplo
temperatura_lima


### Tipo de Cambio del BCRP

In [None]:
# Ejemplo simple usando scraping de BCRP
bcrp_url = "https://www.sunat.gob.pe/cl-at-ittipcam/tcS01Alias"
response = requests.get(bcrp_url)
soup = BeautifulSoup(response.content, "html.parser")
table = soup.find_all("table")[0]
df = pd.read_html(str(table))[0]
df.head()


## Indicadores de Calidad del Dataset


| Indicador           | Aplicación                   | Descripción                                                                 |
|---------------------|------------------------------|-----------------------------------------------------------------------------|
| **Completitud**     | Todos los datasets            | ¿Faltan datos? ¿Hay campos vacíos?                                          |
| **Consistencia**    | Tipo de cambio, temperatura   | ¿Se repiten fechas? ¿Valores inesperados?                                   |
| **Actualización**   | Noticias, tipo de cambio      | ¿Con qué frecuencia se actualizan los datos?                                |
| **Precisión**        | Temperatura, tipo de cambio   | ¿Los valores tienen sentido con otras fuentes oficiales?                    |
| **Trazabilidad**    | Todos                         | ¿Se puede identificar la fuente clara y oficial de los datos?               |


## Justificación de los Indicadores de Calidad


Se eligieron los indicadores de completitud, consistencia y frecuencia de actualización porque son críticos para el negocio. Por ejemplo, una empresa que analiza noticias necesita información actualizada diariamente. Igualmente, los datos de tipo de cambio deben ser consistentes para no afectar el análisis financiero. La temperatura puede impactar en la logística, por lo que su precisión es vital.


## Conclusiones


En general, los datos de tipo de cambio del BCRP y temperatura de OpenWeatherMap presentan alta confiabilidad. Las noticias, aunque útiles, requieren validación de fuente y manejo de ruido semántico. Se recomienda establecer una rutina de actualización y validación automática para mantener la calidad en el tiempo.
