<a href="https://colab.research.google.com/github/daniivelascoo/ifp-programacion-ia/blob/main/LAB_1_1_Decodificando_ARES.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üöÄ <u>PROYECTO ARES: Ingenier√≠a de Datos y Python Core</u>

# Sprint 1.1 - N√∫cleo Formativo 1

<br>

---

<br>

## üìú La Misi√≥n

La comunicaci√≥n con el Rover ARES III es err√°tica. Nos ha llegado un archivo de telemetr√≠a corrupto (`ares_logs.txt`).

Tu trabajo no es entrenar una IA (todav√≠a), sino **preparar el terreno**. Debes actuar como Ingeniero de Datos para limpiar, estructurar y analizar estos logs usando **Python puro**.

<br>

---
<br>

## üéØ Objetivos de Aprendizaje

1.  **Parsing:** Convertir texto "sucio" en estructuras de datos (`dict`, `list`).
2.  **Strings:** Dominar `split`, `strip`, `find` y `slicing`.
3.  **Modularidad:** Uso de librer√≠as externas y creaci√≥n de funciones.

<br>

---
<br>

## üõ†Ô∏è El Laboratorio: Decodificando ARES

### üì• Paso 0: Descarga de Datos
Ejecuta esta celda para descargar el archivo de logs corrupto desde el servidor de la misi√≥n (Google Drive).

In [3]:
# Instalamos la librer√≠a de descarga (silenciosamente)
!pip install -q gdown

# Descargamos el archivo usando su ID √∫nico
# ID extra√≠do de tu enlace: 1vRWScFbH8rszeL7df3vDcRXlYM15Fk5U
!gdown 1vRWScFbH8rszeL7df3vDcRXlYM15Fk5U -O ares_logs.txt

print("\n‚úÖ Archivo 'ares_logs.txt' descargado con √©xito.")

Downloading...
From: https://drive.google.com/uc?id=1vRWScFbH8rszeL7df3vDcRXlYM15Fk5U
To: /content/ares_logs.txt
  0% 0.00/66.8k [00:00<?, ?B/s]100% 66.8k/66.8k [00:00<00:00, 56.2MB/s]

‚úÖ Archivo 'ares_logs.txt' descargado con √©xito.


### üßπ Fase 1: Ingesta y Limpieza (Parsing)

**Tu Misi√≥n:**
1. Lee el archivo `ares_logs.txt`.
2. Procesa cada l√≠nea para eliminar espacios vac√≠os al inicio/final.
3. Ignora las l√≠neas que est√©n totalmente vac√≠as.
4. **IMPORTANTE:** Almacena el resultado en una variable llamada `logs_limpios` (una lista de strings).

**Pista:** Usa `with open(...)` y el m√©todo `.readlines()`.

In [22]:
# TU C√ìDIGO AQU√ç
# Define la variable: logs_limpios = []

logs_limpios = []

# Escribe tu l√≥gica de apertura y limpieza aqu√≠...
# with open...

with open('ares_logs.txt', 'r') as logs: # Abrimos el archivo ares_logs.txt en modo lectura
  for log in logs:
    log_limpio = log.strip()

    if log_limpio:
      logs_limpios.append(log_limpio)


### üß© Fase 2: Estructuraci√≥n de Datos

**Tu Misi√≥n:**
Convierte esa lista de strings en una lista de diccionarios.
Cada l√≠nea tiene el formato: `[FECHA] TIPO :: MENSAJE`.

Debes crear una lista llamada `logs_estructurados` donde cada elemento sea as√≠:
```python
{
    "timestamp": "2035-05-20 14:00:00",
    "tipo": "INFO", # INFO, WARNING o CRITICAL
    "mensaje": "El texto del mensaje..."
}

In [44]:
# TU C√ìDIGO AQU√ç
import re

PATRON = re.compile(
    r"^\[(?P<timestamp>[^\]]+)\]\s*(?P<tipo>INFO|WARNING|CRITICAL)\s*::\s*(?P<mensaje>.+)$"
)

logs_estructurados = []

def parsear_linea(linea):
    m = PATRON.match(linea.strip())
    if not m:
        return None # Devolvemos vac√≠o cuando no cumple el formato

    return {
        "timestamp": m.group("timestamp"),
        "tipo": m.group("tipo"),
        "mensaje": m.group("mensaje"),
    }

for log in logs_limpios:
    parsed = parsear_linea(log)
    if parsed:  # solo si se ha parseado algo lo a√±adimos a la lista
        logs_estructurados.append(parsed)

### üå°Ô∏è Fase 3: An√°lisis de Temperatura

**Tu Misi√≥n:**
Calcula la temperatura media de Marte bas√°ndote en los logs de tipo `INFO`.
El mensaje suele ser: `TEMP_EXT=-45.2C | BATTERY=...`.

1. Extrae el n√∫mero (cuidado con la 'C').
2. Calcula la media y gu√°rdala en una variable llamada `media_temp` (tipo float).

In [57]:
# TU C√ìDIGO AQU√ç
media_temp = 0.0
temp_totales = 0.0

# Tu l√≥gica de extracci√≥n...
messages = [
    data['mensaje']
    for data in logs_estructurados
    if data['tipo'] == 'INFO'
]

for m in messages:
  temp = m.split('|')[0]
  try:
    temp_formateada = float(temp.split('=')[1].split('C')[0])
    temp_totales += temp_formateada
  except ValueError:
    print(f'Dato corrupto: {temp}')

media_temp = temp_totales / len(messages)


### üö® Fase 4: Reporte de Cr√≠ticos

**Tu Misi√≥n:**
Filtra y guarda en una lista llamada `eventos_criticos` todos los diccionarios cuyo tipo sea `CRITICAL`.

**Bonus**: Si te atreves, intenta filtrar la lista usando `list(filter(lambda x: ..., ...))` en lugar de un bucle `for`."

In [56]:
# TU C√ìDIGO AQU√ç
eventos_criticos = list(filter(lambda x: x['tipo'] == 'CRITICAL', logs_estructurados))