# Principios de Informática: Manipulación de Archivos 💾

### Guardando y cargando nuestros datos para que perduren

**Curso:** Principios de Informática

---

## ¿Qué es un Archivo y Por Qué es Importante? 🤔

Hasta ahora, todos los datos con los que hemos trabajado (variables, listas, etc.) han vivido en la **memoria RAM**. Esta memoria es **volátil**, lo que significa que cuando nuestro programa termina o apagamos la computadora, ¡toda la información se pierde!

Un **archivo** es un contenedor de información en un dispositivo de almacenamiento **no volátil** (como un disco duro, un SSD o una memoria USB). Nos permite la **persistencia de datos**: guardar el estado de nuestro programa, los resultados de nuestros cálculos o cualquier información para poder usarla en el futuro.

**Analogía**: La memoria RAM es como tu memoria a corto plazo para pensar en un problema. Un archivo es como un cuaderno donde anotas la solución para que no se te olvide. 📓

---

## Bibliotecas para el Análisis de Datos 📊

Aunque Python puede manejar archivos de texto básicos por sí mismo, para tareas más complejas como trabajar con hojas de cálculo o grandes conjuntos de datos, usamos bibliotecas especializadas.

La biblioteca más importante para el análisis de datos en Python es **Pandas**.

**Pandas** introduce dos estructuras de datos súper poderosas:

  * **`Series`**: Es como una columna de una tabla. Un arreglo de una dimensión con etiquetas (un índice).
  * **`DataFrame`**: Es una tabla completa, con filas y columnas. Es la estructura de datos principal en Pandas y puedes pensar en ella como una hoja de Excel o una tabla de SQL.

Para instalar pandas (si no lo tienes), abre tu terminal y escribe: `pip install pandas openpyxl`

---

## 📄 Trabajando con Archivos de Texto (.txt)

Los archivos de texto plano son la forma más simple de persistencia. No tienen formato, solo caracteres.

---

### Escribiendo en un archivo .txt

Usamos la función `open()` con el modo `'w'` (write/escribir).

**¡Cuidado!** El modo `'w'` **sobrescribe** el archivo si ya existe. Si quieres añadir al final, usa el modo `'a'` (append/añadir).

---

In [None]:
def guardar_log(mensaje: str, nombre_archivo: str = "log.txt") -> None:
    """Escribe un mensaje en un archivo de texto con la fecha y hora."""
    import datetime
    # 'with' se asegura de que el archivo se cierre automáticamente
    with open(nombre_archivo, 'a') as archivo:
        timestamp = datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S")
        archivo.write(f"[{timestamp}] - {mensaje}\n")

# Escribimos varias líneas en nuestro log

guardar_log("Inicio del proceso de simulación.")
guardar_log("Cargando parámetros iniciales.")
guardar_log("Simulación completada con éxito.")
print("Se ha escrito en el archivo 'log.txt'")

---

### Leyendo desde un archivo .txt

Usamos la función `open()` con el modo `'r'` (read/leer).

---

**Ejercicio: Leer el Log**
Escribe un programa que lea el archivo `log.txt` que acabas de crear y muestre su contenido en la consola.

---

In [None]:
def leer_log(nombre_archivo: str = "log.txt") -> None:
    """Lee un archivo de texto y muestra su contenido."""
    try:
        with open(nombre_archivo, 'r') as archivo:
            contenido = archivo.read()
            print("--- Contenido del Log ---")
            print(contenido)
    except FileNotFoundError:
        print(f"Error: El archivo '{nombre_archivo}' no fue encontrado.")

leer_log()

---

## 📈 Trabajando con Archivos CSV y Excel

Para datos tabulares (como hojas de cálculo), Pandas es la herramienta ideal.

  * **CSV (Comma-Separated Values)**: Un formato de texto simple donde los valores de las columnas se separan por comas. Es universal y ligero.
  * **XLSX (Excel)**: El formato nativo de Microsoft Excel. Puede contener múltiples hojas, fórmulas y formato.

---

### Creando un DataFrame y guardándolo en CSV

Primero, creamos un DataFrame de Pandas a partir de un diccionario. Luego, usamos el método `.to_csv()` para guardarlo.

---

In [None]:
import pandas as pd

# Creamos un diccionario con los datos

datos_sensores = {
    'tiempo_seg': [0, 1, 2, 3, 4],
    'temperatura_C': [25.1, 25.3, 25.2, 25.4, 25.5],
    'humedad_pct': [45, 46, 45, 47, 48]
}

# Creamos el DataFrame

df_sensores = pd.DataFrame(datos_sensores)

print("--- Nuestro DataFrame ---")
print(df_sensores)

# Guardamos el DataFrame en un archivo CSV

# index=False evita que se guarde el índice del DataFrame en el archivo

df_sensores.to_csv("datos_sensores.csv", index=False)

print("\n✅ DataFrame guardado en 'datos_sensores.csv'")

---

### Cargando un archivo CSV a un DataFrame

Para cargar los datos, usamos la función `pd.read_csv()`.

---

**Ejercicio: Cargar y Analizar Datos**
Carga el archivo `datos_sensores.csv` que acabas de crear y realiza estas operaciones básicas:

1.  Muestra las primeras 3 filas (`.head()`).
2.  Calcula la temperatura promedio (`.mean()`).
3.  Describe estadísticamente los datos (`.describe()`).

---

In [None]:
import pandas as pd

# Cargamos el archivo CSV en un nuevo DataFrame

df_cargado = pd.read_csv("datos_sensores.csv")

print("--- DataFrame Cargado desde CSV ---")
print(df_cargado)

# 1. Primeras 3 filas

print("\n--- Primeras 3 filas ---")
print(df_cargado.head(3))

# 2. Temperatura promedio

temp_promedio = df_cargado['temperatura_C'].mean()
print(f"\n🌡️ Temperatura promedio: {temp_promedio:.2f}°C")

# 3. Descripción estadística

print("\n--- Resumen Estadístico ---")
print(df_cargado.describe())

---

### Trabajando con Archivos Excel (.xlsx)

Es casi idéntico a trabajar con CSV, pero usamos `.to_excel()` y `pd.read_excel()`.

---

In [None]:
import pandas as pd

# Usaremos el mismo DataFrame de antes

datos_sensores = {
    'tiempo_seg': [0, 1, 2, 3, 4],
    'temperatura_C': [25.1, 25.3, 25.2, 25.4, 25.5],
    'humedad_pct': [45, 46, 45, 47, 48]
}
df_sensores = pd.DataFrame(datos_sensores)

# Guardar en un archivo Excel

df_sensores.to_excel("datos_sensores.xlsx", sheet_name="Lecturas", index=False)

# Cargar desde un archivo Excel

df_excel = pd.read_excel("datos_sensores.xlsx", sheet_name="Lecturas")

print("--- DataFrame cargado desde Excel ---")
print(df_excel)
print("\n✅ Operaciones con Excel completadas.")

---

## 🖼️ Manipulación de Imágenes (JPEG)

Para manipular imágenes, una de las bibliotecas más populares es **Pillow**, una continuación del proyecto PIL (Python Imaging Library).

Para instalarla: `pip install Pillow`

---

**Ejercicio: Abrir y Analizar una Imagen**
Vamos a abrir una imagen, ver sus propiedades básicas y crear una versión en escala de grises. (Nota: para este ejercicio, necesitarás tener un archivo de imagen llamado "robot.jpg" en la misma carpeta).

*(Si no tienes una imagen, puedes buscar una en internet y guardarla como "robot.jpg")*

---

In [None]:
from PIL import Image

try:
    # Abrir la imagen
    img = Image.open("robot.jpg")

    # Mostrar información básica
    print(f"Formato de la imagen: {img.format}")
    print(f"Tamaño de la imagen (ancho x alto): {img.size}")
    print(f"Modo de color: {img.mode}") # RGB, L (escala de grises), etc.

    # Convertir a escala de grises
    img_gris = img.convert("L")

    # Guardar la nueva imagen
    img_gris.save("robot_gris.jpg")

    print("\n✅ Imagen convertida a escala de grises y guardada como 'robot_gris.jpg'")

    # Opcional: mostrar la imagen (puede no funcionar en todos los entornos)
    # img.show()
    # img_gris.show()

except FileNotFoundError:
    print("Error: Asegúrate de tener un archivo 'robot.jpg' en la misma carpeta.")

---

## ✏️ Ejercicios Finales de Práctica

---

**1. Agenda de Contactos (CSV):**
Crea un programa que pida al usuario un nombre y un número de teléfono, y lo guarde en un archivo `contactos.csv`. Si el archivo ya existe, debe añadir el nuevo contacto sin borrar los anteriores.

---

In [None]:
import pandas as pd
import os

nombre = input("Ingresa el nombre del contacto: ")
telefono = input("Ingresa el número de teléfono: ")

nuevo_contacto = pd.DataFrame([{'nombre': nombre, 'telefono': telefono}])

# 'a' para append (añadir), header=False para no escribir el encabezado de nuevo

nuevo_contacto.to_csv('contactos.csv', mode='a', header=not os.path.exists('contactos.csv'), index=False)

print(f"Contacto '{nombre}' guardado.")

---

**2. Promedio de Notas (Excel):**
Crea un archivo Excel llamado `calificaciones.xlsx` con columnas "Estudiante", "Nota1", "Nota2". Luego, escribe un programa que lea el archivo, calcule una nueva columna "Promedio" y guarde el resultado en una nueva hoja llamada "Resultados Finales" dentro del mismo archivo.

---

In [None]:
import pandas as pd

# Crear el DataFrame inicial y guardarlo

datos_calificaciones = {
    "Estudiante": ["Ana", "Juan", "Pedro"],
    "Nota1": [85, 90, 78],
    "Nota2": [92, 88, 80]
}
df_calif = pd.DataFrame(datos_calificaciones)
df_calif.to_excel("calificaciones.xlsx", sheet_name="Notas Parciales", index=False)

# Leer el archivo

df_leido = pd.read_excel("calificaciones.xlsx", sheet_name="Notas Parciales")

# Calcular el promedio

df_leido['Promedio'] = df_leido[['Nota1', 'Nota2']].mean(axis=1)

# Guardar en una nueva hoja

with pd.ExcelWriter('calificaciones.xlsx', mode='a', engine='openpyxl') as writer:
    df_leido.to_excel(writer, sheet_name='Resultados Finales', index=False)

print("Archivo 'calificaciones.xlsx' actualizado con la hoja 'Resultados Finales'.")

---

**3. Rotar una Imagen:**
Usa la biblioteca Pillow para abrir una imagen y guardarla rotada 90 grados.

---

In [None]:
from PIL import Image

try:
    img = Image.open("robot.jpg")
    img_rotada = img.rotate(90)
    img_rotada.save("robot_rotado.jpg")
    print("Imagen rotada y guardada como 'robot_rotado.jpg'")
except FileNotFoundError:
    print("Error: No se encontró el archivo 'robot.jpg'")

---

**4. Filtrar Datos de CSV:**
Lee el archivo `datos_sensores.csv`. Filtra y muestra solo las filas donde la temperatura sea mayor a 25.3.

---

In [None]:
import pandas as pd

try:
    df = pd.read_csv("datos_sensores.csv")
    temperaturas_altas = df[df['temperatura_C'] > 25.3]
    print("--- Filas con temperatura mayor a 25.3°C ---")
    print(temperaturas_altas)
except FileNotFoundError:
    print("Error: Ejecuta primero la celda que crea 'datos_sensores.csv'")

---

**5. Contar Líneas de un Archivo:**
Escribe una función que reciba el nombre de un archivo de texto y devuelva el número de líneas que contiene. Úsala para contar las líneas del archivo `log.txt`.

---

In [None]:
def contar_lineas(nombre_archivo: str) -> int:
    """Cuenta el número de líneas en un archivo de texto."""
    try:
        with open(nombre_archivo, 'r') as archivo:
            return len(archivo.readlines())
    except FileNotFoundError:
        return 0

num_lineas = contar_lineas("log.txt")
print(f"El archivo 'log.txt' tiene {num_lineas} líneas.")