# Clase 2: Manejo de archivos

<a href="https://colab.research.google.com/github/hizocar/python_andes_analytics/blob/main/docs/modulo_2/clase2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Lectura de Archivos
Abrir un archivo: Usas open(filename, mode) donde filename es el nombre del archivo y mode es 'r' para lectura. Por ejemplo: file = open('example.txt', 'r').

### Leer el contenido: Hay varias maneras de leer el contenido:

- file.read(): Lee el contenido completo del archivo.
- file.readline(): Lee una línea cada vez.
- file.readlines(): Lee todas las líneas y las devuelve como una lista.
- Cerrar el archivo: Siempre debes cerrar el archivo después de leerlo usando file.close().

In [None]:
# Abrir el archivo en modo de lectura
with open('example.txt', 'r') as file:
    content = file.read()
    print(content)

## Escritura de Archivos
Abrir un archivo: Para escribir, usas open(filename, mode) donde mode es 'w' para escritura. Si el archivo no existe, se crea. 
Por ejemplo: file = open('example.txt', 'w').

### Escribir en el archivo: 
Utiliza file.write(texto) para escribir en el archivo.

- Cerrar el archivo: No olvides cerrar el archivo con file.close() después de escribir.

In [None]:
# Abrir el archivo en modo de escritura
with open('example.txt', 'w') as file:
    file.write('Hola, mundo!')

## Uso del with
En los ejemplos anteriores, he utilizado la declaración with para manejar el archivo. Esto es una práctica recomendada porque se encarga de cerrar el archivo automáticamente después de salir del bloque with, incluso si ocurre una excepción.

## Modos Adicionales
- 'a': Modo de anexar. Si el archivo existe, coloca el puntero al final del archivo. Si no existe, crea un nuevo archivo para escritura.
- 'r+': Modo de lectura y escritura. El archivo debe existir.
- 'b': Se añade a otros modos para manejar archivos binarios (ej: 'rb', 'wb').
## Manejo de Excepciones
Es buena práctica manejar excepciones al trabajar con archivos para evitar errores en tiempo de ejecución. Puedes usar bloques try-except para esto.

In [None]:
try:
    with open('non_existent_file.txt', 'r') as file:
        content = file.read()
except FileNotFoundError:
    print("El archivo no existe")

## Archivos de Texto Plano (.txt)
Para leer un archivo de texto, usas la función open() con el modo 'r'.

Ejemplo:

In [None]:
# Leer todo el contenido del archivo
with open('archivo.txt', 'r') as archivo:
    contenido = archivo.read()
    print(contenido)

# Leer el archivo línea por línea
with open('archivo.txt', 'r') as archivo:
    for linea in archivo:
        print(linea.strip())  # strip() elimina los saltos de línea al final


## Archivos CSV (.csv)
Para leer y escribir archivos CSV, puedes utilizar el módulo csv.

Ejemplo:

In [None]:
import csv

# Leer un archivo CSV
with open('datos.csv', mode='r') as archivo:
    lector_csv = csv.reader(archivo)
    for fila in lector_csv:
        print(fila)  # fila es una lista con los campos

# Escribir en un archivo CSV
with open('datos.csv', mode='w', newline='') as archivo:
    escritor_csv = csv.writer(archivo)
    escritor_csv.writerow(['nombre', 'departamento', 'fecha_ingreso'])
    escritor_csv.writerow(['Juan Pérez', 'Ventas', '15/02/2020'])


## Archivos JSON (.json)
El módulo json se utiliza para leer y escribir archivos JSON.

In [None]:
import json

# Leer un archivo JSON
with open('datos.json', 'r') as archivo:
    datos = json.load(archivo)
    print(datos)

# Escribir en un archivo JSON
with open('datos.json', 'w') as archivo:
    json.dump({"nombre": "Ana", "edad": 30}, archivo, indent=4)


## Archivos Excel (.xlsx)
Para trabajar con archivos Excel, puedes usar la biblioteca openpyxl para archivos .xlsx.

In [None]:
from openpyxl import load_workbook

# Leer un archivo Excel
wb = load_workbook('datos.xlsx')
hoja = wb.active
for fila in hoja.iter_rows(values_only=True):
    print(fila)

# Escribir en un archivo Excel
from openpyxl import Workbook
wb = Workbook()
hoja = wb.active
hoja['A1'] = 'Nombre'
hoja['B1'] = 'Edad'
hoja.append(['Carlos', 34])
wb.save('nuevos_datos.xlsx')


## Archivos XML (.xml)
Para leer y escribir archivos XML, puedes utilizar el módulo xml.etree.ElementTree.

Ejemplo:

In [None]:
import xml.etree.ElementTree as ET

# Leer un archivo XML
tree = ET.parse('datos.xml')
root = tree.getroot()
for hijo in root:
    print(hijo.tag, hijo.attrib)

# Escribir en un archivo XML
raiz = ET.Element("datos")
empleado = ET.SubElement(raiz, "empleado", nombre="Juan")
ET.SubElement(empleado, "edad").text = '30'
arbol = ET.ElementTree(raiz)
arbol.write("nuevos_datos.xml")

## Archivos de Imagen
Para trabajar con imágenes, puedes usar la biblioteca Pillow.

Ejemplo:

In [None]:
from PIL import Image

# Abrir una imagen
imagen = Image.open('foto.jpg')
imagen.show()

# Guardar una imagen en otro formato
imagen.save('foto.png')


Para usar Pillow, necesitarás instalar la biblioteca primero con pip install Pillow.

Estos ejemplos te dan una base sobre cómo manejar diferentes tipos de archivos en Python. Cada formato puede tener particularidades y para tareas más avanzadas es recomendable consultar la documentación de cada módulo o biblioteca.

## Ejercicio guiado 

Imaginemos que estamos trabajando en el contexto del actuariado y necesitamos manejar datos de pólizas de seguros. Vamos a crear un diccionario que contenga información sobre una póliza, lo modificaremos añadiendo más información y luego guardaremos este diccionario en un archivo CSV, un archivo de texto plano y un archivo Excel.

Primero, instalaremos las librerías necesarias si aún no están instaladas en tu sistema. Para instalar openpyxl y csv, generalmente usarías pip desde la línea de comandos así:

In [None]:
pip install openpyxl

Dado que en este entorno no puedo instalar paquetes, voy a asumir que ya están instalados para la ejecución del código.

A continuación, te muestro el código Python que realiza lo que has solicitado:

In [1]:
import csv
from openpyxl import Workbook

# Crear un diccionario con datos de una póliza de seguros
poliza = {
    'NumeroPoliza': '12345ABC',
    'NombreAsegurado': 'Juan Pérez',
    'Prima': 350.75,
    'Cobertura': 'Total'
}

# Modificar el diccionario añadiendo más información
poliza.update({
    'Deducible': 500,
    'FechaInicio': '2024-01-01',
    'FechaFin': '2025-01-01'
})

# Guardar el diccionario en un archivo CSV
with open('poliza.csv', 'w', newline='') as archivo_csv:
    writer = csv.DictWriter(archivo_csv, fieldnames=poliza.keys())
    writer.writeheader()
    writer.writerow(poliza)

# Guardar el diccionario en un archivo de texto plano
with open('poliza.txt', 'w') as archivo_txt:
    for key, value in poliza.items():
        archivo_txt.write(f'{key}: {value}\n')

# Guardar el diccionario en un archivo Excel
wb = Workbook()
hoja = wb.active
hoja.append(list(poliza.keys()))  # Encabezados
hoja.append(list(poliza.values()))  # Valores
wb.save('poliza.xlsx')