# 📋 1) Introducción al manejo de archivos y configuración inicial
## **Aspectos analizados**

* Establece las dependencias: Importa todas las librerías que usaremos
* Verifica compatibilidad: Muestra la versión de Pandas instalada
* Prepara el entorno: Asegura que tenemos las herramientas necesarias
* Documentación: Explica las ventajas de usar Pandas para CSV

In [1]:
# Importación de librerías necesarias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Verificar versión de pandas
print(f"Versión de Pandas: {pd.__version__}")
print(F"Versión de Numpy: {np.__version__}")

Versión de Pandas: 2.2.2
Versión de Numpy: 1.26.4


# 📋 2) Lectura de archivos CSV
## **Aspectos analizados**

* Creación de **DATAFRAMES** de prueba para generar archivos CSV
* Manejo de distintos delimitadores
* Opciones adicionales
* Nombres personalizados

In [2]:
# Sintaxis más simple para leer un archivo CSV - read_csv()

# Ejemplo básico (usando datos de muestra)
# df = pd.read_csv('archivo.csv')

# Para demostrar, crearemos datos de ejemplo
datos_ejemplo = {
    'Nombre': ['Juan', 'María', 'Pedro', 'Ana'],
    'Edad': [25, 30, 35, 28],
    'Ciudad': ['Madrid', 'Barcelona', 'Valencia', 'Sevilla'],
    'Salario': [3000, 3500, 4000, 3200]
}

df_ejemplo = pd.DataFrame(datos_ejemplo)
print("DataFrame de ejemplo:")
print(df_ejemplo)


DataFrame de ejemplo:
  Nombre  Edad     Ciudad  Salario
0   Juan    25     Madrid     3000
1  María    30  Barcelona     3500
2  Pedro    35   Valencia     4000
3    Ana    28    Sevilla     3200


In [4]:
""" Ejemplos de delimitadores comunes:
        • Coma (,) - delimitador estándar
        • Punto y coma (;) - común en países europeos
        • Tabulación (t) - para datos tabulados"
        • Espacio ( ) - menos común pero posible

    Ejemplo con punto y coma
        df = pd.read_csv('archivo.csv', sep=';')

    Ejemplo con tabulación
        df = pd.read_csv('archivo.csv', sep='\t') """
# OPCIONES ADICIONALES PARA read_csv()

# Crear archivo CSV de ejemplo para demostrar
# index=False - No incluir el índice del DataFrame como columna en el archivo CSV
df_ejemplo.to_csv('1_ejemplo.csv', index=False)

# 1. Sin encabezados (header=None)
df_sin_header = pd.read_csv('1_ejemplo.csv', header=None)
#header Usa la primera fila como nombres de columnas, por defecto está en 0
#header NONE No hay fila de encabezados, pandas asigna nombres automáticos
print("\nDataFrame sin reconocer encabezados:")
print(df_sin_header.head())



DataFrame sin reconocer encabezados:
        0     1          2        3
0  Nombre  Edad     Ciudad  Salario
1    Juan    25     Madrid     3000
2   María    30  Barcelona     3500
3   Pedro    35   Valencia     4000
4     Ana    28    Sevilla     3200


In [5]:
# 2. Asignar nombres personalizados a las columnas
df_nombres_custom = pd.read_csv('1_ejemplo.csv',
                               header=None,
                               names=['Persona', 'Años', 'Ubicación', 'Sueldo'])
print("DataFrame con nombres personalizados:\n")
#head() - Muestra los primeros 5 registros del Dataframe
print(df_nombres_custom.head())

DataFrame con nombres personalizados:

  Persona  Años  Ubicación   Sueldo
0  Nombre  Edad     Ciudad  Salario
1    Juan    25     Madrid     3000
2   María    30  Barcelona     3500
3   Pedro    35   Valencia     4000
4     Ana    28    Sevilla     3200


In [6]:
#3. Especificar valores nulos personalizados
#Primero creamos un archivo con valores especiales
datos_con_nulos = {
    'Nombre': ['Juan', 'María', '?', 'Ana'],
    'Edad': [25, 30, 'N/A', 28],
    'Ciudad': ['Madrid', 'Barcelona', 'Valencia', '?'],
    'Salario': [3000, 3500, 4000, 'N/A']
}

df_con_nulos = pd.DataFrame(datos_con_nulos)
df_con_nulos.to_csv('2_ejemplo_nulos.csv', index=False)

#Leer especificando valores nulos
#'?' y 'N/A' se convertirán automáticamente a NaN
df_nulos_procesados = pd.read_csv('2_ejemplo_nulos.csv',
                                 na_values=['?', 'N/A'])
print("DataFrame con valores nulos procesados:\n")
print(df_nulos_procesados)
print(f"\nValores nulos encontrados:\n")
print(df_nulos_procesados.isnull().sum())

DataFrame con valores nulos procesados:

  Nombre  Edad     Ciudad  Salario
0   Juan  25.0     Madrid   3000.0
1  María  30.0  Barcelona   3500.0
2    NaN   NaN   Valencia   4000.0
3    Ana  28.0        NaN      NaN

Valores nulos encontrados:

Nombre     1
Edad       1
Ciudad     1
Salario    1
dtype: int64


# 📋 3) Escritura de archivos CSV
## **Aspectos analizados**

* Personalización de exportación
* Guardar un DATAFRAME en archivos CSV
* Preparar el DATAFRAME para exportar

In [7]:
# Preparar DataFrame para exportar
df_para_exportar = df_ejemplo.copy()

# Exportación simple
df_para_exportar.to_csv('3_nuevo_archivo.csv', index=False)
print("Archivo 'nuevo_archivo.csv' creado exitosamente")

# Verificar que se guardó correctamente
df_verificacion = pd.read_csv('3_nuevo_archivo.csv')
print("Contenido del archivo guardado:")
print(df_verificacion)

Archivo 'nuevo_archivo.csv' creado exitosamente
Contenido del archivo guardado:
  Nombre  Edad     Ciudad  Salario
0   Juan    25     Madrid     3000
1  María    30  Barcelona     3500
2  Pedro    35   Valencia     4000
3    Ana    28    Sevilla     3200


In [8]:
# PERSONALIZACIÓN DE LA EXPORTACIÓN CSV
# 1. Cambiar el delimitador a punto y coma
df_para_exportar.to_csv('4_archivo_puntoycoma.csv', sep=';', index=False)
print("Archivo con delimitador ';' creado")

# 2. Especificar codificación UTF-8
df_para_exportar.to_csv('5_archivo_utf8.csv', encoding='utf-8', index=False)
print("Archivo con codificación UTF-8 creado")

# 3. Omitir encabezados
df_para_exportar.to_csv('6_archivo_sin_headers.csv', header=False, index=False)
print("Archivo sin encabezados creado")

Archivo con delimitador ';' creado
Archivo con codificación UTF-8 creado
Archivo sin encabezados creado


In [9]:
# EJEMPLO COMPLETO DE PERSONALIZACIÓN
df_para_exportar.to_csv('7_archivo_personalizado.csv',
                       sep=';',
                       encoding='utf-8',
                       header=False,
                       index=False)

print("Archivo completamente personalizado creado con:")
print("- Delimitador: punto y coma (;)")
print("- Codificación: UTF-8")
print("- Sin encabezados")
print("- Sin índice")

Archivo completamente personalizado creado con:
- Delimitador: punto y coma (;)
- Codificación: UTF-8
- Sin encabezados
- Sin índice


# 📋 4) Lectura de archivos EXCEL
## **Aspectos analizados**

* Lectura básica de un archivo EXCEL
* Lectura de múltiples hojas de un EXCEL

In [10]:
# Leer archivos Excel (.xlsx o .xls)
# Crear un archivo Excel de ejemplo
df_excel_ejemplo = pd.DataFrame({
    'Producto': ['Laptop', 'Mouse', 'Teclado', 'Monitor'],
    'Precio': [800, 25, 60, 300],
    'Stock': [10, 50, 30, 15],
    'Categoria': ['Electrónicos', 'Accesorios', 'Accesorios', 'Electrónicos']
})

# Guardar como Excel
df_excel_ejemplo.to_excel('8_productos.xlsx', index=False)
print("Archivo Excel 'productos.xlsx' creado")

# Leer el archivo Excel
df_desde_excel = pd.read_excel('8_productos.xlsx')
print("Datos leídos desde Excel:")
print(df_desde_excel)

Archivo Excel 'productos.xlsx' creado
Datos leídos desde Excel:
  Producto  Precio  Stock     Categoria
0   Laptop     800     10  Electrónicos
1    Mouse      25     50    Accesorios
2  Teclado      60     30    Accesorios
3  Monitor     300     15  Electrónicos


In [11]:
# %%
# TRABAJANDO CON MÚLTIPLES HOJAS DE EXCEL

# El siguiente código es equivalente a :
# writer = pd.ExcelWriter('9_inventario_multiple.xlsx')
#  ... código ...
# writer.close()  # Se hace automáticamente con 'with'

# Crear archivo Excel con múltiples hojas
with pd.ExcelWriter('9_inventario_multiple.xlsx') as writer:
    # Hoja 1: Productos
    df_productos = pd.DataFrame({
        'ID': [1, 2, 3],
        'Nombre': ['Laptop', 'Mouse', 'Teclado'],
        'Precio': [800, 25, 60]
    })
    df_productos.to_excel(writer, sheet_name='Productos', index=False)

    # Hoja 2: Ventas
    df_ventas = pd.DataFrame({
        'Fecha': ['2024-01-15', '2024-01-16', '2024-01-17'],
        'Producto_ID': [1, 2, 1],
        'Cantidad': [2, 5, 1]
    })
    df_ventas.to_excel(writer, sheet_name='Ventas', index=False)

print("Archivo Excel con múltiples hojas creado")

"""
Para tener la misma estructura con manejo de errores

try:
    with pd.ExcelWriter('inventario.xlsx') as writer:
        df_productos.to_excel(writer, sheet_name='Productos', index=False)
        df_ventas.to_excel(writer, sheet_name='Ventas', index=False)
    print("Archivo Excel creado exitosamente")
except Exception as e:
    print(f"Error al crear el archivo: {e}")
"""

Archivo Excel con múltiples hojas creado


In [12]:
# LEER UNA HOJA ESPECÍFICA
df_productos_leido = pd.read_excel('9_inventario_multiple.xlsx', sheet_name='Productos')
print("Datos de la hoja 'Productos':")
print(df_productos_leido)

Datos de la hoja 'Productos':
   ID   Nombre  Precio
0   1   Laptop     800
1   2    Mouse      25
2   3  Teclado      60


In [13]:
# LEER MÚLTIPLES HOJAS A LA VEZ
df_dict = pd.read_excel('9_inventario_multiple.xlsx', sheet_name=['Productos', 'Ventas'])

print("Hoja 'Productos':")
print(df_dict['Productos'])
print("\nHoja 'Ventas':")
print(df_dict['Ventas'])

Hoja 'Productos':
   ID   Nombre  Precio
0   1   Laptop     800
1   2    Mouse      25
2   3  Teclado      60

Hoja 'Ventas':
        Fecha  Producto_ID  Cantidad
0  2024-01-15            1         2
1  2024-01-16            2         5
2  2024-01-17            1         1


In [14]:
# LEER TODAS LAS HOJAS
# pd.read_excel(sheet_name=None) = Devuelve un diccionario en lugar de un DataFrame
# list() = Convierte dict_keys a una lista normal
df_todas_hojas = pd.read_excel('9_inventario_multiple.xlsx', sheet_name=None)
print("Nombres de todas las hojas:", list(df_todas_hojas.keys()))

Nombres de todas las hojas: ['Productos', 'Ventas']


# 📋 5) Escritura de archivos EXCEL
## **Aspectos analizados**

* Escritura básica de un archivo EXCEL
* Escritura de múltiples hojas de un EXCEL

In [15]:
# EXPORTACIÓN BÁSICA CON to_excel()
df_para_excel = df_ejemplo.copy()

# Exportación simple
df_para_excel.to_excel('10_datos_exportados.xlsx', index=False)
print("Archivo Excel básico creado: 'datos_exportados.xlsx'")

Archivo Excel básico creado: 'datos_exportados.xlsx'


In [16]:
# Preparar diferentes DataFrames
df_empleados = pd.DataFrame({
    'Nombre': ['Juan', 'María', 'Pedro'],
    'Departamento': ['IT', 'RRHH', 'Ventas'],
    'Salario': [3000, 2800, 3200]
})

df_departamentos = pd.DataFrame({
    'Departamento': ['IT', 'RRHH', 'Ventas'],
    'Presupuesto': [50000, 30000, 40000],
    'Empleados': [10, 5, 8]
})

In [17]:
# Crear archivo con múltiples hojas
with pd.ExcelWriter('11_reporte_empresa.xlsx') as writer:
    df_empleados.to_excel(writer, sheet_name='Empleados', index=False)
    df_departamentos.to_excel(writer, sheet_name='Departamentos', index=False)

print("Archivo Excel con múltiples hojas creado: 'reporte_empresa.xlsx'")

Archivo Excel con múltiples hojas creado: 'reporte_empresa.xlsx'


In [18]:
# Verificar que se creó correctamente
print("Hojas disponibles:")
hojas_disponibles = pd.read_excel('11_reporte_empresa.xlsx', sheet_name=None)
for nombre_hoja in hojas_disponibles.keys():
    print(f"- {nombre_hoja}")

Hojas disponibles:
- Empleados
- Departamentos
