## **üìã 1) Introducci√≥n al manejo de archivos y configuraci√≥n inicial**

### **Aspectos analizados**

* Establece las dependencias: Importa todas las librer√≠as que usaremos
* Verifica compatibilidad: Muestra la versi√≥n de Pandas instalada
* Prepara el entorno: Asegura que tenemos las herramientas necesarias
* Documentaci√≥n: Explica las ventajas de usar Pandas para CSV

In [1]:
# Importaci√≥n de librer√≠as necesarias
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Verificar versi√≥n de pandas
print(f"Versi√≥n de Pandas: {pd.__version__}")
print(F"Versi√≥n de Numpy: {np.__version__}")

Versi√≥n de Pandas: 2.2.2
Versi√≥n de Numpy: 1.26.4


## **üìã 2) Lectura de archivos CSV**
### **Aspectos analizados**
* Creaci√≥n de DATAFRAMES de prueba para generar archivos CSV
* Manejo de distintos delimitadores
* Opciones adicionales
* Nombres personalizados

In [2]:
# Sintaxis m√°s simple para leer un archivo CSV - read_csv()

# Ejemplo b√°sico (usando datos de muestra)
# df = pd.read_csv('archivo.csv')

# Para demostrar, crearemos datos de ejemplo
datos_ejemplo = {
    'Nombre': ['Juan', 'Mar√≠a', 'Pedro', 'Ana'],
    'Edad': [25, 30, 35, 28],
    'Ciudad': ['Madrid', 'Barcelona', 'Valencia', 'Sevilla'],
    'Salario': [3000, 3500, 4000, 3200]
}

df_ejemplo = pd.DataFrame(datos_ejemplo)
print("DataFrame de ejemplo:")
print(df_ejemplo)


DataFrame de ejemplo:
  Nombre  Edad     Ciudad  Salario
0   Juan    25     Madrid     3000
1  Mar√≠a    30  Barcelona     3500
2  Pedro    35   Valencia     4000
3    Ana    28    Sevilla     3200


In [3]:
""" Ejemplos de delimitadores comunes:
        ‚Ä¢ Coma (,) - delimitador est√°ndar
        ‚Ä¢ Punto y coma (;) - com√∫n en pa√≠ses europeos
        ‚Ä¢ Tabulaci√≥n (t) - para datos tabulados"
        ‚Ä¢ Espacio ( ) - menos com√∫n pero posible

    Ejemplo con punto y coma
        df = pd.read_csv('archivo.csv', sep=';')

    Ejemplo con tabulaci√≥n
        df = pd.read_csv('archivo.csv', sep='\t') """
# OPCIONES ADICIONALES PARA read_csv()

# Crear archivo CSV de ejemplo para demostrar
# index=False - No incluir el √≠ndice del DataFrame como columna en el archivo CSV
df_ejemplo.to_csv('1_ejemplo.csv', index=False)

# 1. Sin encabezados (header=None)
df_sin_header = pd.read_csv('1_ejemplo.csv', header=None)
#header Usa la primera fila como nombres de columnas, por defecto est√° en 0
#header NONE No hay fila de encabezados, pandas asigna nombres autom√°ticos
print("\nDataFrame sin reconocer encabezados:")
print(df_sin_header.head())


DataFrame sin reconocer encabezados:
        0     1          2        3
0  Nombre  Edad     Ciudad  Salario
1    Juan    25     Madrid     3000
2   Mar√≠a    30  Barcelona     3500
3   Pedro    35   Valencia     4000
4     Ana    28    Sevilla     3200


In [4]:
# 2. Asignar nombres personalizados a las columnas
df_nombres_custom = pd.read_csv('1_ejemplo.csv',
                               header=None,
                               names=['Persona', 'A√±os', 'Ubicaci√≥n', 'Sueldo'])
print("DataFrame con nombres personalizados:\n")
#head() - Muestra los primeros 5 registros del Dataframe
print(df_nombres_custom.head())

DataFrame con nombres personalizados:

  Persona  A√±os  Ubicaci√≥n   Sueldo
0  Nombre  Edad     Ciudad  Salario
1    Juan    25     Madrid     3000
2   Mar√≠a    30  Barcelona     3500
3   Pedro    35   Valencia     4000
4     Ana    28    Sevilla     3200


In [5]:
#3. Especificar valores nulos personalizados
#Primero creamos un archivo con valores especiales
datos_con_nulos = {
    'Nombre': ['Juan', 'Mar√≠a', '?', 'Ana'],
    'Edad': [25, 30, 'N/A', 28],
    'Ciudad': ['Madrid', 'Barcelona', 'Valencia', '?'],
    'Salario': [3000, 3500, 4000, 'N/A']
}

df_con_nulos = pd.DataFrame(datos_con_nulos)
df_con_nulos.to_csv('2_ejemplo_nulos.csv', index=False)

#Leer especificando valores nulos
#'?' y 'N/A' se convertir√°n autom√°ticamente a NaN
df_nulos_procesados = pd.read_csv('2_ejemplo_nulos.csv',
                                 na_values=['?', 'N/A'])
print("DataFrame con valores nulos procesados:\n")
print(df_nulos_procesados)
print(f"\nValores nulos encontrados:\n")
print(df_nulos_procesados.isnull().sum())

DataFrame con valores nulos procesados:

  Nombre  Edad     Ciudad  Salario
0   Juan  25.0     Madrid   3000.0
1  Mar√≠a  30.0  Barcelona   3500.0
2    NaN   NaN   Valencia   4000.0
3    Ana  28.0        NaN      NaN

Valores nulos encontrados:

Nombre     1
Edad       1
Ciudad     1
Salario    1
dtype: int64


## **üìã 3) Escritura de archivos CSV**
### **Aspectos analizados**
* Personalizaci√≥n de exportaci√≥n
* Guardar un DATAFRAME en archivos CSV
* Preparar el DATAFRAME para exportar

In [6]:
# Preparar DataFrame para exportar
df_para_exportar = df_ejemplo.copy()

# Exportaci√≥n simple
df_para_exportar.to_csv('3_nuevo_archivo.csv', index=False)
print("Archivo 'nuevo_archivo.csv' creado exitosamente")

# Verificar que se guard√≥ correctamente
df_verificacion = pd.read_csv('3_nuevo_archivo.csv')
print("Contenido del archivo guardado:")
print(df_verificacion)

Archivo 'nuevo_archivo.csv' creado exitosamente
Contenido del archivo guardado:
  Nombre  Edad     Ciudad  Salario
0   Juan    25     Madrid     3000
1  Mar√≠a    30  Barcelona     3500
2  Pedro    35   Valencia     4000
3    Ana    28    Sevilla     3200


In [7]:
# PERSONALIZACI√ìN DE LA EXPORTACI√ìN CSV
# 1. Cambiar el delimitador a punto y coma
df_para_exportar.to_csv('4_archivo_puntoycoma.csv', sep=';', index=False)
print("Archivo con delimitador ';' creado")

# 2. Especificar codificaci√≥n UTF-8
df_para_exportar.to_csv('5_archivo_utf8.csv', encoding='utf-8', index=False)
print("Archivo con codificaci√≥n UTF-8 creado")

# 3. Omitir encabezados
df_para_exportar.to_csv('6_archivo_sin_headers.csv', header=False, index=False)
print("Archivo sin encabezados creado")

Archivo con delimitador ';' creado
Archivo con codificaci√≥n UTF-8 creado
Archivo sin encabezados creado


In [8]:
# EJEMPLO COMPLETO DE PERSONALIZACI√ìN
df_para_exportar.to_csv('7_archivo_personalizado.csv',
                       sep=';',
                       encoding='utf-8',
                       header=False,
                       index=False)

print("Archivo completamente personalizado creado con:")
print("- Delimitador: punto y coma (;)")
print("- Codificaci√≥n: UTF-8")
print("- Sin encabezados")
print("- Sin √≠ndice")

Archivo completamente personalizado creado con:
- Delimitador: punto y coma (;)
- Codificaci√≥n: UTF-8
- Sin encabezados
- Sin √≠ndice


## **üìã 4) Lectura de archivos EXCEL**
### **Aspectos analizados**
* Lectura b√°sica de un archivo EXCEL
* Lectura de m√∫ltiples hojas de un EXCEL

In [9]:
# Leer archivos Excel (.xlsx o .xls)
# Crear un archivo Excel de ejemplo
df_excel_ejemplo = pd.DataFrame({
    'Producto': ['Laptop', 'Mouse', 'Teclado', 'Monitor'],
    'Precio': [800, 25, 60, 300],
    'Stock': [10, 50, 30, 15],
    'Categoria': ['Electr√≥nicos', 'Accesorios', 'Accesorios', 'Electr√≥nicos']
})

# Guardar como Excel
df_excel_ejemplo.to_excel('8_productos.xlsx', index=False)
print("Archivo Excel 'productos.xlsx' creado")

# Leer el archivo Excel
df_desde_excel = pd.read_excel('8_productos.xlsx')
print("Datos le√≠dos desde Excel:")
print(df_desde_excel)

Archivo Excel 'productos.xlsx' creado
Datos le√≠dos desde Excel:
  Producto  Precio  Stock     Categoria
0   Laptop     800     10  Electr√≥nicos
1    Mouse      25     50    Accesorios
2  Teclado      60     30    Accesorios
3  Monitor     300     15  Electr√≥nicos


In [10]:
# %%
# TRABAJANDO CON M√öLTIPLES HOJAS DE EXCEL

# El siguiente c√≥digo es equivalente a :
# writer = pd.ExcelWriter('9_inventario_multiple.xlsx')
#  ... c√≥digo ...
# writer.close()  # Se hace autom√°ticamente con 'with'

# Crear archivo Excel con m√∫ltiples hojas
with pd.ExcelWriter('9_inventario_multiple.xlsx') as writer:
    # Hoja 1: Productos
    df_productos = pd.DataFrame({
        'ID': [1, 2, 3],
        'Nombre': ['Laptop', 'Mouse', 'Teclado'],
        'Precio': [800, 25, 60]
    })
    df_productos.to_excel(writer, sheet_name='Productos', index=False)

    # Hoja 2: Ventas
    df_ventas = pd.DataFrame({
        'Fecha': ['2024-01-15', '2024-01-16', '2024-01-17'],
        'Producto_ID': [1, 2, 1],
        'Cantidad': [2, 5, 1]
    })
    df_ventas.to_excel(writer, sheet_name='Ventas', index=False)

"""
Para tener la misma estructura con manejo de errores

try:
    with pd.ExcelWriter('inventario.xlsx') as writer:
        df_productos.to_excel(writer, sheet_name='Productos', index=False)
        df_ventas.to_excel(writer, sheet_name='Ventas', index=False)
    print("Archivo Excel creado exitosamente")
except Exception as e:
    print(f"Error al crear el archivo: {e}")
"""

print("Archivo Excel con m√∫ltiples hojas creado")

Archivo Excel con m√∫ltiples hojas creado


In [11]:
# LEER UNA HOJA ESPEC√çFICA
df_productos_leido = pd.read_excel('9_inventario_multiple.xlsx', sheet_name='Productos')
print("Datos de la hoja 'Productos':")
print(df_productos_leido)

Datos de la hoja 'Productos':
   ID   Nombre  Precio
0   1   Laptop     800
1   2    Mouse      25
2   3  Teclado      60


In [12]:
# LEER M√öLTIPLES HOJAS A LA VEZ
df_dict = pd.read_excel('9_inventario_multiple.xlsx', sheet_name=['Productos', 'Ventas'])

print("Hoja 'Productos':")
print(df_dict['Productos'])
print("\nHoja 'Ventas':")
print(df_dict['Ventas'])

Hoja 'Productos':
   ID   Nombre  Precio
0   1   Laptop     800
1   2    Mouse      25
2   3  Teclado      60

Hoja 'Ventas':
        Fecha  Producto_ID  Cantidad
0  2024-01-15            1         2
1  2024-01-16            2         5
2  2024-01-17            1         1


In [13]:
# LEER TODAS LAS HOJAS
# pd.read_excel(sheet_name=None) = Devuelve un diccionario en lugar de un DataFrame
# list() = Convierte dict_keys a una lista normal
df_todas_hojas = pd.read_excel('9_inventario_multiple.xlsx', sheet_name=None)
print("Nombres de todas las hojas:", list(df_todas_hojas.keys()))

Nombres de todas las hojas: ['Productos', 'Ventas']


## **üìã 5) Escritura de archivos EXCEL**
### **Aspectos analizados**
* Escritura b√°sica de un archivo EXCEL
* Escritura de m√∫ltiples hojas de un EXCEL

In [14]:
# EXPORTACI√ìN B√ÅSICA CON to_excel()
df_para_excel = df_ejemplo.copy()

# Exportaci√≥n simple
df_para_excel.to_excel('10_datos_exportados.xlsx', index=False)
print("Archivo Excel b√°sico creado: 'datos_exportados.xlsx'")

Archivo Excel b√°sico creado: 'datos_exportados.xlsx'


In [15]:
# Preparar diferentes DataFrames
df_empleados = pd.DataFrame({
    'Nombre': ['Juan', 'Mar√≠a', 'Pedro'],
    'Departamento': ['IT', 'RRHH', 'Ventas'],
    'Salario': [3000, 2800, 3200]
})

df_departamentos = pd.DataFrame({
    'Departamento': ['IT', 'RRHH', 'Ventas'],
    'Presupuesto': [50000, 30000, 40000],
    'Empleados': [10, 5, 8]
})

In [16]:
# Crear archivo con m√∫ltiples hojas
with pd.ExcelWriter('11_reporte_empresa.xlsx') as writer:
    df_empleados.to_excel(writer, sheet_name='Empleados', index=False)
    df_departamentos.to_excel(writer, sheet_name='Departamentos', index=False)

print("Archivo Excel con m√∫ltiples hojas creado: 'reporte_empresa.xlsx'")

Archivo Excel con m√∫ltiples hojas creado: 'reporte_empresa.xlsx'


In [17]:
# Verificar que se cre√≥ correctamente
print("Hojas disponibles:")
hojas_disponibles = pd.read_excel('11_reporte_empresa.xlsx', sheet_name=None)
for nombre_hoja in hojas_disponibles.keys():
    print(f"- {nombre_hoja}")

Hojas disponibles:
- Empleados
- Departamentos
