<a href="https://colab.research.google.com/github/Material-Educativo/Tecnicas-heuristicas/blob/main/Pandas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Pandas
En este notebook se presentan las funciones de la biblioteca pandas que serán empleadas en el libro.

Debe mencionarse que pandas es muy importante en áreas como inteligencias artificial, ciencias de datos, etc. Por lo que un estudio más profundo sobre sus capacidades es una actividad deseable pero se encuentra fuera del alcance de este libro.

**Observación**: Antes de continuar copia este notebook en tu drive y realiza los pasos para montar drive.

Pandas es una biblioteca de Python utilizada para el análisis y manejo de bases de datos.

Emplea estructuras de datos con dos dimensiones, conocidos como *DataFrame*, para guardar y trabajar con la información, semejante a una hoja de cálculo. Sus usos más comunes incluyen importar información desde archivos en diferentes formatos como csv, xlsx, json, txt, entre otros, limpieza de datos para eliminar valores nulos o duplicados, filtrado de información, manejo de series de tiempo, y mucho más.

En este libro le daremos un uso muy pequeñito a pandas, sólo la emplearemos para almacenar, y leer, los resultados obtenidos por los algoritmos en archivos de formato csv.

El primer paso consistirá en usar pandas para guardar información en archivos con formato csv en drive.

Para poder trabajar con pandas se debe importar la biblioteca usando la palabra $import$.

In [None]:
import pandas as pd

Es importante mencionar que para importar pandas sólo se requiere escribir *import pandas*. Sin embargo, es muy común "renombrar" las bibliotecas con textos más cortos, en este caso *pd*. De esta forma, cada vez que se requiera alguna función de pandas se podrá llamar haciendo alusión a su nombre corto.

Es importante mencionar que puede cualquier nombre corto, excepto palabras reservadas, pero es muy común usar *pd* para referirse a pandas.

Ahora se mostrará la forma de convertir una lista con algunos valores numé- ricos en un *DataFrame* de pandas. Este ejemplo resultará útil para almacenar los resultados de las técnicas heurísticas que se desarrollarán en el libro.

Primero se crea una lista con algunos valores numéricos.

**Caso de uso**: Tienes una lista con los costos de soluciones encontradas por tu algoritmo y quieres organizarlas en una tabla.


In [None]:
# Paso 1: Crear lista con resultados (ejemplo: costos de soluciones)
costos = [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]

# Paso 2: Convertir a DataFrame
# - pd.DataFrame() crea la tabla
# - columns=['costo'] nombra la columna
df = pd.DataFrame(costos, columns=['costo'])

# Paso 3: Visualizar primeros 5 renglones
# head() muestra las primeras filas (por defecto: 5)
df.head()

# Crear un $DataFrame$ con muchas columnas.

Útil por ejemplo, cuando un algoritmo genera varios datos en cada corrida, como  iteración, costo, tiempo, etc.

In [None]:
# Crear diccionario con datos
datos = {
    'iteracion': [1, 2, 3, 4, 5],
    'costo': [100, 95, 90, 92, 88],
    'tiempo_segundos': [0.1, 0.15, 0.12, 0.14, 0.11]
}

# Convertir a DataFrame
resultados = pd.DataFrame(datos)

# Visualizar
print(resultados)

# Guardar un archivo en tu unidad $Drive$

In [None]:
# Pegar la ruta copiada (Ctrl+V o Cmd+V)
carpeta = "/content/drive/MyDrive/Colab Notebooks"

# Agregar nombre del archivo
nombre_archivo = "resultados_algoritmo.csv"

# Ruta completa
ruta_csv = carpeta + "/" + nombre_archivo

# Equivalente con f-string (recomendado)
ruta_csv = f"{carpeta}/{nombre_archivo}"

print(f"Guardare en: {ruta_csv}")


In [None]:
# Metodo 1: Ruta completa en una linea
resultados.to_csv("/content/drive/MyDrive/Colab Notebooks/mis_resultados.csv",
          index=False)

# Metodo 2: Usando variable
ruta_csv = "/content/drive/MyDrive/Colab Notebooks/mis_resultados.csv"
resultados.to_csv(ruta_csv, index=False)

# Mensaje de confirmacion
print(f"Archivo guardado exitosamente en:")
print(ruta_csv)


# Cargar un CSV desde $Drive$ en un $DataFrame$

In [None]:
# Especificar ruta del archivo a leer
ruta_csv = '/content/drive/MyDrive/Colab Notebooks/mis_resultados.csv'

# Cargar datos en DataFrame
# pd.read_csv() lee el archivo y crea el DataFrame automaticamente
df_cargado = pd.read_csv(ruta_csv)

# Opcion 1: Ver las primeras filas
print(df_cargado.head())

# Opcion 2: Ver todo (si el dataset es pequeno)
print(df_cargado)

# Opcion 3: Informacion general del DataFrame
print(df_cargado.info())

# Operaciones básicas con $DataFrames$

In [None]:
# Seleccionar una columna
costos = df_cargado['costo']  # Retorna una Serie (columna individual)

# Seleccionar multiples columnas
subset = df_cargado[['costo', 'iteracion']]  # Retorna DataFrame

# Filtrar filas que cumplan condicion
mejores = df_cargado[df_cargado['costo'] < 95]  # Solo filas con costo menor a 95

# Agregar nueva columna
df_cargado['mejora'] = df_cargado['costo'] - df_cargado['costo'].min()

# Obtener minimo, maximo, promedio
mejor_costo = df_cargado['costo'].min()
peor_costo = df_cargado['costo'].max()
promedio = df_cargado['costo'].mean()

print(f"Mejor solucion: {mejor_costo}")
print(f"Peor solucion: {peor_costo}")
print(f"Promedio: {promedio:.2f}")