[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/m-durand/propedeutico_python/blob/main/notebooks/8_errores_y_debugging.ipynb)

# Propedéutico a programación con Python.

**Verano 2024, por el Centro de Ciencia de Datos, EGobiernoyTP.**

## Sesión 8: Errores y _debugging_

1. Errores comunes
    * Signos faltantes (e.g. paréntesis, dos puntos, comas, etc.)
    * Indentación
    * Typos
    * Tipo incorrecto de variable
2. Debugging
   * Recomendaciones generales
   * Buenas prácticas de programación
3. Herramientas útiles
    * Stack Overflow
    * ChatGPT
    * Documentación oficial
    
    

Todos los programadores, independientemente de nuestro nivel de experiencia, se enfrentan a errores y contratiempos cuando escribimos código. La mejor manera de aprender es cometiendo errores y corrigiéndolos, además de que es sumamente útil familiarizarse con ellos y aprender a leer los mensajes de error para poder diagnosticar el problema correctamente.

Además, exploraremos herramientas esenciales que pueden ayudarnos en este proceso. Herramientas como Stack Overflow, un foro donde millones de programadores comparten soluciones a problemas de codificación, y ChatGPT, un asistente de inteligencia artificial que puede responder a consultas de código y ayudar a solucionar problemas de programación. Asimismo, es bueno familiarizarse con la documentación oficial de Python o de las librerías que utilices, ésta se encuentra en el sitio oficial de Python y describe con detalle el funcionamiento, características y los requisitos de las funciones u objetos de Python.


# Errores comunes

**Signos faltantes**

In [None]:
# Incorrecto
print "Hola Mundo"

In [None]:
# Correcto
print("Hola Mundo")

In [None]:
# Incorrecto
def di_hola()
    print("Hola")

In [None]:
# Correcto
def di_hola():
    print("Hola")

**Indentación**

In [None]:
# Incorrecto
def di_hola():
print("Hola")

In [None]:
# Correcto
def di_hola():
    print("Hola")

**Typos**

In [None]:
saludo = "Hola"
print(sauldo)

In [None]:
saludo = "Hola"
print(saludo)

**Tipo incorrecto de variable**

In [None]:
edad = input("Ingresa tu edad: ")
if edad < 18:
    print("No tienes la edad suficiente para votar.")

In [None]:
edad = int(input("Ingresa tu edad: "))
if edad < 18:
    print("No tienes la edad suficiente para votar.")

# _Debugging_

El término _debugging_ en realidad se utiliza para el proceso de buscar errores/problemas en el código y solucionarlos, y por lo tanto puede ser tan sencillo o complejo como el mismo código. En general, lo que a mí em viene a la cabeza cuando pienso en _debugging_ es una de dos situaciones:

1. Mi código no "corre", así que necesito encontrar el error o inconsistencia para arreglarlo y que no me marque errores.
2. Mi código "corre" pero devuelve resultados que no son consistentes con lo que o esperaría, así que necesito encontrar el error o inconsistencia para arreglarlo y que sí de resultados correctos.


El paso uno es respirar y aceptar que una gran parte de la programación es corregir errores. Para los casos del tipo 1, lo primero que debes hacer es leer el error, muchas veces las descripciones son muy explícitas y ayudan a aclaralo rápidamente, y cuando no sean expícitas igualmente son la pista principal para comenzar la solución; normalmente la usarás junto con las herramientas de la sección *Herramientas útiles*. Mientras que para los casos del tipo 2, puedes dividir el problema grande en partes pequeñas y probar que cada parte pequeña esté funcionado como se espera.

---

## Buenas prácticas de programación

Cuando tienes un error no queda más que solucionarlo pero lo mejor es evitar que ocurra en primer lugar, para ello se sugiere mantener buenas prácticas de programación, éstas incluyen: documentar el código, dividir en tareas simples, hacer pruebas de cada sección, utilizar nombres de variables que revelen información útil, etc. Revisemos con mayor detalle algunas: 

 - documentar/comentar tu código: es común que tu yo del futuro no recuerde lo que tu yo del pasado quería hacer al programar cierta sección código, además, la documentación es esencial si haces proyectos en equipo.
 - construir tu código con funciones/secciones aisladas, probar que cada una funcione de manera adecuada y unirlas al final. Hacer las tareas de manera aislada permite que hagas distintas pruebas en cada parte simplificando mucho la tarea de encontrar errores en el funcionamiento.
 - nombrar las variables de manera descriptiva: puedes incluir palabras que describan el contenido y el tipo de datos. Trata de encontrar un equilibrio entre que no sean abreviaciones difíciles de descifrar pero que tampoco sean nombres muy largos; hacer ambas permite leer y entender el funcionamiento del código más fácilmente.
 - hacer condicionales que te "avisen" (impriman una leyenda, detengan el código, regresen un valor especial) si hay una situación/dato/formato no esperado.
 - tratar de hacer códigos lo más pequeños posibles: si hay menos líneas de código hay menos errores potenciales.
 - evitar repetir partes de tu código -va en la línea de minimizar el tamaño de tu código. Si hay una sección de código que estés copiando y pegando con ligeras modificaciones es indicativo de que en lugar de ello podrías crear una función que tenga como argumentos las partes que modificas.
 - utilizar tipos adecuados para tus datos, por ejemplo, si hay datos que no quieras que se modifiquen en ningún escenario guárdalo en tuplas (que son inmutables).
- aprovechar funciones ya programadas en librerías de Python: antes de decidir construir una función por tu cuenta investiga si hay una función incluída en Python o en una librería no estándar (una librería que debes instalar) para hacer la tarea o una parte de la tarea que buscas. Dichas funciones ya están probadas y suelen estar programadas de manera eficiente.
- hacer tu código legible: se dice que un código se lee muchas más veces de las que se escribe, para procurar hacerlo más amigable a la vista, consistente y para seguir convenciones de la comunidad de Python, existe un estándar llamado PEP. Las guías las puedes encontrar en https://peps.python.org/pep-0008/.

# Herramientas útiles

## ¿Qué es y para qué es Stack Overflow?

Stack Overflow es un sitio web de preguntas y respuestas para profesionales y entusiastas de la programación. 

Los usuarios pueden hacer preguntas sobre problemas de código específicos que encuentran y otros usuarios (desde principiantes hasta expertos en la materia) pueden proporcionar respuestas. Las respuestas pueden ser votadas por la comunidad, y las respuestas con más votos se mueven hacia arriba en la lista de respuestas para una pregunta dada. 

En general, Stack Overflow sirve como un repositorio de soluciones a problemas de programación. Muchas veces, los problemas que los programadores encuentran ya han sido resueltos por otros.

Stack Overflow es un sitio en inglés. En general, mi recomendación es que siempre Googleen (o ChatGPT-een, ya llegaremos a esto) sus dudas de código en inglés, pues los manuales de las librerías o las perguntas/respuestas en Stack Overflow estarán en ese idioma, y en general hay mucho más recursos respecto a código en inglés.

Usemos Stack Overflow para resolver los siguientes problemas:

**Buscar mensajes de error**

In [None]:
# Creamos un rango de fechas de enero a diciembre
fechas = pd.date_range(start='1/1/2023', end='12/31/2023')

# Generamos datos de ventas aleatorios
ventas = pd.Series(data=np.random.randint(100, 500, len(fechas)), index=fechas)

# Creamos el DataFrame
df = pd.DataFrame(ventas, columns=['Ventas'])

# Graficamos
plt.figure(figsize=(10,6))
plt.plot(df.index, df['Ventas'])
plt.title('Ventas a lo largo del tiempo')
plt.xlabel('Fecha')
plt.ylabel('Ventas')
plt.grid(True)
plt.show()

Aquí hay una respuesta de Stack Overflow:

https://stackoverflow.com/questions/40407090/nameerror-name-pd-is-not-defined

**Hacer preguntas completas de cómo realizar una actividad específica con código*

Al escribir una pregunta en Google, generalmente Stack Overflow se encontrará en los primeros resultados. Por ejemplo, para la búsqueda:

`how to show points in a map python`

Se obtiene:

https://stackoverflow.com/questions/53233228/plot-latitude-longitude-from-csv-in-python-3-6

## ¿Qué es y para qué es ChatGPT?

GPT puede ayudar a sugerirles dónde se encuentra el error en un código que no corre, pasos para solucionar un mensaje de error desconocido o cambiar partes específicas de un código que ya tengan escrito.

In [None]:
def print_board(board):
    print('---------')
    for row in board:
        print('|', end='')
        for cell in row:
            print(cell, end=' ')
        print('|')
    print('---------')

def get_move(player):
    while True:
        move = input(f"Jugador {player}, ingresa tu jugada como 'fila,columna': ")
        try:
            row, col = map(int, movesplit(','))
            if row in [0, 1, 2] and col in [0, 1, 2]:
                return row, col
            else:
                print("Las coordenadas deben estar entre 0 y 2.")
        except ValueError:
            print("Entrada no válida. Usa el formato 'fila,columna'.")

def game():
    # Crear el tablero
    board = [[' ' for _ in range(3)] for _ in range(3)]
    current_player = 'X'

    while True:
        # Mostrar el tablero
        print_board(board)

        # Solicitar jugada
        row, col = get_move(current_player)
        if board[row][col] != ' ':
            print("Esa celda ya está ocupada, elige otra.")
            continue

        # Realizar jugada
        board[row][col] = current_player

        # Verificar si el jugador actual ha ganado
        if (any(all(cell == current_player for cell in row) for row in board) or  # filas
            any(all(row[i] == current_player for row in board) for i in range(3)) or  # columnas
            all(board[i][i] == current_player for i in range(3)) or  # diagonal principal
            all(board[i][2 - i] == current_player for i in range(3))):  # diagonal secundaria
            print_board(board)
            print(f"¡Jugador {current_player} ha ganado!")
            break

        # Cambiar de jugador
        current_player = 'O' if current_player == 'X' else 'X'

    # Preguntar si quieren jugar de nuevo
    again = input("¿Quieres jugar de nuevo? (sí/no): ")
    if again.lower().startswith('s'):
        game()

# Iniciar el juego
game()


Usando el prompt:
    
`Hey! This code doesn't run, could you help me find the error? ______`

Se obtiene la respuesta:
        
        ![Respuesta GPT](../src/img/gpt_debug.png)
        
TODO insertar imagen :(

**Ejercicio**

Corrige el error con la sugerencia de ChatGPT y describe qué hace el código.

* Ejemplo 2: un error malvado

Para hacer cálculos de manera óptima la librería más utilizada es numpy. Con ella puedes crear arreglos en los que las funciones de numpy están diseñadas para ser eficientes en memoria y tiempo de cálculo.
Por otro lado, es común que algunos valores de tus datos sean desconocidos. En el siguiente ejemplo podemos pedir a ChatGPT que solucione el error y que nos explique por qué no se puede asignar un valor desconocido (NaN) a un arreglo simple. 

In [None]:
import numpy as np

a = np.array([10, 20, 30, 40, 50, 60, 70])

a[0] = np.NaN

**Ejemplo 3: editar código existente*
    
Tenemos un histograma, pero el formato de las etiquetas del eje x es feo. Podemos pedirle a ChatGPT que edite nuestro código tal que le agregue lo necesario para que slas etiquetas muestren solamente el mes.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# Creamos un rango de fechas para los 12 meses de 2023
meses = pd.date_range('2023-01-01', periods=12, freq='M')

# Generamos algunos datos de ventas aleatorios para 3 diferentes categorías de productos
np.random.seed(42)  # Para resultados reproducibles
ventas_A = np.random.randint(20, 50, size=len(meses))
ventas_B = np.random.randint(10, 30, size=len(meses))
ventas_C = np.random.randint(5, 20, size=len(meses))

# Ponemos estos datos en un DataFrame
df = pd.DataFrame({
    'Mes': meses,
    'Ventas_A': ventas_A,
    'Ventas_B': ventas_B,
    'Ventas_C': ventas_C
}).set_index('Mes')

# Creamos un gráfico de barras apiladas
df.plot(kind='bar', stacked=True, figsize=(10, 6))

plt.title('Ventas Mensuales por Categoría de Producto')
plt.xlabel('Mes')
plt.ylabel('Ventas')
plt.tight_layout()
plt.show()    
    

Usando el prompt:
    
`Could you help me edit the next code, so that the x axis tags are show in the format "yyyy-mm"? ______`

In [None]:
import matplotlib.pyplot as plt
import matplotlib.dates as mdates

# Creamos un gráfico de barras apiladas
df.plot(kind='bar', stacked=True, figsize=(10, 6))

# Formateamos el eje x
plt.gca().xaxis.set_major_formatter(mdates.DateFormatter('%Y-%m'))
plt.gca().xaxis.set_major_locator(mdates.MonthLocator())

plt.title('Ventas Mensuales por Categoría de Producto')
plt.xlabel('Mes')
plt.ylabel('Ventas')
plt.tight_layout()
plt.show()

**Ejercicio**

Encuentra la pregunta adecuada a hacerle a ChatGPT para resolver el problema de los formatos de fechas.

## ¿Dónde buscar documentación oficial, cómo leerla y por qué es útil?

La **documentación oficial de Python** se encuentra en el sitio oficial: https://docs.python.org/. En ella puedes encontrar tutoriales, descripciones y ejemplos de uso de las funciones (e.g. max, min, len) y objetos (e.g. arreglos, diccionarios, funciones, enteros) incluidas por default en Python. Específicamente están en el apartado _Library Reference: keep this under your pillow_.

--- 

La documentación suele estar escrita de manera sucinta. En el caso de descripción de **funciones** suele contener los siguientes puntos:
* salida o acción de la función
* argumentos requeridos por la función y los tipos permitidos
* argumentos opcionales y el valor default que toman si no eliges ninguno
* ejemplos de uso de la función

Puedes explorar el sitio oficial para darte una idea de cuáles funciones ya existen, ejemplos de funciones útiles descritas en https://docs.python.org/3/library/functions.html son:

* `len(s)` recibe un objeto `s` iterable (una lista, tupla o rango) y regresa su longitud (la cantidad de items dentro del objeto).
* `sorted(s, reverse=False)` recibe un objeto `s` iterable (una lista, tupla o rango) y regresa una nueva lista ordenada de menor a mayor. El `reverse=False` significa que hay un argumento opcional (puedes no introducirlo) que se llama `reverse` y que su valor default es `False`. En la documentación puedes encontrar que `reverse` es un booleano (sólo puede tomar los valores True o False) y que si eliges el valor `True` entonces la lista de salida es ordenada de mayor a menor.

----

En el caso de **tipos de objetos** la documentación suele tener los siguientes puntos:
* qué los distingue
* cómo hacer operaciones entre ellos
* cómo modificarlos

Los tipos de objetos que más utilizarás son los numéricos, booleanos, secuencias, textos, diccionarios y funciones pero puedes encontrar el resto de objetos ya definidos en Python en: https://docs.python.org/3/library/stdtypes.html.


---

También existe **documentación para librerías no incluidas**, por ejemplo, `pandas`; para encontrarlas puedes simplemente escribir "<`nombre de la librería`> _documentation_" en tu motor de búsqueda y normalmente el primer sitio (usualmente terminado por .org) contienen la documentación. En el caso de pandas el sitio es https://pandas.pydata.org/docs/. En la práctica, cuando busques detalles y ejemplos de una función simplemente escribe en el motor "<`nombre de la funcion`> <`libreria donde se encuentra`> _documentation_" y elige el vínculo a la documentación del sitio oficial de la librería.

    
---

Aunque existen herramientas como Stack Overflow o ChatGPT, la documentación es siempre un lugar seguro si éstas fallan. También leyendo la documentación puedes descrubrir características muy útiles para tareas futuras, o maneras de mejorar o simplificar lo que ya hayas programado. Por lo anterior, consultar documentación resulta especialmente útil para personas interesadas en adentrarse más al mundo de la programación.