# Python

In [17]:
# Un pequeño ajuste de configuración para simplificar el uso de jupyter notebook en los ejemplos
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = "all"

## ¿Qué es Python?

Python es un lenguaje de programación orientado a objetos con soporte a múltiples paradigmas de programación, como programación imperativa, funcional o asíncrona.

Es un lenguaje considerado multipropósito, ya que tiene desde librerías para acceder a operaciones de bajo nivel como para desarrollar aplicaciones multi hilo, multi proceso, distribuídas, bases de datos, interfaces gráficas, manejo de datos, juegos, gráficos 3D, cálculo científico, machine learning...

Es considerado uno de los lenguajes más sencillos de aprender y es muy adecuado por su sintaxis para el aprendizaje de programación a alto nivel, ya que proporciona todas las herramientas habituales y estructuras de control típicas de todos los lenguajes de programación.

### Interpretado o compilado

La respuesta corta es **interpretado**, ya que los programas Python se ejecutan habitualmente utilizando el intérprete oficial, que toma el código fuente y lo ejecuta.

En realidad, el intérprete hace una compilación previa a _bytecode_, que es ejecutado por el mismo intérprete. También existes otras implementaciones de Python en la que el "intérprete" es en realidad un compilador y genera ficheros binarios ejecutables dependientes de la plataforma, como si de C se tratara.

### Versiones de Python

Aunque es raro a día de encontrarnos con versiones antiguas de Python, históricamente algunas distribuciones mantienen el paquete para Python 2.7 (última versión liberada de Python 2.X).

Aunque sea contraintuitivo, Python 2.X y Python 3.X son dos lenguajes que se consideran diferentes. El código escrito para Python 2.X no es, por defecto, compatible con Python 3.X.

La versión más reciente de Python es la [3.11.2](https://www.python.org/downloads/), aunque para los ejemplos de este documento servirá cualquier versión de Python posterior a la 3.6.

Este tutorial está escrito sobre un intérprete de Python 3.9.16 utilizando Jupyter Notebook.

## Indentación estricta

Una de las señas de identidad más características de Python es la **obligación** de utilizar indentación.

Al contrario que otros lenguajes donde la indentación de los bloques de código es meramente estética, Python lo utiliza para definir los bloques de código.

La única norma que el lenguaje necesita es que todos los elementos del mismo bloque de código estén indentandos de la misma forma, sea con espacios, tabuladores...

Como guía de estilo se **recomienda encarecidamente** respetar el mismo tipo de indentación a lo largo de todo el fichero o proyecto. Además, la [guía de estilo de Python](https://peps.python.org/pep-0008/) recomienda usar indentación blanda a 4 espacios.

Algo importante a tener en cuenta es que, aunque en muchos editores un tabulador equivale a 4 espacios, son 2 carácteres diferentes, y si se carga en otro editor, la representación del tabulador puede variar y no coincidir.

Utilizando un IDE adecuado, esto no debería ser ningún problema.

Más adelante veremos ejemplos en los que se muestra cómo funciona la indentación de bloques.

## Variables y tipos

Python es un lenguaje de tipado fuerte y dinámico:

### Tipado fuerte

Python no permite hacer operaciones entre diferentes tipos de forma explícita:

In [18]:
a = "Hola"
a + 1

TypeError: can only concatenate str (not "int") to str

La operación ha lanzado el error `TypeError` y nos indica que no se puede usar la operación `+`, que para el tipo cadena implica la concatenación, pasándole un número entero.

### Tipado dinámico

Como se ha visto en el ejemplo anterior, en ningún momento indicamos que la variable `a` va a ser de tipo cadena, simplemente la asignamos y Python decide el tipo en función del valor de asignación.

Asimismo, podemos cambiar dinámicamente el tipo de una variable. En realidad, Python destruye la variable definida previamente y crea una nueva con el mismo nombre.

In [None]:
a = "Hola"
a
a = 5
a

'Hola'

5

## Tipos de datos

### Valor nulo

Para definir una variable sin inicializar ni su tipo ni su valor, se puede usar `None`.

```{important}

Cuando queramos hacer la comprobación de si una variable tiene el valor `None` deberemos utilizar el operador de comparación `is` en lugar del habitual de comparación, lo veremos más adelante.
```

### Booleanos

In [None]:
a = True
a
b = False
b
c = 5 == 10
c

True
False
False


### Valores numéricos

Al contrario que en otros lenguajes, donde los tipos de datos pueden presentar diferentes tamaños (enteros desde 8 a 64 bits, punto flotanto, doble precisión...), en Python los tipos numéricos pueden almacenar valores tan altos como permita la memoria del programa y la compuadora donde se ejecute.

Los 3 tipos numéricos básicos son `int`, `float` y `complex`:

In [None]:
a = 5
b = 3.14
c = 1 + 5j

a + b
a + b + c

8.14
(9.14+5j)


### Secuencias

Los tipos de secuencia en Python son `str`, `bytes`, `tuple` y `list`

#### `str`

Representa a una cadena de texto habitual, que contenga caracteres imprimibles. Las cadenas permiten operaciones como la suma y la multiplicación:

In [None]:
"Hola" + " mundo"
"\o/ " * 20

Hola mundo
\o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ \o/ 


#### `bytes`

Es un tipo muy similar al anterior, pero en vez de secuencias de caracteres, permite manejar secuencias de bytes. Las operaciones de lectura y escritura de bajo nivel en ficheros o dispositivos pueden ser realizadas con secuencias de `bytes`, y también la recepción y envío de datos a través de sockets.

Debemos tener en cuenta que podemos transformar cadenas de carácteres en cadenas de bytes y viceversa. Es realmente importante entender la diferencia entre ambos tipos de datos, así como entender cómo transformar entre ellos.

In [None]:
b = b"Hello world"
c = b"\x00\x01\x02"
d = "ñandú".encode()

b
c
d
b.decode()
c.decode()

b'Hello world'

b'\x00\x01\x02'

b'\xc3\xb1and\xc3\xba'

'Hello world'

'\x00\x01\x02'

#### `tuple`

Es una agrupación de 1 o más valores, similar al concepto matemático de tupla. Pueden usarse para empaquetar varias valores, que además pueden ser de tipo diferente.

Las tuplas, al igual que las `str` o  los `bytes`, son tipos inmutables: no pueden modificarse una vez inicializadas.

In [None]:
# Empaquetado de variables
x = a, b, c
x
# Desempaquetado de variables
x1, x2, x3 = x
x3

(5, b'Hello world', b'\x00\x01\x02')

b'\x00\x01\x02'

#### `list`

Una lista es la implementación en Python de los vectores o arrays de otros lenguajes. Al igual que las tuplas, permite que sus elementos sean de tipo diferente.

Al contrario que los anteriores, las listas son mutables y pueden ser modificadas:

In [None]:
l = [1, 2, 30, 4]
l[2] = 3
l

[1, 2, 3, 4]

Las listas también permiten realizar operaciones de suma y multiplicación, entendidas como concatenación y repetición respectivamente.

In [None]:
l + [5]
l * 2
l

[1, 2, 3, 4, 5]

[1, 2, 3, 4, 1, 2, 3, 4]

[1, 2, 3, 4]

Todos los tipos de secuencia que hemos visto permiten el acceso a uno o varios elementos de la misma a través de índices del modo habitual, utilizando corchetes como ya se ha mostrado en algunos de elos ejemplos.

Pero además, es posible hacer "rodajas" o _"slicing"_ o usar números negativos cómo índices:

In [None]:
cadena = "Hola mundo"
cadena[3]
cadena[-1]
cadena[0:6]
cadena[:6]
cadena[::2]
cadena[::-2]

'a'

'o'

'Hola m'

'Hola m'

'Hl ud'

'onmao'

### Diccionarios

Son tablas asociativas o _hash maps_. Tanto clave como valores pueden ser de cualquier tipo:

In [None]:
notas = {
    "antonio": 7.8,
    "maria": 9,
}
notas
notas["maria"]

{'antonio': 7.8, 'maria': 9}

9

Además, hay otros tipos de datos nativos como `set` para manejo de conjuntos, pilas, colas, listas multidimensionales...

### Orientado a objetos

Todos los tipos anteriores que hemos visto son clases en Python, y las variables, objetos de las mismas, y no son diferentes de cualquier clase y objeto que podamos definir nosotros.

## Módulos

Al igual que en otros lenguajes, Python permite agrupar el código dentro de ficheros y directorios. En Python llamamos **módulo** a un fichero con código Python. Los módulos se pueden importar desde otro módulo usando la sentencia `import`.

Los módulos pueden agruparse también en "paquetes".

## Estructuras de control

Están disponibles todas aquellas que ya son habituales en otros lenguajes: `if`, `if-else`, `if-elif-else`, `for`, `while`, saltos incondicionales con `break` o `continue`,`return` y `yield` para generadores.

Todas estas estructuras de control funcionan de la forma habitual, a excepción del `for` que tiene una sintaxis diferente a la habitual de C:

In [None]:
metales = ["oro", "plata", "bronce"]

for metal in metales:
    print(metal)

oro
plata
bronce


En Python también tenemos el operador ternario para sustituir los típicos bloques `if-else` que se utilizan para realizar una asignación:

In [None]:
valor = 10 if 5 > 0 else 0
valor

10

## Excepciones

Las exceptiones en Python son objetos, por lo que podemos definir clases que hereden nuevas formas de excepción personalizadas y capturarlas en nuestros programas si es necesario.

La sintaxis de captura de excepciones es similar a otros lenguajes:

- `try`: es el bloque donde sabemos que puede producirse una o varias excepciones que queremos controlar.
- `except`: podemos tener varios bloques de captura de excepción. También podemos capturar varias en un sólo bloque o capturar cualquiera, aunque esto último no se recomienda.
- `else`: se coloca tras el último bloque `except` y se ejecutará siempre que el bloque `try` no haya producido ninguna excepción.
- `finally`: se coloca al final y, si está definido, se ejecuta tanto si ocurre alguna excepción como si no. En caso de no haberla, se ejecuta tras el código del bloque `else`.

In [None]:
try:
    assert 2 == 1, "1 is not equal to 2"
    print("This shouln't happen")
except AssertionError as ex:
    print("Exception catch")
    print(ex)
except Exception as ex:
    print("Unexpected error: %s", ex)
else:
    print("Everything went well")
finally:
    print("This will be always executed")

Exception catch
1 is not equal to 2
This will be always executed


## Funciones

La sintaxis para definir una función es la siguiente:

In [None]:
def factorial(n):
    """Calculate the factorial for the number n recursively"""
    if n == 0:
        return 1
    
    return n * factorial(n-1)


factorial(10)

3628800

## Python is different

Cuando se empieza a utilizar Python solemos hacerlo de manera muy parecida a los lenguajes tradicionales. Sin embargo, hay formas más "pythónicas" de implementar las cosas.

In [None]:
from functools import reduce
from operator import mul
factorial = lambda n: reduce(mul, range(1, n+1), 1)

factorial(10)

3628800

También podemos generar listas o diccionarios utilizando la sintaxis _"comprehension"_:

In [None]:
even = [x for x in range(1, 11) if x % 2 == 0]
even

fast_cubes = {x: x**3 for x in range(1, 11)}
fast_cubes

[2, 4, 6, 8, 10]

{1: 1, 2: 8, 3: 27, 4: 64, 5: 125, 6: 216, 7: 343, 8: 512, 9: 729, 10: 1000}

## Python y los tipos

En las funciones y métodos Python no se indica el tipo de los argumentos que recibe o el del valor que devuelve. En cierto modo, se asume que se va a invocar del modo correcto, es decir, no hace comprobación de tipos (*type checking*).

Si bien esto le da mucha flexibilidad, a la hora de validar una llamada o documentar un API de módulo o clase puede ser un problema, por lo que desde hace unos años se introdujo el llamado _hinting_ de tipos.

Sin embargo cuando indicamos el tipo mediante _hinting_ solo estamos haciendo una anotación y no tiene ningún efecto aparente. Si realmente queremos typechecking y forzar la correspondencia de tipos, tendremos que utilizar herramientas externas como `mypy`, que hace esa verificación estática del código.

Esta sería una versión de la función `factorial()` con *type hinting* y una llamada incorrecta (que guardamos en el fichero `factorial.py`):

In [None]:
%%file factorial.py

def factorial(n: int) -> int:
    return 1 if n == 0 else n * factorial(n-1)

factorial("hola")

Overwriting factorial.py


Instalamos `mypy` para poder probar la comprobación de tipos.

In [None]:
! pip install mypy



Y veamos qué ocurre cuando analizamos el código:

In [None]:
! mypy factorial.py

factorial.py:5: [1m[31merror:[m Argument 1 to [m[1m"factorial"[m has incompatible type [m[1m"str"[m; expected [m[1m"int"[m  [m[33m[arg-type][m
[1m[31mFound 1 error in 1 file (checked 1 source file)[m


## Depuración

Como cualquier otro lenguaje, Python tiene soporte para depuración, incluso con llamadas nativas en el lenguaje.

Existe la función `breakpoint()`, que al ser ejecutada detiene el hilo del programa en la que se encuentra y permite iniciar una sesión del depurador `pdb`, que nos permite ver los valores de las variables, inspeccionar el segmento de código cercano al punto de interrupción, ejecutar paso a paso, etc. Este soporte es bastante rudimentario y suele ser aconsejable utilizar un IDE que lo tenga integrado.

## Y no se queda aquí...

Python incluye una librería estándar muy amplia donde podemos encontrar librerías para una variedad inabarcable de usos para una introducción. Algunos destacados son:

- `socket`: utilización de _sockets_ de red, con soporte para TCP, UDP, IP, Ethernet...
- `struct`: serialización binaria de datos
- `json`: conversión entre estructuras de datos del lenguaje y cadenas JSON, un formato ampliamente utilizado en Internet en APIs HTTP.
- `threading`: ejecución paralela de código a través de hilos.
- `multiprocessing`: una aproximación diferente al trabajo con subprocesos.
- `subprocess`: uso de subprocesos de una forma más tradicional y apegada a los estándares POSIX.
- `asyncio`: módulos para la programación asíncrona.
- `sys`: acceso a llamadas típicas del sistema (salida del programa, línea de argumentos).
- `os`: acceso a variables de entorno, generación de rutas de archivos...
- `re`: manejo de expresiones regulares.
- `time`: funciones relacionadas con la medición de tiempos relativos.
- `datetime`: funciones relacionadas con la medición de tiempos absolutos y su conversión a fechas.
- `math` y `cmath`: módulos para funciones matemáticas reales y con números complejos respectivamente.
- `random`: generador de números aleatorios.
- `sqlite3`: acceso a bases de datos SQLite.
- `urllib`: operaciones HTTP
- `cmd`: creación de programas interactivos en línea de comandos.
- `tkinter`: creación de interfaces gráficas de usuario.
- `pdb`: depurador de código

¡Y mucho más!