# Máster en Python Avanzado por Asociación AEPI

## Módulo III

### Funciones anónimas

Las funciones lambda o anónimas son un tipo de funciones en Python que típicamente se definen en una línea y cuyo código a ejecutar suele ser pequeño.

Lo que sería una función que suma dos números como la siguiente.



In [None]:
def suma(a, b):
    return a+b


Se podría expresar en forma de una función lambda de la siguiente manera.

In [None]:
suma = lambda a, b : a + b

Una vez tenemos la función, es posible llamarla como si de una función normal se tratase.

In [None]:
suma(2, 4)

Si es una función que solo queremos usar una vez, tal vez no tenga sentido almacenarla en una variable. Es posible declarar la función y llamarla en la misma línea.

In [None]:
(lambda a, b: a + b)(2, 4)

Ejemplos

Una función lambda puede ser la entrada a una función normal.


In [None]:
def mi_funcion(lambda_func):
    return lambda_func(2,4)


mi_funcion(lambda a, b: a + b)

Y una función normal también puede ser la entrada de una función lambda. 

In [None]:
def mi_otra_funcion(a, b):
    return a + b


In [None]:
(lambda a, b: mi_otra_funcion(a, b))(2, 4)

A pesar de que las funciones lambda tienen muchas limitaciones frente a las funciones normales, comparten gran cantidad de funcionalidades. Es posible tener argumentos con valor asignado por defecto.

In [None]:
(lambda a, b, c=3: a + b + c)(1, 2)

También se pueden pasar los parámetros indicando su nombre

In [None]:
(lambda a, b, c: a + b + c)(a=1, b=2, c=3)

Al igual que en las funciones se puede tener un número variable de argumentos haciendo uso de *, lo conocido como tuple unpacking.

In [None]:
(lambda *args: sum(args))(1, 2, 3) 

Por último, es posible devolver más de un valor.

In [None]:
x = lambda a, b: (b, a)

### Built-in filter

La función filter() es capaz de devolver una nueva colección con los elementos filtrados que cumplan una condición.

Podemos comprobar, por ejemplo, cuales son los números pares de una lista dada. Para ello le pasaremos una lista a una Lambda de la siguiente forma:


In [None]:
# Tengo una lista con muchos números
comprobar = [38, 24, 99, 42, 2, 3, 11, 23, 53, 21, 3, 53, 77, 12, 34, 92, 122, 1008, 26]
# Creo una variable y le aplico filter() y la lambda
filt = filter(lambda x: x % 2 == 0, comprobar)
# Creo una variable para convertir el resultado de 'filt' en una lista
pares = list(filt)
# Finalmente obtengo la lista con los resultados que han devuelto True al pasar el filtro
print(pares)

### Built-in map

La función map() en Python aplica una función a cada uno de los elementos de una lista



In [None]:
# map(una_funcion, una_lista)

Imagina que tienes una lista de enteros y quieres obtener una nueva lista con el cuadrado de cada uno de ellos.



In [1]:
def sin_lambda():
    enteros = [1, 2, 4, 7]
    cuadrados = []
    for e in enteros:
        cuadrados.append(e ** 2)

    print(cuadrados)


Sin embargo, podemos usar una función anónima en combinación con map() para obtener el mismo resultado de una manera mucho más simple:

In [None]:
def con_lambda():
    enteros = [1, 2, 4, 7]
    cuadrados = list(map(lambda x: x ** 2, enteros))
    print(cuadrados)


La cosa se vuelve todavía más interesante cuando, en lugar de una lista de valores, pasamos como segundo parámetro una lista de funciones:

In [None]:
def lambda_funciones():
    enteros = [1, 2, 4, 7]

    def cuadrado(x):
        return x ** 2

    def cubo(x):
        return x ** 3

    funciones = [cuadrado, cubo]
    for e in enteros:
        valores = list(map(lambda x: x(e), funciones))
        print(valores)


### Built-in reduce

La última función de esta serie que vamos a ver es la función reduce(). Esta función se utiliza principalmente para llevar a cabo un cálculo acumulativo sobre una lista de valores y devolver el resultado.

La función reduce() está incluida en el módulo functools.

En este caso, la función que se pasa como primer parámetro recibe dos argumentos.

Imagina que quieres obtener el resultado de sumar todos los elementos de una lista.

Como en las veces anteriores, la suma la puedes calcular de la siguiente manera:


In [None]:
valores = [2, 4, 6, 5, 4]
suma = 0
for el in valores:
    suma += el
print(suma)


Pero también usando la función reduce() en combinación con una función lambda:

In [None]:
from functools import reduce
suma = reduce(lambda x, y: x + y, valores)
print(suma)


## Módulo 5 - Manipulación de datos

### Que és un ORM

Un ORM (de sus siglas en inglés, Object Relational Mapper), no es más que una utilidad o librería que permite manipular las tablas de una base de datos como si fueran objetos de nuestro programa.

Lo más habitual es que una tabla se corresponda con una clase, cada fila de una tabla con un objeto (o instancia de una clase), las columnas de una tabla con los atributos de una clase y las claves ajenas (o Foreign Keys) con relaciones entre clases (definidas también a partir de atributos).

### Ventajas

Las principales ventajas de usar un ORM son:

•	Acceder a las tablas y filas de una base de datos como clases y objetos.
•	En la mayoría de ocasiones no es necesario usar el lenguaje SQL. El ORM se encarga de hacer las traducciones oportunas.
•	Independencia de la base de datos. Es posible cambiar de motor de base de datos modificando muy poco código en la aplicación.
•	Incrementa la productividad del desarrollador.

### SQLAlchemy

Como te comentaba en la introducción, SQLAlchemy es una librería para Python que facilita el acceso a una base de datos relacional, así como las operaciones a realizar sobre la misma.

Es independiente del motor de base de datos a utilizar, es decir, en principio, es compatible con la mayoría de bases de datos relacionales conocidas: PostgreSQL, MySQL, Oracle, Microsoft SQL Server, Sqlite, …

Aunque se puede usar SQLAlchemy utilizando consultas en lenguaje SQL nativo, la principal ventaja de trabajar con esta librería se consigue haciendo uso de su ORM. El ORM de SQLAlchemy mapea tablas a clases Python y convierte automáticamente llamadas a funciones dentro de estas clases a sentencias SQL.

Además, SQLAlchemy implementa múltiples patrones de diseño que te permiten desarrollar aplicaciones rápidamente y te abstrae de ciertas tareas, como manejar el pool de conexiones a la base de datos.

SQLAlchemy proporciona una interfaz única para comunicarte con los diferentes drivers de bases de datos Python que implementan el estándar Python DBAPI.

Este estándar, especifica cómo las librerías Python que se integran con las bases de datos deben exponer sus interfaces. Por tanto, al usar SQLAlchemy no interactuarás directamente con dicho API, sino con la interfaz que precisamente proporciona SQLAlchemy. Esto es lo que permite cambiar el motor de base de datos de una aplicación sin modificar apenas el código que interactúa con los datos. En definitiva, al usar SQLAlchemy es necesario instalar también un driver que implemente la interfaz DBAPI para la base de datos que vayas a utilizar. Ejemplos de estos drivers son:

•	psycopg para PostgreSQL
•	mysql-connector para MySQL
•	cx_Oracle para Oracle

### Como usar SQLAlchemy

Necesitamos crear un nuevo proyecto de Python, usando Pycharm y creando un entorno virtual con virtualenv. Al proyecto lo llamaremos EjemploSQLAlchemy. 

Lo siguiente es crear una base de datos en SQLite en el directorio raíz del proyecto, sin agregar ninguna tabla.

A continuación, nos dirigimos a la terminal integrada de Pycharm e instalamos SQLAlchemy:


```
$ pip install sqlalchemy
```


### Crear el Engine

Lo primero que hay que hacer para trabajar con SQLAlchemy es crear un engine. El engine es el punto de entrada a la base de datos, es decir, el que permite a SQLAlchemy comunicarse con esta.

El motor se usa principalmente para manejar dos elementos: los pools de conexiones y el dialecto a utilizar.

Vamos a crear un engine. Para ello, añade un nuevo módulo Python llamado db.py al proyecto, con el siguiente contenido:


In [None]:
from sqlalchemy import create_engine

engine = create_engine('sqlite:///almacen.sqlite')


Como puedes observar, a la función create_engine() se le pasa la cadena de conexión a la base de datos. En este caso, la cadena de conexión a la base de datos Sqlite es 'sqlite:almacen.sqlite'.

Crear el engine no hace que la aplicación se conecte a la base de datos inmediatamente, este hecho se pospone para cuando es necesario.


### Pool de conexiones

SQLAlchemy utiliza el patrón Pool de objetos para manejar las conexiones a la base de datos. Esto quiere decir que cuando se usa una conexión a la base de datos, esta ya está creada previamente y es reutilizada por el programa. La principal ventaja de este patrón es que mejora el rendimiento de la aplicación, dado que abrir y gestionar una conexión de base de datos es una operación costosa y que consume muchos recursos.

Al crear un engine con la función create_engine(), se genera un pool QueuePool que viene configurado como un pool de 5 conexiones como máximo. Esto se puede modificar en la configuración de SQLAlchemy.



### Dialectos de base de datos

A pesar de que el lenguaje SQL es universal, cada motor de base de datos introduce ciertas variaciones propietarias sobre dicho lenguaje. A esto se le conoce como dialecto.

Una de las ventajas de usar SQLAlchemy es que, en principio, no te tienes que preocupar del dialecto a utilizar. El engine configura el dialecto por ti y se encarga de hacer las traducciones necesarias a código SQL. Esta es una de las razones por las que puedes cambiar el motor de base de datos realizando muy pocos cambios en tu código.


### Sesiones

Una vez creado el engine, lo siguiente que debes hacer para trabajar con SQLAlchemy es crear una sesión. Una sesión viene a ser como una transacción, es decir, un conjunto de operaciones de base de datos que, bien se ejecutan todas de forma atómica, bien no se ejecuta ninguna (si ocurre un fallo en alguna de las operaciones).

Desde el punto de vista de SQLAlchemy, una sesión registra una lista de objetos creados, modificados o eliminados dentro de una misma transacción, de manera que, cuando se confirma la transacción, se reflejan en base de datos todas las operaciones involucradas (o ninguna si ocurre cualquier error).

Vamos a crear una sesión en nuestro proyecto. Abre el fichero db.py y añade lo siguiente:


In [None]:
from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker

engine = create_engine('sqlite:///almacen.sqlite')
Session = sessionmaker(bind=engine)
session = Session()


Para crear una sesión se utiliza el método factoría sessionmaker() asociado a un engine. Después de crear la factoría, objeto Session, hay que hacer llamadas a la misma para obtener las sesiones, objeto session.

### Crear los modelos para trabajar con tablas

Llegados a este punto, ya lo tenemos casi todo listo para interactuar con el ORM. Ahora te voy a enseñar donde realmente ocurre la magia: los modelos.

Los modelos son las clases que representan las tablas de base de datos. En el ejemplo tenemos la tabla producto, por tanto, dado que estamos usando un ORM, tenemos que crear el modelo (o clase) equivalente a la misma.

Para que se pueda realizar el mapeo de forma automática de una clase a una tabla, y viceversa, vamos a utilizar una clase base en los modelos que implementa toda esta lógica.

De nuevo, abre el fichero db.py y modifícalo para que su contenido sea como el que te muestro a continuación:


In [None]:
# db.py

from sqlalchemy import create_engine
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker

engine = create_engine('sqlite:///almacen.sqlite')
Session = sessionmaker(bind=engine)
session = Session()
Base = declarative_base()


Al final del mismo hemos creado una clase llamada Base con el método declarative_base(). Esta clase será de la que hereden todos los modelos y tiene la capacidad de realizar el mapeo correspondiente a partir de la metainformación (atributos de clase, nombre de la clase, etc.) que encuentre, precisamente, en cada uno de los modelos.

Por tanto, lo siguiente que debes hacer es crear el modelo Producto. Crea un nuevo fichero en el directorio del proyecto llamado models.py y añade el código que te muestro a continuación:


In [None]:
# models.py

import db
from sqlalchemy import Column, Integer, String, Float


class Producto(db.Base):
    __tablename__ = 'producto'
    id = Column(Integer, primary_key=True)
    nombre = Column(String, nullable=False)
    precio = Column(Float)

    def __init__(self, nombre, precio):
        self.nombre = nombre
        self.precio = precio

    def __repr__(self):
        return f'Producto({self.nombre}, {self.precio})'

    def __str__(self):
        return self.nombre


### Mapeo clase-tabla

La clase Producto del código anterior representa la tabla producto que vimos al comienzo del tutorial.

Para que se pueda realizar el mapeo automático clase-tabla, la clase hereda de la clase Base que creamos en la sección anterior y que se encuentra en el módulo db.py. Además, hay que especificar el nombre de la tabla a través del atributo de clase __tablename__.

Por otro lado, cada una de las columnas de la tabla tienen su correspondiente representación en la clase a través de atributos de tipo Column. En este caso concreto, los atributos son los siguientes:id, nombre y precio.

Como puedes observar, SQLAlchemy define distintos tipos de datos para las columnas (Integer, String o Numeric, entre otros). 
En función del dialecto seleccionado, estos tipos se mapearán al tipo correcto de la base de datos utilizada.

Por último, y no menos importante, es necesario que al menos un atributo de la clase se especifique como primary_key. 
En el ejemplo es el atributo id. Este será el atributo que representa a la clave primaria de la tabla.


### Recrear las tablas en la base de datos

Una vez definidos los modelos, hay que crear las tablas correspondientes.

Crea un nuevo fichero Python en el directorio productos llamado main.py. En este fichero será donde escribas el código de ejemplo del programa.

Añade lo siguiente al fichero main.py:



In [None]:
# main.py
from sqlalchemy import update

import db


if __name__ == '__main__':
    db.Base.metadata.create_all(db.engine)

Lo importante en este punto es la línea db.Base.metadata.create_all(db.engine). En ella estamos indicando a SQLAlchemy que cree, si no existen, las tablas de todos los modelos que encuentre en la aplicación. Sin embargo, para que esto ocurra es necesario que cualquier modelo se haya importado previamente antes de llamar a la función create_all().

IMPORTANTE: Si un modelo no ha sido importado en el código antes de llamar a la función create_all(), no se tendrá en cuenta para crear su tabla correspondiente.

Ejecuta ahora el programa.

### Guardar un modelo añade un registro a la base de datos

Vamos a crear varias filas en la tabla producto. Como te he indicado anteriormente, , una fila de una tabla se corresponde con un objeto Python. Por tanto, para crear una fila debemos instanciar un objeto de la clase Producto, añadirlo a la sesión y finalmente aplicar los cambios.

In [None]:
#main.py

import db
from models import Producto


def run():
    arroz = Producto('Arroz', 1.25)
    db.session.add(arroz)
    print(arroz.id)
    agua = Producto('Agua', 0.3)
    db.session.add(agua)
    db.session.commit()
    print(arroz.id)


if __name__ == '__main__':
    db.Base.metadata.create_all(db.engine)
    run()


Te explico paso a paso el código y lo que ocurre. Inicialmente se crea el objeto arroz de tipo Producto. Seguidamente, se añade a la sesión con db.session.add(arroz). Después se muestra el valor del atributo id que es None, puesto que todavía no se han confirmado los cambios en la base de datos. A continuación, se crea y se añade a la sesión el objeto agua. Por último, se hace un commit() de la sesión actual para confirmar los cambios en la base de datos y se muestra, de nuevo, el valor del atributo id del objeto arroz. En esta ocasión puedes observar que su valor es 1 y que coincide con el valor de la columna id de la primera fila de la tabla producto.

### Las consultas devuelven modelos

Una vez que te he mostrado cómo guardar datos en la base de datos usando el ORM de SQLAlchemy, en esta última parte del tutorial vas a descubrir cómo hacer los principales tipos de consultas.

Las consultas a la base de datos se realizan fundamentalmente a través de la función query del objeto session. Esta función recibe como parámetro el nombre de la clase sobre la que realizar las consultas y devuelve un objeto Query con la consulta a realizar.

Siguiendo con el ejemplo, para realizar consultas sobre la clase Producto deberíamos ejecutar el siguiente código:


In [None]:
consulta = db.session.query(Producto)



La variable consulta es de tipo Query pero todavía no se ha ejecutado sobre la base de datos, para ello, debemos indicarle qué operación queremos realizar. Las más comunes son las siguientes:

### Obtener un objeto a partir de su id


In [None]:
ob = db.session.query(Producto).get(1)

get() devuelve un objeto del tipo indicado en la Query a partir de su primary_key. Si no encuentra el objeto, devuelve None.

### Obtener los objetos de una consulta

Para obtener todos los objetos de un tabla o consulta, simplemente hay que llamar al método all(). Este método devuelve una lista con los objetos devueltos por la consulta:

In [None]:
productos = db.session.query(Producto).all()

También puedes llamar al método first(). First() devuelve el primer objeto encontrado por la consulta. Es útil si sabes que solo existe un elemento que cumpla una determinada condición.

### Contar el número de elementos devueltos por una consulta

Si quieres contar el número de elementos que devuelve una consulta, utiliza el método count():


In [None]:
num_productos = db.session.query(Producto).count()

### Aplicar filtros a una consulta

Para aplicar un filtro a una consulta, lo que sería la cláusula WHERE de SQL, puedes llamar a los métodos filter_by(keyword) o filter():


In [None]:
agua = db.session.query(Producto).filter_by(nombre='Agua').first()
menos_de_1 = db.session.query(Producto).filter(Producto.precio < 1).all()


### Otras bases de datos: CSV

Un archivo CSV (archivo de valores separados por comas) es un tipo de archivo de texto sin formato que utiliza una estructuración específica para organizar datos tabulares. Debido a que es un archivo de texto sin formato, solo puede contener datos de texto reales; en otras palabras, caracteres ASCII o Unicode imprimibles.

La estructura de un archivo CSV viene dada por su nombre. Normalmente, los archivos CSV usan una coma para separar cada valor de datos específico. Así es como se ve esa estructura:


```
column 1 name,column 2 name, column 3 name
first row data 1,first row data 2,first row data 3
second row data 1,second row data 2,second row data 3
```


Observe cómo cada dato está separado por una coma. Normalmente, la primera línea identifica cada dato, en otras palabras, el nombre de una columna de datos. Cada línea subsiguiente después de eso son datos reales y están limitadas solo por restricciones de tamaño de archivo.

En general, el carácter separador se denomina delimitador y la coma no es la única que se utiliza. Otros delimitadores populares incluyen los caracteres de tabulación ( \t), dos puntos ( :) y punto y coma ( ;). Analizar correctamente un archivo CSV requiere que sepamos qué delimitador se está utilizando.


### Lectura de archivos CSV

La lectura de un archivo CSV se realiza utilizando el reader object. El archivo CSV se abre como un archivo de texto con la función open() integrada de Python, que devuelve un objeto de archivo. Esto luego se pasa al reader, que hace el trabajo pesado.




In [None]:
import csv

with open('employee_birthday.txt') as csv_file:
    csv_reader = csv.reader(csv_file, delimiter=',')
    line_count = 0
    for row in csv_reader:
        if line_count == 0:
            print(f'El nombre de las columnas son {", ".join(row)}')
            line_count += 1
        else:
            print(f'\t{row[0]} trabaja en el {row[1]} departmento, y nacio en {row[2]}.')
            line_count += 1
    print(f'Procesadas {line_count} lineas.')

### Escribir archivos CSV

También puede escribir en un archivo CSV usando un objeto writer y el método write_row():

In [None]:
def escritura_csv():
    with open('employee_birthday.txt', mode='a') as employee_file:
        employee_writer = csv.writer(employee_file, lineterminator='\n' , delimiter=',', quotechar='"', quoting=csv.QUOTE_MINIMAL)
        employee_writer.writerow(['John Smith', 'Accounting', 'November'])
        employee_writer.writerow(['Erica Meyers', 'IT', 'March'])



### Archivos HTML - Parsing

La librería de más alto nivel que se verá en este apartado es BeautifulSoup, la cual usa html.parser o lxml como parseadores y permite:

•	Interactuar de forma pythónica con el documento y acceder a los elementos simplemente haciendo uso de getattro (".").

•	La conversión a Unicode o incluso la detección de la codificación de los documentos de forma nativa. 

•	La navegación desde un nodo hacia los nodos padres, hijos y hermanos de forma intuitiva.
•	La búsqueda en el árbol de forma fácil con diferentes métodos, como expresiones regulares, listas de etiquetas, palabras clave, funciones propias, búsquedas usando clases CSS, búsquedas en el texto de las etiquetas y muchísimas funcionalidades más.

•	Buscar en el documento usando selectores CSS. Crear nodos de forma pythónica con funciones sin hacer un excesivo uso de los diccionarios.

•	Trabajar con ficheros XML y HTML con facilidad. 

•	Parsear solo partes de un documento.


