# Bases de datos y SQL

Hoy en día, estamos rodeados de datos por todas partes, y nuestra capacidad para almacenarlos, actualizarlos y extraer información de ellos es crítica para cualquier aplicación que se desee desarrollar. No importa si se desea crear una aplicación web, aplicación de escritorio u otro tipo de aplicación; todas ellas necesitan acceder de manera segura y rápida a los datos. Las bases de datos relacionales son todavía uno de los lugares más comunes donde almacenar y gestionar los datos.

En los próximos minutos vamos a conocer los aspectos básicos para poder empezar a trabajar con bases de datos en Python. No vamos a introducir el lenguaje SQL, ya que se asume que el lector posee un conocimiento básico sobre qué es SQL y cómo se utiliza.

En el siguiente PEP ([PEP 249 - The Python Database API Specification](https://www.python.org/dev/peps/pep-0249/)) se encuentran las instrucciones básicas para conocer cómo se debe interactuar con las bases de datos a través de Python. Aunque existen diferencias notables entre cada uno de los sistemas de gestión de bases de datos, debería ser similar el uso de distintas bases de datos (tales como SQLite, PostgreeSQL, MySQL, etc.).

El primer concepto que debe quedarle claro al lector es que el primer paso a realizar es importar un *driver*; esto es, el API para la base de datos específica que se desea utilizar. Las más utilizadas son: 
* [psycopg2](http://initd.org/psycopg/)
* [MySQL Connector/Python](https://dev.mysql.com/doc/connector-python/en/)
* [sqlite3](https://docs.python.org/2/library/sqlite3.html)

En este tutorial abordaremos el uso de Python con **SQLite** y **SQLAlchemy**.



> **_NOTA:_**  **Python Enhancement Proposal (PEP)**.
El desarrollo del lenguaje de programación Python se lleva a cabo a través del proceso *Python Enhancement Proposal (PEP)*, mediante el cual se proponen las nuevas características a la comunidad Python para poder llegar a un consenso. Los PEP destacados son revisados y comentados por la comunidad de Python y el consejo directivo. Como ejemplos, tenemos el *Python Coding Style* ([PEP 8](https://www.python.org/dev/peps/pep-0008/)) o el *Zen of Python* ([PEP 20](https://www.python.org/dev/peps/pep-0020/)).



## SQLite

SQLite es una librería desarrollada en C que proporciona una base de datos ligera, basada en disco, que no requiere un proceso servidor separado, y permite acceder a una base de datos utilizando una variante del lenguaje SQL. Muchas aplicaciones pueden utilizar SQLite para almacenamiento interno de datos. Las bases de datos SQLite son la columna vertebral de muchas aplicaciones, aunque siempre deben mantenerse pequeñas. Ademas, es posible hacer uso de SQLite para un prototipo y posteriormente portar el código a un sistema de gestión de base de datos más potente como PostgreSQL o Oracle. 

Como ocurre con el resto de módulos, para empezar a trabajar con SQLite, el primer paso es importar el módulo.

In [None]:
import sqlite3

#### Conexión a una base de datos

El primer paso que hay que hacer es realizar una conexión a la base de datos. Usualmente, será necesario conocer la siguiente información para realizar la conexión:
* hostname
* port
* username
* password
* database name

SQLite es una base de datos embebida que se encuentra almacenada en un fichero en disco, y debe ser operada por un único programa. Por tanto, para crear una conexión a una base de datos SQLite, únicamente es necesario apuntar a un fichero en disco.

In [None]:
DBPATH = 'people.db'
conn = sqlite3.connect(DBPATH)

En este punto, el lector observará que un fichero con nombre *people.db* ha sido creado en el directorio de trabajo actual.

El método `connect()` devuelte un objeto de tipo conexión que ha sido nombrado `conn`. A través del objeto `conn` se podrá manipular la conexión con la base de datos incluyendo los siguientes métodos:
* `conn.commit()` - commit any changes back to the database
* `conn.close()` - close our connection to the database and tidy up

Sin embargo, para ejecutar una sentencia SQL contra la base de datos, tanto para insertar registros --INSERT-- como para seleccionar registros --SELECT--, es necesario crear un cursor:

In [None]:
cursor = conn.cursor()

Un cursor es esencialmente un puntero a la base de datos; un cursor posee los siguientes métodos:
* `cursor.execute()` - executes a SQL string against the database
* `cursor.fetchone()` - fetch a single row back from the executed query
* `cursor.fetchall()` - fetch all results back from the executed query

Juntos, cursores y conexiones, conforman la manera básica de interactuar con una base de datos SQLite.


#### Descripción de la base de datos

El primer paso que hay que llevar a cabo es describir el tipo de datos que vamos a manejar en la base de datos mediante la creación de un *schema*. Para este taller, crearemos una aplicación simple de contactos; el esquema será el siguiente:


<img src="./database-contacts.png" width="400">


En la imagen se observan dos tablas, contactos --nombre, email y compañia-- y compañías/organizaciones/empresas --nombre--. Para crear la tabla de empresas ejecutaríamos la sentencia SQL de la siguiente manera:

In [None]:
sql = (
    "CREATE TABLE IF NOT EXISTS company ("
    "    id INTEGER PRIMARY KEY AUTOINCREMENT,"
    "    name TEXT NOT NULL"
    ")"
)

cursor.execute(sql)

A continuación, se deberá escribir y ejecutar la sentencia SQL para crear la tabla de contactos.

In [None]:
# Create the contacts table

#### Inserción de registros

Una vez creada la base de datos con el esquema deseado, el siguiente paso es insertar registros en ella. Vamos a añadir la Georgetown University a la tabla de compañías.

In [None]:
sql = "INSERT INTO company (name) VALUES (?)"
cursor.execute(sql, ("Georgetown University",))
conn.commit()

En el fragmento de código anterior, se ha creado esencialmente una plantilla SQL para insertar los nombres de las compañías en la tabla correspondiente. Como habrá podido observar el lector, no se ha asignado un *id*, ya que se generará de manera automática mediante la propiedad `AUTOINCREMENT` de ese campo de la base de datos.

El carácter `?` es un parámetro de la sentencia SQL, y puede ser utilizado como un parámetro de sustitución para cualquier entrada que realice el usuario. Los valores para el parámetro son pasados como el segundo argumento como una tupla. En general, no deberían utilizarse métodos de formateo de cadenas string tales como:

> `sql = "INSERT INTO companies (name) VALUES ({})".format("Georgetown University")`

Esta forma de proceder es potencialmente no segura. Por otro lado, los parámetros `?` realizan una gran cantidad de trabajo por detrás para asegurar que el comportamiento es correcto y seguro.

Vamos a continuar insertando otro registro usando la misma instrucción SQL.

In [None]:
cursor.execute(sql, ("US Department of Commerce",))
conn.commit()

El último punto que vamos a tratar es la llamada al método `commit()`. Nada es escrito en la base de datos hasta que es llamado el método `commit()`. Esta forma de proceder proporciona una habilidad interesante a la hora de realizar transacciones; una serie de consultas SQL se completarán de forma correcta y conjunta una vez se llame explícitamente al método `commit()`. Sin embargo, si algo no funciona de la manera esperada durante la ejecución, no se realizará la llamada al método `commit()` y se realizará, de facto, un *rollback*.


#### Selección de registros

Antes de continuar con la insercción de contactos, debemos conocer el identificador de la compañía del contacto que se desea insertar en la base de datos. Sin embargo, como se ha insertado mediante el uso de la característica de autoincremento, no es conocido el valor de los identificadores de la tabla que contiene los datos de las compañías. Para leer los datos, tendrán que ser buscados de la siguiente manera:

In [None]:
cursor.execute("SELECT id FROM company WHERE name=?", ("Georgetown University",))
print(cursor.fetchone())

Para obtener el registro deseado, se hace uso de la selección de registros mediante la cláusula SELECT con el parámetro "Georgetown University" --tupla--.

El método `fetchone()` obtiene el primer registro que encuentra. Hay que destacar que el nombre de cada compañía no han sido definido como único, por tanto, podrían haber varios registros con nombre "Georgetown University". Si se desea obtener todos los registros se puede realizar mediante el método `fetchall()`.

Para insertar un contacto que trabaja en la Georgetown University se deberá ejecutar una sentencia similar a la siguiente:

In [None]:
sql = "INSERT INTO contacts (name, email, company_id) VALUES (?,?,?)" 
cursor.execute(sql, ("Benjamin Bengfort", "bb830@georgetown.edu", 1))
conn.commit()

A partir de este momento, el lector debe ser capaz de insertar algunos contactos y compañías.

In [None]:
# Insert some contacts and companies using the methods described above.

##### Workshop

A partir de este momento, el lector deberá ser capaz de realizar una pequeña aplicación en Python que realice los siguientes requerimientos:
* Insertar contactos en la base de datos añadiendo el nombre, email y el nómbre de la compañía
* Mostrar la lista de compañías y el número de contactos asociados a ella

Utilizar el siguiente fragmento de código incompleto como plantilla para la realización del *workshop*:

In [None]:
import os
import sqlite3

def create_tables(conn):
    """
    Write your CREATE TABLE statements in this function and execute
    them with the passed in connection. 
    """
    # TODO: fill in. 
    pass


def connect(path="people.db", syncdb=False):
    """
    Connects to the database and ensures there are tables.
    """
    
    # Check if the SQLite file exists, if not create it.
    if not os.path.exists(path):
        syncdb=True

    # Connect to the sqlite database
    conn = sqlite3.connect(path)
    if syncdb:
        create_tables(conn)
    
    return conn


def insert(name, email, company, conn=None):
    if not conn: conn = connect()

    # Attempt to select company by name first. 
    
    # If not exists, insert and select new id.
    
    # Insert contact

    
if __name__ == "__main__":
    name    = input("Enter name: ")
    email   = input("Enter email: ")
    company = input("Enter company: ")
    
    conn = connect()
    insert(name, email, company, conn)

    # Change below to count contacts per company! 
    contacts = conn.execute("SELECT count(id) FROM contacts").fetchone()
    print("There are now {} contacts".format(*contacts))

    conn.close()


**Ejemplo:**

A continuación vamos a ver un ejemplo guiado en el que veremos el funcionamiento básico y el flujo de SQLite, todo ello mediante un código fuente *Pythonic*. Trabajaremos con una base de datos con una única tabla que contendrá la información básica de jugadores de baloncesto de la NBA, de la siguiente manera:

<img src="./database-players.png" width="150">



In [None]:
# -*- coding: utf-8 -*-
import sqlite3
from player import Player

# Connect
conn = sqlite3.connect(':memory:')

# Create a cursor
c = conn.cursor()

# Create table
c.execute("""CREATE TABLE players (
             id integer PRIMARY KEY AUTOINCREMENT,
             first text,
             last text,
             height real,
             weight real,
             age integer
             )""")


def insert_player(player):
    with conn:
        c.execute("INSERT INTO players (first, last, height, weight, age) VALUES (:first, :last, :height, :weight, :age)",
                  {'first': player.first,
                  'last': player.last,
                  'height': player.height,
                  'weight': player.weight,
                  'age': player.age})


def get_players():
    c.execute("SELECT * FROM players")
    return c.fetchall()


def update_weight(player, weight):
    with conn:
        c.execute("""UPDATE players SET weight = :weight
                    WHERE first = :first AND last = :last""",
                  {'first': player.first, 'last': player.last, 'weight': player.weight})


def remove_player(player):
    with conn:
        c.execute("DELETE from players WHERE first = :first AND last = :last",
                  {'first': player.first, 'last': player.last})
        

# Players
player_1 = Player('Giannis', 'Antetokounmpo', 2.11, 109.8, 24)
player_2 = Player('Luka', 'Doncic', 1.96, 98.9, 20)
player_3 = Player('James', 'Harden', 1.96, 99.8, 29)

# Insert players into DB
insert_player(player_1)
insert_player(player_2)
insert_player(player_3)

# Get players
players = get_players()
print(players)

# Update info of some players
update_weight(player_2, 100.5)

# Remove player
remove_player(player_3)

# Get players
players = get_players()
print(players)

conn.close()

## SQLAlchemy

#### Introducción a SQLAlchemy
[SQLAlchemy](https://www.sqlalchemy.org/) es una librería que se utiliza para interactuar con una gran variedad de sistemas de gestión de bases de datos. Esta librería permite crear modelos de datos y consultas tal y como si se tratase de clases y sentencias de Python. Creada por Mike Bayer en 2005, SQLAlchemy es utilizada por muchas compañias --grandes y pequeñas--, y es considerada por muchos como el mecanismo *de facto* para trabajar con bases de datos relacionales en Python.

Puede ser utilizada para conectar con las bases de datos más comunes, tales como Postgres, MySQL, SQLite, Oracle, y muchas otras. También proporciona una manera de añadir soporte para otras bases de datos relacionales. Amazon Redshift, el cual utiliza un dialecto de PostgreSQL, es un gran ejemplo de soporte de una nueva base de datos añadido por la comunidad.

#### ¿Por qué utilizar SQLAlchemy?
La principal razón para hacer uso de SQLAlchemy es para abstraer el código fuente de la base de datos subyacente y sus particularidades SQL. SQLAlchemy hace uso de sentencias y tipos avanzados para asegurar que cada sentencia SQL es llevada a cabo de forma eficiente y apropiada para cada tipo de sistema de gestión de base de datos, liberando al ingeniero de software de preocupaciones particulares. Esta característica permite la migración desde Oracle a PostgreSQL o desde una aplicación de base de datos a un almacén de datos (data *warehouse*) de manera relativamente sencilla. Además, también ayuda a asegurar que toda entrada a la base de datos es *saneada* y debidamente  filtrada, evitando errores comunes como ataques de SQL *Injection*.

SQLAlchemy también proporciona una gran cantidad de flexibilidad proporcionando dos modos principales de uso: **SQL Expression Language (Core)** y **ORM**. Esos modos pueden se utilizados de manera separada o conjunta, dependiendo de la preferencia y necesidades de la aplicación que se pretenda desarrollar.

#### SQL Expression Language (Core)
El SQL Expression Language es una forma *Pythonic* de representar sentencias y expresiones SQL, siendo únicamente una leve abstracción del lenguaje SQL básico. Cuando se hace uso de SQLAlchemy Core, se trabaja directamente con en el esquema actual de base de datos; sin embargo, es un estándar de tal manera que proporciona un lenguaje consistente entre un gran número de sistemas de gestión de bases de datos.

#### Instalando y conectando con una base de datos

SQLAlchemy puede ser utilizado con Python 2.x, Python 3.x y Pypy 2.x. Se recomienda al lector hacer uso de `pip` para realizar la instalacción:

> `pip install sqlalchemy`

No es necesario mencionar que también puede ser instalado con `easy_install` y `diskutils`; sin embargo, `pip` es el método más directo y seguro de instalación.

Durante el proceso de instalación, SQLALchemy tratará de construir varias extensiones C, cuya finalidad es trabajar con conjuntos de datos de forma más rápida y eficiente. Si fuera necesario desactivar esas extensiones debido a algún tipo de problema de compilación, se puede deshabilitar mediante el siguiente parámetro:

> `--global-option=--without-cextensions`

Es necesario mencionar que SQLAlchemy sin las extensiones C, afectará de forma negativa al rendimiento.

#### Instalación de drivers
Por defecto, SQLAlchemy soporta SQLite3 sin ningún tipo de driver adicional; sin embargo, es necesario hacer uso de un driver adicional que haga uso de la especificación estándar de Python DBAPI ([PEP-249](https://www.python.org/dev/peps/pep-0249/)) para conectar con otras bases de datos. Esos DBAPIs proporcionan la base para el dialecto que cada base de datos habla, y a menudo habilita características únicas propias de cada servidor de base de datos y diferentes versiones.

A continuación, se enumeran diferentes DBAPIs para distintos sistemas de gestión de bases de datos:

* **PostgreSQL**: Psycopg2
* **MySQL**: PyMySQL.
* **Otras**. SQLAlchemy puede ser también utilizado en conjunto con Drizzle, Firebird, Oracle, Sybase y Microsoft SQL Server. Además, la comunidad ha proporcionado dialectos externos para otras bases de datos como IBM DB2, Informix, Amazon Redshift, EXASolution, SAP SQL Anywhere, Monet, y muchas otras.

#### Conexión a una base de datos
Para conectar con una base de datos es necesaria la creación de un SQLAlchemy *engine*, el cual crea una interfaz común a la base de datos para ejecutar sentencias SQL. Este proceso se lleva a cabo envolviendo un grupo de conexiones a la base de datos y proporcionando un dialecto de tal manera que se pueda acceder de manera uniforme a la base de datos. De esta manera, el código fuente Python no debe preocuparse de las diferencias entre bases de datos o DBAPIs. SQLAlchemy proporciona una función para crear un *engine* dada una cadena de conexión y otros parámetros adicionales opcionales. Una cadena de conexión es una cadena con un formato específico que proporciona:
* Tipo de base de datos (Postgres, MySQL, etc.)
* Dialecto (Psycopg2, PyMySQL, etc.)
* Localización de la base de datos (archivo o hostname del servidor)
* Puerto del servidor de base de datos
* Nombre de la base de datos

A continuación se muestran varios ejemplos de creación de engines para distintas bases de datos:
> from sqlalchemy import create_engine  
> engine = create_engine('sqlite:///cookies.db')  
> engine2 = create_engine('sqlite:///:memory:')  
> engine = create_engine('postgresql+psycopg2://username:password@localhost:5432/mydb')  
> engine = create_engine('mysql+pymysql://cookiemonster:chocolatechip@mysql01.monster.internal/cookies', pool_recycle=3600)  

La función `create_engine()` devuelve una instancia del *engine*, pero no abre conexión con el servidor de base de datos hasta que se realiza una acción (como por ejemplo una consulta). Esta función posee varios parámetros opcionales:
* `echo`
* `encoding`
* `isolation_level`
* `pool_recycle`

#### SQLAlchemy Core
SQLAlchemy Core es una forma *Pythonic* de representar elementos tanto de sentencias SQL como de estructuras de datos, llamado **SQL Expression Language**.

##### Esquema
Con el fin de proporcionar acceso a la base de datos subyacente, SQLAlchemy debe de proporcionar una representación de las tablas que forman la base de datos. Para ello, existen tres maneras:
* Table objects
* Clases declarativas que representan tablas
* Inferencia desde la base de datos

De aquí en adelante nos centraremos en la primera forma de trabajar. Los objetos de tipo `Table`, contienen una lista de columnas y atributos, las cuales están asociadas a un contenedor de metadatos.

##### Tipos
Existen cuatro categorías de tipos que pueden utilizarse con SQLAlchemy:
* Generic
* SQL standard
* Vendor specific
* User defined

SQLAlchemy define un gran número de tipos genéricos que abstraen a los tipos de datos SQL soportados por cada servidor de base de datos concreto. Los tipos de datos genéricos están definidos en el siguiente módulo:
> `sqlalchemy.types`

Tabla. Tipos de datos genéricos.

SQLAlchemy | Python | SQL
--- | --- | ---
BigInteger | int | BIGINT
Boolean | bool | BOOLEAN or SMALLINT
Date | datetime.date | Date (SQLite: String)
DateTime | datetime.datetime | DATETIME (SQLite: String)
Enum | str | ENUM or VARCHAR
Float | float or Decimal | FLOAT or REAL
Integer | int | Integer
Interval | datetime.timedelta | INTERVAL or DATE from epoch
LargeBinary | byte | BLOB or BYTEA
Numeric | decimal.Decimal | NUMERIC or DECIMAL
Unicode | unicode | UNICODE or VARCHAR
Text | str | CLOB or TEXT
Time | datetime.time | DATETIME

##### Metadata
Los objetos `MetaData` son utilizados para enlazar la estructura de la base de datos, de tal manera que puedan ser accedidos dentro de SQLAlchemy. A menudo es útil pensar en los objetos `MetaData` como una suerte de catálogo de objetos de tipo `Table` con información adicional sobre el *engine* o la conexión. Esas tablas pueden ser accedidas a través de un diccionario (`MetaData.tables`). Las operaciones de lectura son *thread-safe*; sin embargo, la construcción de tablas no es *thread-safe*. En el flujo de funcionamiento de SQLAlchemy, el objeto `MetaData` debe ser importado e inicializado antes que los objetos que harán uso de él. De esta manera, si se desea inicializar una instancia de los objetos `MetaData` para poder hacer uso de ellos en el resto de ejemplos, debemos ejecutar el siguiente fragmento de código.

In [None]:
pip install sqlalchemy

In [None]:
from sqlalchemy import MetaData
metadata = MetaData()

##### Tablas
Los objetos de tipo `Table` son inicializados en SQLAlchemy a través del objeto `MetaData` proporcionado en el constructor, junto con el nombre de la tabla y otros argumentos adicionales --que se asume que son objetos de tipo columna--. Los objetos de tipo columna --`Column`-- representan cada campo de la tabla. Las columnas se construyen mediante objetos de tipo `Column` con un nombre, un tipo y otra serie de argumentos.

En el siguiente ejemplo se crea una tabla para almacenar el inventario de galletas de un servicio online de reparto de galletas.

In [None]:
from sqlalchemy import Table, Column, Integer, Numeric, String, ForeignKey

cookies = Table('cookies', metadata,
Column('cookie_id', Integer(), primary_key=True),
Column('cookie_name', String(50), index=True),
Column('cookie_recipe_url', String(255)),
Column('cookie_sku', String(55)),
Column('quantity', Integer()),
Column('unit_cost', Numeric(12, 2))
)

##### Columnas
Las columnas definen los campos que existen en las tablas, proporcionando mecanismos para definir restricciones a través de parámetros adicionales. Cada tipo de columna posee diferentes argumentos primarios. Por ejemplo, el tipo de dato `String` tiene como argumento primario la longitud, mientras que los números fraccionarios tienen la precisión y la longitud. En cambio, otros tipos no poseen tipos primarios.

Por otro lado, las columnas también poseen argumentos adicionales para extender su comportamiento mas allá, pudiendo marcar a cada columna como campo requerido, campo único, con un valor por defecto, etc.

En el siguiente ejemplo se crea una tabla de usuarios del sistema.

In [None]:
from datetime import datetime
from sqlalchemy import DateTime

users = Table('users', metadata,
Column('user_id', Integer(), primary_key=True),
Column('username', String(15), nullable=False, unique=True),
Column('email_address', String(255), nullable=False),
Column('phone', String(20), nullable=False),
Column('password', String(25), nullable=False),
Column('created_on', DateTime(), default=datetime.now),
Column('updated_on', DateTime(), default=datetime.now, onupdate=datetime.now)
)

##### Índices
Los índices se utilizan para acelerar las búsquedas de determinados campos. En uno de los ejemplos anteriores, se ha creado un índice sobre la columna *cookie_name* ya que se conoce con antelación que en un futuro se realizarán muchas búsquedas por ese campo. De esta forma, se acelerarán las búsquedas a través de ese campo.


##### Relaciones y claves ajenas
Hasta ahora, se han definido tablas y columnas con sus respectivas restricciones e índices. A continuación veremos cómo se manejan las relaciones entre tablas. Para ello, vamos a necesitar una manera registrar las órdenes que procesará el sistema. Para entender cómo se relacionarán las tablas, a continuación se presenta un diagrama:

<img src="./database-sqlalchemy.png" width="500">

En la tabla *line_items* se puede apreciar una manera de implementar una relación, a través del campo *order_id* como clave ajena a la tabla orders. En este caso, podemos tener muchos registros *line_items* para una única orden. Sin embargo, si se observa de manera más profunda la tabla *line_items*, se observará que también existe una relación con la tabla *cookies*, a través de la clave ajena *cookie_id*. Esto es posible ya que la tabla *line_items* es una tabla de asociación --con datos adicionales-- entre las tablas *orders* y *cookies*. Las tablas de asociación son utilizadas para habilitar relaciones *many-to-many* entre dos tablas. A menudo, una única clave ajena es signo de una relación *one-to-many*; sin embargo, si existen múltiples claves ajenas en una tabla, hay bastante probabilidad de que sea una tabla de asociación.

In [None]:
from sqlalchemy import ForeignKey, Boolean

orders = Table('orders', metadata,
Column('order_id', Integer(), primary_key=True),
Column('user_id', ForeignKey('users.user_id')),
Column('shipped', Boolean(), default=False)
)

line_items = Table('line_items', metadata,
Column('line_items_id', Integer(), primary_key=True),
Column('order_id', ForeignKey('orders.order_id')),
Column('cookie_id', ForeignKey('cookies.cookie_id')),
Column('quantity', Integer()),
Column('extended_cost', Numeric(12, 2))
)

Al hacer uso de cadenas como claves ajenas --`String`-- en lugar de las propias columnas, posibilita la separación de la definición de tablas entre múltiples módulos, y también evita posibles errores en cuanto al orden de creación de las tablas.

##### Persistiendo las tablas
Todas las tablas e información adicional del *schema* son asociadas con una instancia de la clase `MetaData`. Para persistir los datos únicamente hay que realizar una llamada al método `create_all()`.

Por defecto, el método `create_all()` no intentará recrear tablas que ya existan en la base de datos, y por tanto, es seguro ejecutar el código múltiples veces.

A continuación se presenta todo el código fuente:

In [None]:
from datetime import datetime
from sqlalchemy import (MetaData, Table, Column, Integer, Numeric, String,
DateTime, ForeignKey, create_engine)

metadata = MetaData()

cookies = Table('cookies', metadata,
Column('cookie_id', Integer(), primary_key=True),
Column('cookie_name', String(50), index=True),
Column('cookie_recipe_url', String(255)),
Column('cookie_sku', String(55)),
Column('quantity', Integer()),
Column('unit_cost', Numeric(12, 2))
)

users = Table('users', metadata,
Column('user_id', Integer(), primary_key=True),
Column('customer_number', Integer(), autoincrement=True),
Column('username', String(15), nullable=False, unique=True),
Column('email_address', String(255), nullable=False),
Column('phone', String(20), nullable=False),
Column('password', String(25), nullable=False),
Column('created_on', DateTime(), default=datetime.now),
Column('updated_on', DateTime(), default=datetime.now, onupdate=datetime.now)
)

orders = Table('orders', metadata,
Column('order_id', Integer(), primary_key=True),
Column('user_id', ForeignKey('users.user_id'))
)

line_items = Table('line_items', metadata,
Column('line_items_id', Integer(), primary_key=True),
Column('order_id', ForeignKey('orders.order_id')),
Column('cookie_id', ForeignKey('cookies.cookie_id')),
Column('quantity', Integer()),
Column('extended_cost', Numeric(12, 2))
)

engine = create_engine('sqlite:///:memory:')
connection = engine.connect()
metadata.create_all(engine)

#### Trabajando con datos a través de SQLAlchemy Core
Ahora que la base de datos posee varias tablas, se explicará cómo trabajar con los datos de esas tablas. En los próximos subapartados se detallará cómo insertar, actualizar, obtener y eliminar datos, así como otras operaciones. De igual manera que en los puntos anteriores, se hará uso del SQL Expression Languaje, proporcionado por SQLAlchemy Core.

##### Insertar datos
Para insertar datos, utilizaremos el método `insert()` junto con el método `values()` con los argumentos para cada columna que deseamos rellenar. A continuación se muestra un ejemplo en el que se insertará un tipo de galleta muy conocido --chocolate chip--- en la tabla *cookies*.

In [None]:
ins = cookies.insert().values(
cookie_name="chocolate chip",
cookie_recipe_url="http://some.aweso.me/cookie/recipe.html",
cookie_sku="CC01",
quantity="12",
unit_cost="0.50"
)

print(str(ins))

Al mostrar la sentencia anterior se puede observar cómo han sido reemplazados los valores mediante el `:column_name`, que es como SQLAlchemy representa los parámetros a través de la función `str()`. Los parámetros son útiles para asegurar que los datos han sido debidamente escapados, mitigando así posibles errores de seguridad, tales como ataques de tipo SQL *Injection*.

Si se revisa la versión compilada de la sentencia de inserción es posible ver los parámetros. El método `compile()` del objeto `ins` devuelve un objeto de tipo `SQLCompiler`, que proporciona acceso a los parámetros que serán enviados como sentencia.

In [None]:
ins.compile().params

Una vez se obtiene una visión general de la sentencia *insert* y se tiene conocimiento sobre qué va a ser insertado en la tabla, se puede hacer uso del método `execute()` sobre el objeto `connection` para enviar la sentencia a la base de datos, la cual insertará el registro en la tabla.

In [None]:
result = connection.execute(ins)

También es posible obtener el ID del registro que acaba de ser insertado accediendo al atributo `inserted_primary_key`:

In [None]:
result.inserted_primary_key

Además de poder insertar a través de un método de instancia de tabla, también es posible hacer uso de funciones *top-level* de manera genérica.

In [None]:
from sqlalchemy import insert

ins = insert(cookies).values(
cookie_name="chocolate chip",
cookie_recipe_url="http://some.aweso.me/cookie/recipe.html",
cookie_sku="CC01",
quantity="12",
unit_cost="0.50"
)

Al método `execute()` del objeto `connection` es posible proveerle los valores a insertar como argumentos clave después de la sentencia. Con el siguiente ejemplo se explica mejor esta funcionalidad:

In [None]:
ins = cookies.insert()
result = connection.execute(
ins,
cookie_name='dark chocolate chip',
cookie_recipe_url='http://some.aweso.me/cookie/recipe_dark.html',
cookie_sku='CC02',
quantity='1',
unit_cost='0.75'
)

result.inserted_primary_key

Aunque este método no es utilizado en la práctica para registros únicos, ilustra cómo una sentencia es compilada y ensamblada antes de ser enviada al servidor de base de datos. Es posible insertar múltiples registros en un único paso mediante una lista de diccionarios con los datos que se pretenden guardar en la tabla. A continuación se muestra un ejemplo de inserción de varios tipos de galletas en la tabla *cookies*.

In [None]:
inventory_list = [
{
'cookie_name': 'peanut butter',
'cookie_recipe_url': 'http://some.aweso.me/cookie/peanut.html',
'cookie_sku': 'PB01',
'quantity': '24',
'unit_cost': '0.25'
},
{
'cookie_name': 'oatmeal raisin',
'cookie_recipe_url': 'http://some.okay.me/cookie/raisin.html',
'cookie_sku': 'EWW01',
'quantity': '100',
'unit_cost': '1.00'
}
]

result = connection.execute(ins, inventory_list)

##### Consultar datos
Como primera sentencia de consulta de datos, se puede comenzar por hacer uso de la función `select()`, la cual es la función análoga a la sentencia genérica SQL SELECT. Inicialmente, a través de la siguiente sentencia pueden obtenerse todos los registros de la tabla *cookies*.

In [None]:
from sqlalchemy.sql import select

s = select([cookies])
rp = connection.execute(s)
results = rp.fetchall()
print(results)

El método `select()` espera recibir una lista de columnas; sin embargo, por conveniencia también acepta objetos de tipo `Table`, seleccionando todas las columnas de la tabla. También es posible hacer uso del método `select()` sobre el propio objeto tabla.

In [None]:
from sqlalchemy.sql import select

s = cookies.select()
rp = connection.execute(s)
results = rp.fetchall()
print(results)

##### ResultProxy
Un objeto de tipo `ResultProxy` es una envoltura sobre el objeto cursor de la DBAPI, cuya finalidad es facilitar la manipulación de los resultados obtenidos. Por ejemplo, facilita el manejo de los resultados de una consulta permitiendo acceder a ellos a través del índice, nombre u objeto de tipo `Column`.

In [None]:
first_row = results[0]
first_row[1]
first_row.cookie_name
first_row[cookies.c.cookie_name]

Esta flexibilidad en el acceso es sólo parte del potencial de la clase `ResultProxy`; esta clase también es iterable, y por tanto, se puede acceder a cada registro devuelto por la consulta.

In [None]:
rp = connection.execute(s)
for record in rp:
    print(record.cookie_name)

En los ejemplos anteriores, cada consulta obtiene todas las columnas de cada registro. A menudo, únicamente se necesita un subconjunto de esas columnas para realizar una acción determinada. Si los datos de esas columnas extra son grandes, puede causar problemas de rendimiento en la aplicación y consumir mucha más memoria de la necesaria. Por tanto, el primer paso debe ser seleccionar los datos que se desean obtener, evitando de antemano problemas de memoria.

##### Controlando las columnas en la consulta
Para limitar los campos devueltos por una consulta, es necesario proporcionar las columnas que se desean obtener en el método `select()` como una lista de Python.

In [None]:
s = select([cookies.c.cookie_name, cookies.c.quantity])
rp = connection.execute(s)
print(rp.keys())
result = rp.first()

##### Ordenación
Si se desea obtener los resultados con algún tipo de ordenación, se puede hacer uso del método `order_by()`.

In [None]:
s = select([cookies.c.cookie_name, cookies.c.quantity])
s = s.order_by(cookies.c.quantity)
rp = connection.execute(s)
for cookie in rp:
    print('{} - {}'.format(cookie.quantity, cookie.cookie_name))

Si por el contrario, se desea obtener los resultados ordenados de manera descendente, deberá hacerse uso de la función `desc()`.

In [None]:
from sqlalchemy import desc

s = select([cookies.c.cookie_name, cookies.c.quantity])
s = s.order_by(desc(cookies.c.quantity))
rp = connection.execute(s)
for cookie in rp:
    print('{} - {}'.format(cookie.quantity, cookie.cookie_name))

##### Limitando los datos
Si se desea limitar la consulta, se puede hacer uso de la función `limit()` para definir el límite como parte de la propia consulta.

In [None]:
s = select([cookies.c.cookie_name, cookies.c.quantity])
s = s.order_by(cookies.c.quantity)
s = s.limit(2)
rp = connection.execute(s)
print([result.cookie_name for result in rp])

##### Filtrado
Las consultas de filtrado se llevan a cabo añadiendo cláusulas `where()` tal y como ocurre en SQL. Una típica cláusula `where()` tiene una columna, un operador y un valor o columna. Es posible encadenar múltiples cláusulas `where()` de manera conjunta, actuando como si se hiciera uso de operadores AND en las sentencias SQL tradicionales.

En el siguiente ejemplo, se realiza una búsqueda sobre la tabla *cookies* con nombre 'chocolate chip'.

In [None]:
s = select([cookies]).where(cookies.c.cookie_name == 'chocolate chip')
rp = connection.execute(s)
record = rp.first()
print(record.items())

También sería posible buscar de entre todas las galletas aquellas que contienen la palabra chocolate.

In [None]:
s = select([cookies]).where(cookies.c.cookie_name.like('%chocolate%'))
rp = connection.execute(s)
for record in rp.fetchall():
    print(record.cookie_name)

##### ClauseElements

`ClauseElements` son un tipo de entidad que utilizamos en una cláusula, siendo típicamente columnas en una tabla; sin embargo, al contrario que las columnas, `ClauseElements` proporcionan capacidades adicionales.

Tabla. Métodos ClauseElements.

Método | Propósito 
--- | --- 
between(cleft, cright) | Find where the column is between cleft and cright   
concat(column_two) | Concatenate column with column_two   
distinct() | Find only unique values for column  
in_([list]) | Find where the column is in the list  
is_(None) | Find where the column is None (commonly used for Null checks with None)   
contains(string) | Find where the column has string in it (Case-sensitive)  
endswith(string) | Find where the column ends with string (Case-sensitive)   
like(string) | Find where the column is like string (Case-sensitive)  
startswith(string) | Find where the column begins with string (Case-sensitive)  
ilike(string) | Find where the column is like string (NOT Case-sensitive)  


También existen versiones negativas de esos métodos, como `notlike()` y `notin_()`. La única excepción a la convención `not<method>()` es el método `isnot()`.

##### Operadores
Hasta ahora, sólo se han mostrado ejemplos a la hora de filtrar resultados donde una columna era igual a un valor o mediante el uso de ḿétodos `ClauseElement` --como el método `like()`--; sin embargo, también se pueden utilizar otros muchos operadores para filtrar datos. SQLAlchemy proporciona sobrecarga para la gran mayoría de operadores estándar de Python. Esto incluye todos los operadores de comparación ( == , != , < , > , , >= ), los cuales tienen un comportamiento tal y como se espera de una sentencia Python. Los operadores aritméticos ( +, - , * , / , y % ) también son soportados con capacidades adicionales.

In [None]:
s = select([cookies.c.cookie_name, 'SKU-' + cookies.c.cookie_sku])
for row in connection.execute(s):
    print(row)

###### Operadores booleanos
SQLAlchemy también permite hacer uso de los operadores SQL booleanos AND, OR y NOT, a través de los operadores lógicos *bit a bit* ( & , | , y ~ ). Hay que tener mucho cuidado a la hora de utilizar estos operadores ya que es necesario conocer las reglas de precedencia de operadores en Python.


##### Conjunciones
Mientras que es posible encadenar múltiples cláusulas `where()` de manera conjunta, a menudo es más legible y funcional hacer uso de conjunciones para lograr el efecto deseado. Las conjunciones en SQLAlchemy son `and_()`, `or_()` y `not_()`.

Por tanto, a modo de ejemplo, si se desea conocer la lista de galletas con un coste menor a una cantidad y mayor que cierta otra cantidad, se podría ejecutar el siguiente fragmento de código.

In [None]:
from sqlalchemy import and_, or_, not_

s = select([cookies]).where(
    and_(
        cookies.c.quantity > 23,
        cookies.c.unit_cost < 0.40
    )
)

for row in connection.execute(s):
    print(row.cookie_name)

La función `or_()` funciona de manera opuesta a la función `and_()`, incluyendo resultados que corresponden con alguna de las cláusulas definidas. Si se desea encontrar las galletas que hay almacenadas entre 10 y 50 en el inventario, o las galletas que contienen el nombre 'chip', debería ejecutarse el siguiente fragmento de código fuente:

In [None]:
from sqlalchemy import and_, or_, not_

s = select([cookies]).where(
    or_(
        cookies.c.quantity.between(10, 50),
        cookies.c.cookie_name.contains('chip')
    )
)

for row in connection.execute(s):
    print(row.cookie_name)

In [None]:
# Ejercicio: Mostrar las galletas que contienen 'oatmeal' o 'butter'.

##### Actualizar datos
Además del método `insert()`, existe un método con una sintáxis muy similar para actualizar datos: el método `update()`; sin embargo, se puede especificar a través de la cláusula `where()` qué registros deben ser actualizados. Al igual que ocurre con el método `insert()`, las sentencias de actualización pueden realizarse a través de la función `update()` y a través del método `update()` de la tabla sobre la cual se pretende realizar la actualización de datos. Tal y como ocurre en otros lenguajes, si no se especifica la cláusula `where()`, se realizará la actualización sobre todos los registros de la tabla.

¿Qué hace el siguiente fragmento de código fuente?

In [None]:
from sqlalchemy import update

u = update(cookies).where(cookies.c.cookie_name == "chocolate chip")
u = u.values(quantity=(cookies.c.quantity + 120))
result = connection.execute(u)
print(result.rowcount)

s = select([cookies]).where(cookies.c.cookie_name == "chocolate chip")
result = connection.execute(s).first()
for key in result.keys():
    print('{:>20}: {}'.format(key, result[key]))

##### Eliminar datos
Para crear una sentencia de borrado, se puede utilizar tanto la función `delete()` como el método `delete()` de la tabla sobre la cual se pretende eliminar datos. A diferencia de los métodos `insert()` y `update()`, el método `delete()` no tiene parámetros, sólo una cláusula `where()`, que si es omitida se eliminarán todos los registros de la tabla.

¿Qué hace el siguiente fragmento de código fuente?

In [None]:
from sqlalchemy import delete

u = delete(cookies).where(cookies.c.cookie_name == "dark chocolate chip")
result = connection.execute(u)
print(result.rowcount)

s = select([cookies]).where(cookies.c.cookie_name == "dark chocolate chip")
result = connection.execute(s).fetchall()
print(len(result))

**Ejercicios de creación de esquemas**

Ejercicio 1: Reproducir la siguiente relación de tablas *one-to-many* mediante SQLAlchemy Core.

<img src="./one-to-many.png" width="500">

In [None]:
# Ejercicio 1

Ejercicio 2: Reproducir la siguiente relación de tablas *one-to-one* mediante SQLAlchemy Core.

<img src="./one-to-one.png" width="500">

In [None]:
# Ejercicio 2

Ejercicio 3: Reproducir la siguiente relación de tablas *many-to-many* mediante SQLAlchemy Core.

<img src="./many-to-many.png" width="500">

In [None]:
# Ejercicio 3

Referencias:
- [1] A brief tutorial on SQL with Python (using SQLite). https://github.com/georgetown-analytics/sql-tutorial
- [2] Python SQLite Tutorial: Complete Overview. https://www.youtube.com/watch?v=pd-0G0MigUA
- [3] Python SQLite (sqlite3). https://docs.python.org/2/library/sqlite3.html
- [4] Essential SQLAlchemy. Rick Copeland. O'Reilly Media, Inc. ISBN: 9780596516147.
- [5] Defining Schema in SQLAlchemy Core. https://overiq.com/sqlalchemy-101/defining-schema-in-sqlalchemy-core/