# Basi di Dati Mod. 2 - SQLAlchemy

### Stefano Calzavara, Università Ca' Foscari Venezia

SQLAlchemy è una delle librerie più popolari per interfacciarsi con un database relazionale tramite Python:
- **Core**: interfaccia di accesso alla base di dati relazionale simile in spirito a JDBC, ma che permette di astrarre dalla specifica sintassi del DBMS sottostante. La scelta più naturale per esperti di SQL
- **ORM**: astrazione ad oggetti della base di dati relazionale, che mitiga il problema dell’impedence mismatch

In questa lezione ci concentreremo sulla componente Core, cioè quella di più basso livello, mentre nella prossima parleremo di ORM.

Installazione tramite: `pip install sqlalchemy`

Nota: SQLAlchemy 2.0 (che estende la versione 1.4) introdurrà diversi cambiamenti maggiori, ma al momento è ancora in fase di sviluppo. Il materiale del corso è basato sulla versione 1.3 della libreria ed è stato testato funzionare correttamente su di essa.

### Architettura di SQLAlchemy
![alt text](sqla_arch_small.png "Title")

### SQL Alchemy Core
SQLAlchemy Core integra due modalità di utilizzo:
- **Expression Language**: le query vengono effettuate tramite metodi Python e vengono compilate in modo appropriato per il DBMS sottostante
- **Textual SQL**: le query vengono scritte direttamente (come stringhe) nella sintassi SQL del DBMS sottostante

E’ possibile utilizzare entrambe le modalità nello stesso progetto, ma la prima è preferibile per essere indipendenti dal DBMS sottostante e per proteggersi naturalmente da SQL injection.

Reference documentation: https://docs.sqlalchemy.org/en/13/core/index.html

### Concetti chiave

SQLAlchemy si appoggia a tre entità chiave:
1. **engine**: un’astrazione del DBMS sottostante, per esempio SQLite, MySQL oppure PostgreSQL
2. **metadata**: un’astrazione dello schema relazionale sottostante, contenente tutte le relazioni al suo interno
3. **connessione**: l’interfaccia di accesso all’engine tramite la quale eseguiamo le query desiderate

Un engine contiene informazioni sufficienti per aprire una connessione, attraverso la quale si può iniziare ad operare sui metadata.

### Creazione di un database

In [None]:
import sqlalchemy
from sqlalchemy import *

# SQLite supporta database transienti in RAM (echo attiva il logging)
engine = create_engine('sqlite://', echo = True)
metadata = MetaData()

users = Table('users', metadata, Column('id', Integer, primary_key=True),
                                 Column('name', String),
                                 Column('fullname', String))

addresses = Table('addresses', metadata, Column('id', Integer, primary_key=True),
                                         Column('user_id', None, ForeignKey('users.id')),
                                         Column('email_address', String, nullable=False))

metadata.create_all(engine)       # nota: non sovrascrive le tabelle esistenti :)

### Inserimento di dati

In [None]:
ins = users.insert()    # astrazione di un INSERT statement sulla tabella users
print(str(ins))

In [None]:
ins = users.insert().values(name='jack', fullname='Jack Jones')
print(str(ins))

In [None]:
print(ins.compile().params)

In [None]:
conn = engine.connect()
res = conn.execute(ins)  # attenzione alla presenza dei punti di domanda nell'output

In [None]:
print(res.inserted_primary_key)

In [None]:
ins = users.insert()
conn.execute(ins, id=2, name='wendy', fullname='Wendy Williams')

In [None]:
conn.execute(ins, name='sally', fullname='Sally Roberts')

In [None]:
conn.execute(addresses.insert(), [{'user_id': 1, 'email_address' : 'jack@yahoo.com'},
                                  {'user_id': 1, 'email_address' : 'jack@msn.com'},
                                  {'user_id': 2, 'email_address' : 'www@www.org'},
                                  {'user_id': 2, 'email_address' : 'wendy@aol.com'}])

### Dietro alle quinte
A partire da queste poche righe di codice, succedono un sacco di cose interessanti dietro alle quinte di SQLAlchemy.

![alt text](sqla_engine_arch.png "Title")

Quando creiamo un engine, il formato dell’URL che gli passiamo determina come tradurre la sintassi SQLAlchemy nella sintassi (**dialect**) del DBMS sottostante. In questo caso abbiamo usato SQLite per semplicità, ma lo stesso approccio si può utilizzare per interfacciarsi con Postgres: 

`'postgresql://scott:tiger@localhost:5432/mydatabase'`

La creazione di un engine non effettua alcuna connessione finché non viene chiamato `connect`. Visto che aprire una connessione è un’operazione costosa, SQLAlchemy utilizza un **pool** di connessioni:
- quando una connessione viene chiusa, SQLAlchemy non la chiude immediatamente, ma la mette in un pool per renderla riutilizzabile
- quando una connessione viene aperta, SQLAlchemy controlla prima che non vi sia già una connessione disponibile nel pool
- le connessioni nel pool sono periodicamente validate e vengono chiuse automaticamente se vi rimangono per troppo tempo

### Selezione di dati

In [None]:
print(type(users))

In [None]:
s = select([users])
result = conn.execute(s)

type(result)

In [None]:
for row in result:
    print (row)

In [None]:
result = conn.execute(s)
row = result.fetchone()
print("The row contains name:", row['name'], "; fullname:", row['fullname'])

In [None]:
row = result.fetchone()
print("The row contains name:", row[1], "; fullname:", row[2])

In [None]:
s = select([users.c.name, users.c.fullname])
result = conn.execute(s)
for row in result:
    print(row)

In [None]:
for row in conn.execute(select([users, addresses])):
    print(row)

In [None]:
print(type(select([users,addresses])))

In [None]:
s = select([users, addresses]).where(users.c.id == addresses.c.user_id)
for row in conn.execute(s):
    print(row)

### Operatori e condizioni logiche

In [None]:
print(users.c.id == addresses.c.user_id)    # ci aspetteremmo True oppure False...

In [None]:
type(users.c.id == addresses.c.user_id)     # ci aspetteremmo bool...

In [None]:
print(users.c.name == None)

In [None]:
print(users.c.id + addresses.c.id)

In [None]:
print(users.c.name + users.c.fullname)

In [None]:
cond = and_(users.c.name.like('j%'),
            users.c.id == addresses.c.user_id,
            or_(addresses.c.email_address == 'wendy@aol.com',
                addresses.c.email_address == 'jack@yahoo.com'),
            not_(users.c.id > 5))

print(cond)

In [None]:
cond.compile().params

In [None]:
s = select([users, addresses]).where(cond)

for row in conn.execute(s):
    print(row)

In [None]:
s = select([(users.c.fullname + ", " + addresses.c.email_address).label('title')]).\
           where(users.c.id == addresses.c.user_id).\
           where(users.c.name.between('m', 'z')).\
           where(or_(addresses.c.email_address.like('%@aol.com'),
                     addresses.c.email_address.like('%@msn.com')))

print(conn.execute(s).fetchall())

### Giunzioni

In [None]:
j = users.join(addresses)    # attenzione all'utilizzo automatico della foreign key!
print(j)

In [None]:
type(j)

In [None]:
print(j.c)

In [None]:
s = select([users.c.fullname, addresses.c.email_address]).select_from(j)
print(conn.execute(s).fetchall())

In [None]:
j = users.join(addresses, addresses.c.email_address.like(users.c.name + '%'))
print(j)

In [None]:
s = select([users.c.fullname, addresses.c.email_address]).select_from(j)
print(conn.execute(s).fetchall())

In [None]:
j = users.outerjoin(addresses)
s = select([users.c.fullname, addresses.c.email_address]).select_from(j)
print(conn.execute(s).fetchall())

### Aggiornamenti e cancellazioni

In [None]:
u = users.update().where(users.c.id == 1).values(name='jj')
conn.execute(u)
print(conn.execute(users.select()).fetchall())

In [None]:
d = users.delete().where(users.c.name > 'm')
conn.execute(d)
print(conn.execute(users.select()).fetchall())

### Transazioni

In [None]:
trans = conn.begin()
try:
    conn.execute(users.insert(), name='bob', fullname='Bob Foster')
    conn.execute(users.insert(), id=1, name='charlie', fullname='Charlie Sheen')   # fallisce
    trans.commit()
except:
    trans.rollback()

In [None]:
print(conn.execute(users.select()).fetchall())

### Table Reflection

In questa lezione abbiamo creato un nuovo database, ma se volessimo interfacciarci con uno già esistente dovremmo avere un modo per ottenere gli oggetti corrispondenti alle sue tabelle. Sebbene chiamare `create_all` non sovrascriva il contenuto di tabelle esistenti, definire esplicitamente l'intera struttura di ciascuna tabella è molto scomodo. Per ovviare a questo problema è possibile utilizzare una forma di **reflection** sulle tabelle già esistenti:

In [None]:
users2 = Table('users', metadata, autoload=True, autoload_with=engine)
print([c.name for c in users2.columns])

### Textual SQL

In [None]:
s = text("SELECT users.fullname || ', ' || addresses.email_address AS title "
         "FROM users, addresses "
         "WHERE users.id = addresses.user_id "
         "AND users.name BETWEEN :x AND :y "
         "AND (addresses.email_address LIKE :e1 OR addresses.email_address LIKE :e2)")

print(conn.execute(s, x='m', y='z', e1='%@aol.com', e2='%@msn.com').fetchall())

### Esercizio

Create tramite SQLAlchemy Core le seguenti tabelle:
* Product(maker, model*, type)
* PC(<u>model*</u>, speed, ram, hd, price)
* Laptop(<u>model*</u>, speed, ram, hd, screen, price)
* Printer(<u>model*</u>, color, type, price)

Definite opportune chiavi primarie ed esterne, scegliendo i tipi di dato appropriati per i vari attributi. Una volta fatto ciò, popolate le tabelle con alcuni dati artificiali ed effettuate tramite l'Expression Language di SQLAlchemy le seguenti query:
1. Trovare il modello, la velocità e la dimensione dell'hard disk di tutti i PC che costano meno di $1000. 
2. Trovare tutti i produttori di stampanti.
3. Trovare il produttore e la velocità dei laptop con un hard disk da almeno 300 GB.
4. Trovare il modello ed il prezzo di tutti i PC ed i laptop realizzati dalla Lenovo.
5. Trovare le dimensioni degli hard disk che occorrono in almeno due PC.
6. Trovare tutte le aziende che producono laptop, ma non PC.
7. Trovare i produttori di PC con una velocità minima di 2.0 GHz.
8. Trovare tutte le aziende che producono sia PC che laptop.

Procedete immaginando la query SQL e traducendola nell'Expression Language di SQLAlchemy. Consultate la documentazione dove necessario.