# SQLAlchemy

SQLAlchemy je knihovnou / frameworkem, který umožňuje odstínit konkrétní typ databázového serveru. Díky této knihovně IT specialista modeluje datové entity bez ohledu na konkrétní úložiště. Podobných knihoven existuje celá řada, ale SQLAlchemy je pravděpodobně nejpoužívanější.

Z hlediska modelování datových struktur existují dva základní přístupy:
- Database First
- Code First

Database First je způsob, kdy vznikají popisy přímo v databázi. Alternativně lze existující databázi vzít jako základ a dále ji rozšiřovat. Toto souvisí s tzv. migracemi, které mají specifický význam při upgrade informačního systému.

Code First předpokládá, že popis datových struktur je definován kódem a z tohoto kódu je následně odvozena posloupnost příkazů, které musí být nad databází provedeny, aby vznikly tabulky s jejich strukturou a vzájemným propojením (Foreign Keys).

SQLAlchemy podporuje oba přístupy, lze tedy z existující databáze odvodit modely nebo na základě modelů vytvořit strukturu databáze.

https://github.com/LeeBergstrand/Jupyter-SQLAlchemy-Tutorial/blob/master/Jupyter-SQLAlchemy.ipynb

In [1]:
#https://docs.sqlalchemy.org/en/13/orm/tutorial.html
#https://docs.sqlalchemy.org/en/14/orm/basic_relationships.html
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy import Column, Integer, String, BigInteger, Sequence, Table, ForeignKey, DateTime
from sqlalchemy.orm import relationship

## Engine

Engine "Stroj" je prvek, přes který jsou posílány SQL příkazy na server. V případě, kdy dochází k prvotní inicializaci (instalace), je nutné detekovat a případně vytvořit databázi a její strukturu.

In [2]:
!pip install sqlalchemy_utils



Testování a prvotní vytvoření databáze pomocí `connectionstring`u, který představuje úplnou definici propojení se serverem. Connecion string obsahuje definici driveru, jména uživatele, heslo uživatele, jméno serveru (počítače, tzv. hostname) a jméno databáze.

In [3]:
from sqlalchemy_utils.functions import database_exists, create_database

connectionstring = 'postgresql+psycopg2://postgres:example@postgres/newdatabase'
if not database_exists(connectionstring):  #=> False
    try:
        create_database(connectionstring)
        doCreateAll = True
        print('Database created')
    except Exception as e:
        print('Database does not exists and cannot be created')
        raise
else:
    print('Database already exists')

Database already exists


In [4]:
from sqlalchemy import create_engine

#engine = create_engine('sqlite:///:memory:', echo=True)
#engine = create_engine('postgresql+psycopg2://user:password@hostname/database_name')

In [5]:
engine = create_engine(connectionstring) 

## Models

Modely prezentují struktury uložené v tabulkách. Představují tak proces transformace z výsledku dotazu do struktur jazyka Python a ze struktur jazyka do prvků SQL dotazů.

V SQLAlchemy je zebezpečeno provázání modelů (mimo jiné relace) pomocí dědičnosti, kdy existuje třída, ze které jsou odvozeny všechny modely. Jsou využity specifické funkce jazyka Python k tomu, aby při deklaraci modelů vznikl registr těchto modelů. Tento přístup umožňuje řešit specifické problémy. 

In [6]:
from sqlalchemy.ext.declarative import declarative_base

BaseModel = declarative_base()

`BaseModel` je třídou, která musí být použita při deklaraci modelů. Všimněte si, že tato třída je návratovou hodnotou funkce. Tuto třídu lze vytvořit různými způsoby, zde si ukazujeme nejčastěji používaný.

V následující části jsou deklarovány tři modely `UserModel`, `GroupModel` a `GroupTypeModel`. Protože mezi `UserModel` a `GroupModel` je relace M:N, je nutné mít zprostředkující tabulku a tedy i model. Tímto modelem je `UserGroupModel`, který není definovaný jako třída, ale je vytvořen pomocí funkce `Table`.

In [7]:
import datetime
from sqlalchemy import Column, String, BigInteger, Integer, DateTime, ForeignKey, Sequence, Table
from sqlalchemy.orm import relationship

unitedSequence = Sequence('all_id_seq')

UserGroupModel = Table('users_groups', BaseModel.metadata,
        Column('id', BigInteger, Sequence('all_id_seq'), primary_key=True),
        Column('user_id', ForeignKey('users.id'), primary_key=True),
        Column('group_id', ForeignKey('groups.id'), primary_key=True)
)

class UserModel(BaseModel):
    __tablename__ = 'users'
    
    id = Column(BigInteger, Sequence('all_id_seq'), primary_key=True)
    name = Column(String)
    surname = Column(String)
    email = Column(String)
    
    lastchange = Column(DateTime, default=datetime.datetime.now)
    externalId = Column(BigInteger, index=True)

    groups = relationship('GroupModel', secondary=UserGroupModel, back_populates='users')
        
class GroupModel(BaseModel):
    __tablename__ = 'groups'
    
    id = Column(BigInteger, Sequence('all_id_seq'), primary_key=True)
    name = Column(String)
    
    lastchange = Column(DateTime, default=datetime.datetime.now)
    entryYearId = Column(Integer)

    externalId = Column(String, index=True)

    grouptype_id = Column(ForeignKey('grouptypes.id'))
    grouptype = relationship('GroupTypeModel', back_populates='groups')

    users = relationship('UserModel', secondary=UserGroupModel, back_populates='groups')

class GroupTypeModel(BaseModel):
    __tablename__ = 'grouptypes'
    
    id = Column(BigInteger, Sequence('all_id_seq'), primary_key=True)
    name = Column(String)

    groups = relationship('GroupModel', back_populates='grouptype')

## Inicializace struktur v databázi

Existují dva základní přístupy, které jsou v praxi kombinovány. Jedná se o

- database first
- code first

V tomto případě využíváme přístup code first, kdy budoucí strukturu tabulek v databázi je definována třídami. Tato definice poslouží k vytvoření struktury databáze a jejich tabulek.

In [8]:
#BaseModel.metadata.drop_all(engine)
BaseModel.metadata.create_all(engine)

`drop_all` všechny tabulky odstraní. Pozor, není to prosté a destruktivní odstranění. Pokud dosud definovaná struktura (třídami) neodpovídá struktuře relací v databázi, může dojít k chybě.

`create_all` vytvoří všechny tabulky a relace mezi nimi.

## Session

`session` je entita, s jejíž pomocí jsou realizovány příkazy v databázi (SQL).

V SQLAlchemy se nejdříve vytváří `SessionMaker`, což je callable a jejím voláním se vytváří `session`. `session` se používá na ucelené operace její životnost je omezena právě jen na jednu ucelenou operaci.

In [9]:
from sqlalchemy.orm import sessionmaker

SessionMaker = sessionmaker(bind=engine)
session = SessionMaker()

## CRUD Ops

Nad daty se provádí čtyři základní operace:

- **C**reate
- **R**ead
- **U**pdate
- **D**elete

Pokud je plánováno nasazení REST API, je vhodné mít tyto operace pro datové entity definované v izolovaných funkcích nebo metodách třídy.

Parametr `db` v následujících funkcích reprezentuje `session` diskutovanou výše.

In [10]:
def crudUserGet(db: SessionMaker, id: int):
    return db.query(UserModel).filter(UserModel.id==id).first()

def crudUserGetAll(db: SessionMaker, skip: int = 0, limit: int = 100):
    return db.query(UserModel).offset(skip).limit(limit).all()

def crudUserCreate(db: SessionMaker, user):
    userRow = UserModel(name=user.name)
    db.add(userRow)
    db.commit()
    db.refresh(userRow)
    return userRow

def crudUserUpdate(db: SessionMaker, user):
    userToUpdate = db.query(UserModel).filter(UserModel.id==user.id).first()
    userToUpdate.name = user.name if user.name else userToUpdate.name
    db.commit()
    db.refresh(userToUpdate)
    return userToUpdate

Protože návratovou hodnotou funkcí jsou modely, může přijít vhod jejich transformace na dictionary.

In [11]:
def to_dict(row):
    return {column.name: getattr(row, row.__mapper__.get_property_by_column(column).key) for column in row.__table__.columns}

In [14]:
dbRecord = UserModel(name='user name')
session.add(dbRecord)
session.commit()

from sqlalchemy import select

statement = select(UserModel).filter_by(name='user name')
print(statement)
result = session.execute(statement).scalars().all()
for item in result:
    print(to_dict(item))

SELECT users.id, users.name, users.surname, users.email, users.lastchange, users."externalId" 
FROM users 
WHERE users.name = :name_1
{'id': 13, 'name': 'user name', 'surname': None, 'email': None, 'lastchange': datetime.datetime(2022, 4, 5, 19, 12, 52, 215042), 'externalId': None}
{'id': 14, 'name': 'user name', 'surname': None, 'email': None, 'lastchange': datetime.datetime(2022, 4, 5, 19, 13, 33, 564900), 'externalId': None}
{'id': 15, 'name': 'user name', 'surname': None, 'email': None, 'lastchange': datetime.datetime(2022, 4, 5, 19, 13, 40, 715204), 'externalId': None}


In [15]:
statement = select(UserModel).filter_by(name='user name')
print(statement)

SELECT users.id, users.name, users.surname, users.email, users.lastchange, users."externalId" 
FROM users 
WHERE users.name = :name_1


## Test

Následující segment kódu vloží do tabulky řadu záznamů.

In [17]:
import random
import string

def get_random_string(length):
    letters = string.ascii_lowercase
    result = ''.join(random.choice(letters) for i in range(length))
    return result 

def randomUser():
    surNames = [
        'Novák', 'Nováková', 'Svobodová', 'Svoboda', 'Novotná',
        'Novotný', 'Dvořáková', 'Dvořák', 'Černá', 'Černý', 
        'Procházková', 'Procházka', 'Kučerová', 'Kučera', 'Veselá',
        'Veselý', 'Horáková', 'Krejčí', 'Horák', 'Němcová', 
        'Marková', 'Němec', 'Pokorná', 'Pospíšilová','Marek'
    ]

    names = [
        'Jiří', 'Jan', 'Petr', 'Jana', 'Marie', 'Josef',
        'Pavel', 'Martin', 'Tomáš', 'Jaroslav', 'Eva',
        'Miroslav', 'Hana', 'Anna', 'Zdeněk', 'Václav',
        'Michal', 'František', 'Lenka', 'Kateřina',
        'Lucie', 'Jakub', 'Milan', 'Věra', 'Alena'
    ]

    name1 = random.choice(names)
    name2 = random.choice(names)
    name3 = random.choice(surNames)
    return {'name': f'{name1} {name2}', 'surname': f'{name3}'}

def PopulateUsers(count=10):
    for i in range(count):
        userNames = randomUser()
        crudUserCreate(db=session, user=UserModel(**userNames))
        
session = SessionMaker()
PopulateUsers(10)

Následující část kódu využívá funkci `crudUserGetAll` definovanou výše pro extrakci dat z databáze.

In [18]:
usersData = list(crudUserGetAll(db=session))
for index, userRow in enumerate(usersData):
    row = crudUserGet(db=session, id=userRow.id)
    print(index, '\t', row.id, row.name)

0 	 1 Václav Lucie Krejčí
1 	 2 Martin Tomáš Kučerová
2 	 3 Jan Lucie Dvořáková
3 	 4 Petr Lenka Marková
4 	 5 Kateřina Jakub Novotná
5 	 6 Anna František Černý
6 	 7 Josef Pavel Kučera
7 	 8 Michal Věra Dvořáková
8 	 9 Václav Jana Novák
9 	 10 Lenka Tomáš Svobodová
10 	 11 Petr Novak
11 	 12 John
12 	 13 user name
13 	 14 user name
14 	 15 user name
15 	 16 Jan Lucie
16 	 17 Lucie Hana
17 	 18 Milan Anna
18 	 19 Lenka Tomáš
19 	 20 Tomáš Anna
20 	 21 Jakub Václav
21 	 22 Jana Hana
22 	 23 Zdeněk Marie
23 	 24 Alena Miroslav
24 	 25 Zdeněk Jiří


## Session Scope

Pro práci se session (a nejen s ní) se v jazyku Python používají tzv scopes. Ty lze v kódu identifikovat pomocí klíčového slova `with`. Tento mechanismus je obecný a v případě databází má specifické použití.

Definice níže zabezpečuje, že v případě kdy dojde k neošetřené výjimce, provede se `rollback` a po opuštění statementu `with` se session automaticky uzavře.

In [19]:
from contextlib import contextmanager

@contextmanager
def prepareSession():
    """generator for creating db session encapsulated with try/except block and followed session.commit() / session.rollback()

    Returns
    -------
    generator
        contains just one item which is instance of Session (SQLAlchemy)
    """
    session = SessionMaker()
    try:
        yield session # session is ready
        session.commit() # with statement ends
    except:
        session.rollback() # an error during session use
        raise
    finally:
        session.close() # session should be always closed

Konkrétní využití 

In [20]:
with prepareSession() as session:
    for item in session.query(UserModel).all():
        print(item.id, item.name)

1 Václav Lucie Krejčí
2 Martin Tomáš Kučerová
3 Jan Lucie Dvořáková
4 Petr Lenka Marková
5 Kateřina Jakub Novotná
6 Anna František Černý
7 Josef Pavel Kučera
8 Michal Věra Dvořáková
9 Václav Jana Novák
10 Lenka Tomáš Svobodová
11 Petr Novak
12 John
13 user name
14 user name
15 user name
16 Jan Lucie
17 Lucie Hana
18 Milan Anna
19 Lenka Tomáš
20 Tomáš Anna
21 Jakub Václav
22 Jana Hana
23 Zdeněk Marie
24 Alena Miroslav
25 Zdeněk Jiří


## Asynchronní dotazy

Implementace asynchronních metod umožňuje v případě, kdy se "čeká" na dokončení operace (typicky realizované přes síťové rozhraní), přepnout na provádění jiného kódu (preeptivní multitasking). 

Databázová operace je typickou možností, kde asynchronní kód dává velký smysl. S jeho pomocí může dojít k významnému zvýšení výkonu při obsluze více uživatelů a ve specifických případech i při obsluze jednoho uživatele.

K asynchronní realizaci je ovšem potřeba použít specifické knihovny (nebo jejich části). SQLAlchemy obsahuje prvky pro práci s asynchronním přístupem.

In [25]:
!pip install asyncpg

Collecting asyncpg
  Downloading asyncpg-0.25.0-cp39-cp39-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_12_x86_64.manylinux2010_x86_64.whl (2.8 MB)
     |████████████████████████████████| 2.8 MB 3.5 MB/s            
[?25hInstalling collected packages: asyncpg
Successfully installed asyncpg-0.25.0


Knihovna `asyncpg` umožňuje zpracovat connection string uvedený níže, který reprezentuje asynchronní připojení k serveru.

In [26]:
connectionstring = "postgresql+asyncpg://postgres:example@postgres/newdatabase"

In [27]:
from sqlalchemy.ext.asyncio import AsyncSession
from sqlalchemy.ext.asyncio import create_async_engine

Srovnejte definici asynchronního a synchronního engine.

In [28]:
#engine = create_engine('sqlite:///:memory:', echo=True)
#engine = create_engine('postgresql+psycopg2://user:password@hostname/database_name')

In [29]:
asyncEngine = create_async_engine(connectionstring) 

SQLAlchemy disponuje možností "obalit" synchronní kód.

In [30]:
async with asyncEngine.begin() as conn:
    #await conn.run_sync(BaseModel.metadata.drop_all)
    await conn.run_sync(BaseModel.metadata.create_all)

In [31]:
async_sessionMaker = sessionmaker(
        asyncEngine, expire_on_commit=False, class_=AsyncSession
    )