# SQLAlchemy Asynchronní

## Notebook support

In [1]:
!pip install asyncpg



SQLAlchemy je knihovnou / frameworkem, který umožňuje odstínit konkrétní typ databázového serveru. Díky této knihovně IT specialista modeluje datové entity bez ohledu na konkrétní úložiště. Podobných knihoven existuje celá řada, ale SQLAlchemy je pravděpodobně nejpoužívanější.

Z hlediska modelování datových struktur existují dva základní přístupy:
- Database First
- Code First

Database First je způsob, kdy vznikají popisy přímo v databázi. Alternativně lze existující databázi vzít jako základ a dále ji rozšiřovat. Toto souvisí s tzv. migracemi, které mají specifický význam při upgrade informačního systému.

Code First předpokládá, že popis datových struktur je definován kódem a z tohoto kódu je následně odvozena posloupnost příkazů, které musí být nad databází provedeny, aby vznikly tabulky s jejich strukturou a vzájemným propojením (Foreign Keys).

SQLAlchemy podporuje oba přístupy, lze tedy z existující databáze odvodit modely nebo na základě modelů vytvořit strukturu databáze.

https://github.com/LeeBergstrand/Jupyter-SQLAlchemy-Tutorial/blob/master/Jupyter-SQLAlchemy.ipynb

In [44]:
#https://docs.sqlalchemy.org/en/13/orm/tutorial.html
#https://docs.sqlalchemy.org/en/14/orm/basic_relationships.html
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy import Column, Integer, String, BigInteger, Sequence, Table, ForeignKey, DateTime
from sqlalchemy.orm import relationship

### Engine

Engine "Stroj" je prvek, přes který jsou posílány SQL příkazy na server. V případě, kdy dochází k prvotní inicializaci (instalace), je nutné detekovat a případně vytvořit databázi a její strukturu.

In [45]:
!pip install sqlalchemy_utils



Testování a prvotní vytvoření databáze pomocí `connectionstring`u, který představuje úplnou definici propojení se serverem. Connecion string obsahuje definici driveru, jména uživatele, heslo uživatele, jméno serveru (počítače, tzv. hostname) a jméno databáze.

In [46]:
from sqlalchemy_utils.functions import database_exists, create_database

connectionstring = 'postgresql+psycopg2://postgres:example@postgres/newdatabase'
if not database_exists(connectionstring):  #=> False
    try:
        create_database(connectionstring)
        doCreateAll = True
        print('Database created')
    except Exception as e:
        print('Database does not exists and cannot be created')
        raise
else:
    print('Database already exists')

Database already exists


In [47]:
from sqlalchemy import create_engine

#engine = create_engine('sqlite:///:memory:', echo=True)
#engine = create_engine('postgresql+psycopg2://user:password@hostname/database_name')

In [48]:
engine = create_engine(connectionstring) 

### Models

Modely prezentují struktury uložené v tabulkách. Představují tak proces transformace z výsledku dotazu do struktur jazyka Python a ze struktur jazyka do prvků SQL dotazů.

V SQLAlchemy je zebezpečeno provázání modelů (mimo jiné relace) pomocí dědičnosti, kdy existuje třída, ze které jsou odvozeny všechny modely. Jsou využity specifické funkce jazyka Python k tomu, aby při deklaraci modelů vznikl registr těchto modelů. Tento přístup umožňuje řešit specifické problémy. 

In [2]:
from sqlalchemy.ext.declarative import declarative_base

BaseModel = declarative_base()

`BaseModel` je třídou, která musí být použita při deklaraci modelů. Všimněte si, že tato třída je návratovou hodnotou funkce. Tuto třídu lze vytvořit různými způsoby, zde si ukazujeme nejčastěji používaný.

V následující části jsou deklarovány tři modely `UserModel`, `GroupModel` a `GroupTypeModel`. Protože mezi `UserModel` a `GroupModel` je relace M:N, je nutné mít zprostředkující tabulku a tedy i model. Tímto modelem je `UserGroupModel`, který není definovaný jako třída, ale je vytvořen pomocí funkce `Table`.

In [3]:
import datetime
from sqlalchemy import Column, String, BigInteger, Integer, DateTime, ForeignKey, Sequence, Table
from sqlalchemy.orm import relationship

unitedSequence = Sequence('all_id_seq')

UserGroupModel = Table('users_groups', BaseModel.metadata,
        Column('id', BigInteger, Sequence('all_id_seq'), primary_key=True),
        Column('user_id', ForeignKey('users.id'), primary_key=True),
        Column('group_id', ForeignKey('groups.id'), primary_key=True)
)

class UserModel(BaseModel):
    __tablename__ = 'users'
    
    id = Column(BigInteger, Sequence('all_id_seq'), primary_key=True)
    name = Column(String, comment='name of the user')
    surname = Column(String)
    email = Column(String, comment='company email for user')
    
    lastchange = Column(DateTime, default=datetime.datetime.now, comment='timestamp')
    externalId = Column(BigInteger, index=True)

    groups = relationship('GroupModel', secondary=UserGroupModel, back_populates='users')
        
class GroupModel(BaseModel):
    __tablename__ = 'groups'
    
    id = Column(BigInteger, Sequence('all_id_seq'), primary_key=True)
    name = Column(String)
    
    lastchange = Column(DateTime, default=datetime.datetime.now, comment='timestamp')
    entryYearId = Column(Integer)

    externalId = Column(String, index=True)

    grouptype_id = Column(ForeignKey('grouptypes.id'))
    grouptype = relationship('GroupTypeModel', back_populates='groups')

    users = relationship('UserModel', secondary=UserGroupModel, back_populates='groups')

class GroupTypeModel(BaseModel):
    __tablename__ = 'grouptypes'
    
    id = Column(BigInteger, Sequence('all_id_seq'), primary_key=True)
    name = Column(String)

    groups = relationship('GroupModel', back_populates='grouptype')

### Inicializace struktur v databázi

Existují dva základní přístupy, které jsou v praxi kombinovány. Jedná se o

- database first
- code first

V tomto případě využíváme přístup code first, kdy budoucí strukturu tabulek v databázi je definována třídami. Tato definice poslouží k vytvoření struktury databáze a jejich tabulek.

In [51]:
#BaseModel.metadata.drop_all(engine)
BaseModel.metadata.create_all(engine)

`drop_all` všechny tabulky odstraní. Pozor, není to prosté a destruktivní odstranění. Pokud dosud definovaná struktura (třídami) neodpovídá struktuře relací v databázi, může dojít k chybě.

`create_all` vytvoří všechny tabulky a relace mezi nimi.

## Asynchronní dotazy

Implementace asynchronních metod umožňuje v případě, kdy se "čeká" na dokončení operace (typicky realizované přes síťové rozhraní), přepnout na provádění jiného kódu (kooperativní multitasking). 

Databázová operace je typickou možností, kde asynchronní kód dává velký smysl. S jeho pomocí může dojít k významnému zvýšení výkonu při obsluze více uživatelů a ve specifických případech i při obsluze jednoho uživatele.

K asynchronní realizaci je ovšem potřeba použít specifické knihovny (nebo jejich části). SQLAlchemy obsahuje prvky pro práci s asynchronním přístupem.

In [20]:
!pip install asyncpg



Knihovna `asyncpg` umožňuje zpracovat connection string uvedený níže, který reprezentuje asynchronní připojení k serveru.

In [4]:
connectionstring = "postgresql+asyncpg://postgres:example@postgres/newdatabase"

In [5]:
from sqlalchemy.ext.asyncio import AsyncSession
from sqlalchemy.ext.asyncio import create_async_engine

Srovnejte definici asynchronního a synchronního engine.

In [6]:
#engine = create_engine('sqlite:///:memory:', echo=True)
#engine = create_engine('postgresql+psycopg2://user:password@hostname/database_name')

In [7]:
asyncEngine = create_async_engine(connectionstring, echo=True) 

SQLAlchemy disponuje možností "obalit" synchronní kód.

In [8]:
async with asyncEngine.begin() as conn:
    #await conn.run_sync(BaseModel.metadata.drop_all)
    await conn.run_sync(BaseModel.metadata.create_all)

2023-10-12 09:26:24,205 INFO sqlalchemy.engine.Engine select pg_catalog.version()
2023-10-12 09:26:24,206 INFO sqlalchemy.engine.Engine [raw sql] ()
2023-10-12 09:26:24,208 INFO sqlalchemy.engine.Engine select current_schema()
2023-10-12 09:26:24,209 INFO sqlalchemy.engine.Engine [raw sql] ()
2023-10-12 09:26:24,210 INFO sqlalchemy.engine.Engine show standard_conforming_strings
2023-10-12 09:26:24,211 INFO sqlalchemy.engine.Engine [raw sql] ()
2023-10-12 09:26:24,213 INFO sqlalchemy.engine.Engine BEGIN (implicit)
2023-10-12 09:26:24,214 INFO sqlalchemy.engine.Engine select relname from pg_class c join pg_namespace n on n.oid=c.relnamespace where pg_catalog.pg_table_is_visible(c.oid) and relname=%s
2023-10-12 09:26:24,214 INFO sqlalchemy.engine.Engine [generated in 0.00063s] ('users_groups',)
2023-10-12 09:26:24,217 INFO sqlalchemy.engine.Engine select relname from pg_class c join pg_namespace n on n.oid=c.relnamespace where pg_catalog.pg_table_is_visible(c.oid) and relname=%s
2023-10-1

In [10]:
from sqlalchemy.ext.asyncio import AsyncSession
from sqlalchemy.orm import sessionmaker

async_sessionMaker = sessionmaker(
        asyncEngine, expire_on_commit=False, class_=AsyncSession
    )

In [58]:
from faker import Faker
fake = Faker()

def randomUser():
    fullname = fake.name()
    names = fullname.split(' ')
    name = names[0]
    surname = names[1]
    result = {
        "name": name,
        "surname": surname,
        "email": f'{name.lower()}.{surname.lower()}@university.world'
    }
    return result

users = [randomUser() for i in range(10)]
users

[{'name': 'Erika',
  'surname': 'Franklin',
  'email': 'erika.franklin@university.world'},
 {'name': 'Michelle',
  'surname': 'Valdez',
  'email': 'michelle.valdez@university.world'},
 {'name': 'John', 'surname': 'Rice', 'email': 'john.rice@university.world'},
 {'name': 'Juan',
  'surname': 'Conner',
  'email': 'juan.conner@university.world'},
 {'name': 'Sara', 'surname': 'Clark', 'email': 'sara.clark@university.world'},
 {'name': 'Nicholas',
  'surname': 'Fuller',
  'email': 'nicholas.fuller@university.world'},
 {'name': 'Alexis',
  'surname': 'Harvey',
  'email': 'alexis.harvey@university.world'},
 {'name': 'Steven',
  'surname': 'Shaw',
  'email': 'steven.shaw@university.world'},
 {'name': 'Tina', 'surname': 'Reese', 'email': 'tina.reese@university.world'},
 {'name': 'Lance',
  'surname': 'Smith',
  'email': 'lance.smith@university.world'}]

In [12]:
from sqlalchemy.ext.asyncio import AsyncSession
from sqlalchemy.ext.asyncio import create_async_engine
from sqlalchemy.orm import sessionmaker

connectionstring = "postgresql+asyncpg://postgres:example@postgres/newdatabase"

asyncEngine = create_async_engine(connectionstring, echo=True) 
async_sessionMaker = sessionmaker(
        asyncEngine, expire_on_commit=False, class_=AsyncSession
    )

### CRUDs

In [13]:
from sqlalchemy import select, update, delete

async def crudGetAllUsers(async_sessionMaker):
    statement = select(UserModel)
    print(statement)
    async with async_sessionMaker() as session:
        rows = await session.execute(statement)
        rows = rows.scalars()
    return rows

rows = await crudGetAllUsers(async_sessionMaker)
for row in rows:
    print(row.id, row.name, row.surname, row.email, sep="\t")

SELECT users.id, users.name, users.surname, users.email, users.lastchange, users."externalId" 
FROM users
2023-10-12 09:27:56,138 INFO sqlalchemy.engine.Engine select pg_catalog.version()
2023-10-12 09:27:56,139 INFO sqlalchemy.engine.Engine [raw sql] ()
2023-10-12 09:27:56,140 INFO sqlalchemy.engine.Engine select current_schema()
2023-10-12 09:27:56,141 INFO sqlalchemy.engine.Engine [raw sql] ()
2023-10-12 09:27:56,142 INFO sqlalchemy.engine.Engine show standard_conforming_strings
2023-10-12 09:27:56,143 INFO sqlalchemy.engine.Engine [raw sql] ()
2023-10-12 09:27:56,144 INFO sqlalchemy.engine.Engine BEGIN (implicit)
2023-10-12 09:27:56,146 INFO sqlalchemy.engine.Engine SELECT users.id, users.name, users.surname, users.email, users.lastchange, users."externalId" 
FROM users
2023-10-12 09:27:56,147 INFO sqlalchemy.engine.Engine [generated in 0.00078s] ()
2023-10-12 09:27:56,150 INFO sqlalchemy.engine.Engine ROLLBACK
1	Cristina	Mcmahon	cristina.mcmahon@university.world
2	Anne	Jefferson	a

In [14]:
from sqlalchemy import select, update, delete

async def crudGetUser(async_sessionMaker, id):
    statement = select(UserModel).filter_by(id=id)
    print(statement)
    async with async_sessionMaker() as session:
        rows = await session.execute(statement)
        rows = rows.scalars()
    return rows
    
rows = await crudGetUser(async_sessionMaker, 1)
for row in rows:
    print(row.id, row.name, row.surname, row.email, sep="\t")

SELECT users.id, users.name, users.surname, users.email, users.lastchange, users."externalId" 
FROM users 
WHERE users.id = :id_1
2023-10-12 09:28:14,006 INFO sqlalchemy.engine.Engine BEGIN (implicit)
2023-10-12 09:28:14,009 INFO sqlalchemy.engine.Engine SELECT users.id, users.name, users.surname, users.email, users.lastchange, users."externalId" 
FROM users 
WHERE users.id = %s
2023-10-12 09:28:14,010 INFO sqlalchemy.engine.Engine [generated in 0.00093s] (1,)
2023-10-12 09:28:14,013 INFO sqlalchemy.engine.Engine ROLLBACK
1	Cristina	Mcmahon	cristina.mcmahon@university.world


In [15]:
async def crudCreateUser(async_sessionMaker, user):
    async with async_sessionMaker() as session:
        session.add(user)
        await session.commit()
    return user

row = await crudCreateUser(async_sessionMaker, UserModel(name="Josef", surname="Novak", email="josef.novak@university.world"))
print(row.id, row.name, row.surname, row.email, sep="\t")

2023-10-12 09:28:46,817 INFO sqlalchemy.engine.Engine BEGIN (implicit)
2023-10-12 09:28:46,819 INFO sqlalchemy.engine.Engine INSERT INTO users (id, name, surname, email, lastchange, "externalId") VALUES (nextval('all_id_seq'), %s, %s, %s, %s, %s) RETURNING users.id
2023-10-12 09:28:46,820 INFO sqlalchemy.engine.Engine [generated in 0.00090s] ('Josef', 'Novak', 'josef.novak@university.world', datetime.datetime(2023, 10, 12, 9, 28, 46, 819441), None)
2023-10-12 09:28:46,822 INFO sqlalchemy.engine.Engine COMMIT
14	Josef	Novak	josef.novak@university.world


In [16]:
from sqlalchemy import select, update, delete

async def crudUpdateUser(async_sessionMaker, user):
    statement = update(UserModel).filter_by(id=user.id).values(name=user.name, surname=user.surname, email=user.email)
    print(statement)
    async with async_sessionMaker() as session:
        rows = await session.execute(statement)
        await session.commit()
        #rows = rows.scalars()
    #return rows
        
row = await crudUpdateUser(async_sessionMaker, UserModel(id=12, name="Jan", surname="Novak", email="josef.novak@university.world"))
rows = await crudGetUser(async_sessionMaker, 12)
row = next(rows, None)
print(row.id, row.name, row.surname, row.email, sep="\t")    

UPDATE users SET name=:name, surname=:surname, email=:email WHERE users.id = :id_1
2023-10-12 09:29:40,057 INFO sqlalchemy.engine.Engine BEGIN (implicit)
2023-10-12 09:29:40,059 INFO sqlalchemy.engine.Engine UPDATE users SET name=%s, surname=%s, email=%s WHERE users.id = %s
2023-10-12 09:29:40,060 INFO sqlalchemy.engine.Engine [generated in 0.00074s] ('Jan', 'Novak', 'josef.novak@university.world', 12)
2023-10-12 09:29:40,062 INFO sqlalchemy.engine.Engine COMMIT
SELECT users.id, users.name, users.surname, users.email, users.lastchange, users."externalId" 
FROM users 
WHERE users.id = :id_1
2023-10-12 09:29:40,071 INFO sqlalchemy.engine.Engine BEGIN (implicit)
2023-10-12 09:29:40,072 INFO sqlalchemy.engine.Engine SELECT users.id, users.name, users.surname, users.email, users.lastchange, users."externalId" 
FROM users 
WHERE users.id = %s
2023-10-12 09:29:40,073 INFO sqlalchemy.engine.Engine [cached since 86.35s ago] (12,)
2023-10-12 09:29:40,075 INFO sqlalchemy.engine.Engine ROLLBACK
12