## Подключение к SQL-базе данных



#### Использование SQLite

SQLite — это встроенная база данных, которая не требует установки и удобна для небольших проектов.

1. Установите SQLite (обычно поставляется с Python):

   ```bash
   pip install sqlite3
   ```

2. Подключение к базе данных:

   ```python
   import sqlite3

   # Подключение к базе данных (создаст файл, если его нет)
   connection = sqlite3.connect("example.db")

   # Создание курсора для выполнения SQL-запросов
   cursor = connection.cursor()

   # Создание таблицы
   cursor.execute("""
   CREATE TABLE IF NOT EXISTS users (
       id INTEGER PRIMARY KEY AUTOINCREMENT,
       name TEXT NOT NULL,
       age INTEGER
   )
   """)

   # Добавление данных
   cursor.execute("INSERT INTO users (name, age) VALUES (?, ?)", ("Alice", 25))
   connection.commit()

   # Чтение данных
   cursor.execute("SELECT * FROM users")
   rows = cursor.fetchall()
   for row in rows:
       print(row)

   # Закрытие соединения
   connection.close()
   ```

#### Использование PostgreSQL

PostgreSQL — мощная реляционная база данных.

1. Установите библиотеку для Python:

   ```bash
   pip install psycopg2
   ```

2. Подключение к базе данных:

   ```python
   import psycopg2

   # Подключение к PostgreSQL
   connection = psycopg2.connect(
       dbname="your_database",
       user="your_user",
       password="your_password",
       host="localhost",
       port=5432
   )

   cursor = connection.cursor()

   # Создание таблицы
   cursor.execute("""
   CREATE TABLE IF NOT EXISTS employees (
       id SERIAL PRIMARY KEY,
       name VARCHAR(100),
       position VARCHAR(100),
       salary NUMERIC
   )
   """)

   # Добавление данных
   cursor.execute("INSERT INTO employees (name, position, salary) VALUES (%s, %s, %s)",
                  ("John Doe", "Manager", 50000))
   connection.commit()

   # Чтение данных
   cursor.execute("SELECT * FROM employees")
   for row in cursor.fetchall():
       print(row)

   # Закрытие соединения
   cursor.close()
   connection.close()
   ```

### Зачем нужен коннектор?

**Коннектор** — это инструмент, который обеспечивает взаимодействие Python-приложения с базой данных. Он выполняет следующие функции:

1. **Управление соединением**:
   - Коннектор устанавливает физическое соединение с базой данных через сетевые протоколы (например, TCP/IP для PostgreSQL или Unix-сокеты для SQLite).

2. **Отправка и получение данных**:
   - Он форматирует запросы Python в понятный для БД формат (SQL) и возвращает результаты.

3. **Контроль транзакций**:
   - Коннектор управляет транзакциями, позволяя группировать несколько операций в одну (например, `commit` или `rollback`).

4. **Пул соединений**:
   - Для оптимизации работы коннектор может использовать пул соединений, уменьшая накладные расходы на установку соединений.

#### Проблемы при работе с коннекторами

1. **Ограничение количества соединений**:
   - Большинство баз данных ограничивают количество одновременно открытых соединений. Если не управлять соединениями, это может привести к исчерпанию доступных ресурсов. Если забыть закрыть соединение (`connection.close()`), оно продолжит занимать ресурсы БД.

2. **Проблемы многопоточности**:
   - Одно соединение не может использоваться одновременно в нескольких потоках, так как это приведёт к конфликтам.

### Зачем нужен курсор?

**Курсор** — это объект, который используется для выполнения SQL-запросов и обработки их результатов. Он создаётся через объект соединения.

1. **Выполнение SQL-запросов**:
   - Курсор используется для выполнения операций с БД (например, `SELECT`, `INSERT`, `UPDATE`).

2. **Буферизация данных**:
   - Курсор буферизует данные, полученные от БД, и позволяет обрабатывать их порционно.

3. **Транзакционное управление**:
   - Курсоры привязаны к соединению, что позволяет им работать в рамках одной транзакции.

#### Проблемы с курсорами

1. **Неявное открытие транзакций**:
   - Многие драйверы автоматически открывают транзакцию при создании курсора. Если не выполнить `commit`, изменения не будут сохранены.

2. **Утечка ресурсов**:
   - Незакрытые курсоры продолжают занимать ресурсы в БД. Это особенно критично для высоконагруженных систем.

3. **Необработанные исключения**:
   - Если исключение возникло при работе с курсором, это может оставить соединение в неконсистентном состоянии.

**Решение**: Использовать контекстные менеджеры (`with`).

```python
with sqlite3.connect("example.db") as connection:
    with connection.cursor() as cursor:
        cursor.execute("SELECT * FROM users")
        rows = cursor.fetchall()
        for row in rows:
            print(row)
```

### Асинхронность в работе с базами данных

1. **Блокирующие операции**:
   - Операции с БД (например, чтение или запись) могут занимать значительное время, что блокирует основной поток выполнения.

2. **Обслуживание множества пользователей**:
   - В асинхронных приложениях (например, FastAPI) одновременное выполнение операций критично для производительности.

#### Библиотеки для асинхронной работы с БД

1. **aiosqlite**:
     ```python
     import aiosqlite

     async def main():
         async with aiosqlite.connect("example.db") as connection:
             async with connection.execute("SELECT * FROM users") as cursor:
                 async for row in cursor:
                     print(row)
     ```

2. **asyncpg**:
     ```python
     import asyncpg
     import asyncio

     async def main():
         connection = await asyncpg.connect(
             user="your_user", password="your_password",
             database="your_database", host="127.0.0.1"
         )

         rows = await connection.fetch("SELECT * FROM employees")
         for row in rows:
             print(row)

         await connection.close()

     asyncio.run(main())
     ```

#### Потенциальные проблемы с асинхронностью

1. **Ограничение библиотек**:
   - Некоторые популярные драйверы (например, psycopg2) не поддерживают асинхронность.

2. **Сложность отладки**:
   - Асинхронный код сложнее дебажить, особенно при неправильной работе транзакций.

3. **Синхронизация с пулом соединений**:
   - При асинхронной работе с БД важно правильно настраивать пул соединений, чтобы избежать конфликтов.

### SQL-инъекции
   - Использование неподготовленных SQL-запросов:
     ```python
     cursor.execute(f"SELECT * FROM users WHERE name = '{user_input}'")
     ```
   - Решение: используйте параметры.
     ```python
     cursor.execute("SELECT * FROM users WHERE name = ?", (user_input,))
     ```

In [None]:
import sqlite3

# Establish connection
connection = sqlite3.connect("example.db")
cursor = connection.cursor()

try:
    cursor.execute("SELECT 1 FROM users LIMIT 1")
except sqlite3.OperationalError:
    print("Table 'users' does not exist. Creating it...")
    cursor.execute("""
        CREATE TABLE users (
            id INTEGER PRIMARY KEY AUTOINCREMENT,
            name TEXT NOT NULL
        )
    """)
    connection.commit()
    print("Table 'users' created successfully.")

try:
    cursor.execute("INSERT INTO users (name) VALUES (?)", ("Alice",)) # Use ? placeholder and tuple
    connection.commit()
    print("User 'Alice' inserted successfully.")
except sqlite3.IntegrityError:
    print("Error inserting user (likely a duplicate).")

# Execute the query
cursor.execute("SELECT * FROM users")

# Fetch results
rows = cursor.fetchall()
for row in rows:
    print(row)

# Close cursor and connection
cursor.close()
connection.close()

Table 'users' does not exist. Creating it...
Table 'users' created successfully.
User 'Alice' inserted successfully.
(1, 'Alice')


## Примеры ошибок при асинхронной работе с базами данных



#### 1. **Неправильное управление соединениями**

Если соединения с базой данных неправильно закрываются или используются повторно в разных корутинах, это может привести к **утечке соединений** или непредсказуемому поведению.

#### Пример:
```python
import asyncpg
import asyncio

# Создаем глобальное соединение
connection = None

async def fetch_data():
    global connection
    # Используем одно соединение в двух местах
    result = await connection.fetch("SELECT * FROM users")
    return result

async def main():
    global connection
    connection = await asyncpg.connect(user="user", password="password", database="test_db", host="127.0.0.1")

    tasks = [fetch_data() for _ in range(100)]  # Одновременный доступ из 100 корутин
    await asyncio.gather(*tasks)

    await connection.close()

asyncio.run(main())
```

#### Ошибка:
- **`asyncpg.InterfaceError`**: "Cannot perform operation: another operation is in progress."
- Это происходит, потому что одно соединение не может использоваться одновременно в нескольких корутинах.

#### Решение:
Используйте пул соединений для управления множественными запросами:
```python
async def main():
    pool = await asyncpg.create_pool(user="user", password="password", database="test_db", host="127.0.0.1")

    async with pool.acquire() as connection:
        tasks = [connection.fetch("SELECT * FROM users") for _ in range(100)]
        await asyncio.gather(*tasks)

    await pool.close()

asyncio.run(main())
```

#### 2. **Проблемы с транзакциями**

Если транзакции не завершаются корректно, они могут блокировать таблицы, приводя к **Deadlock** или зависанию запросов.

#### Пример:
```python
async def insert_data(connection):
    async with connection.transaction():
        await connection.execute("INSERT INTO users (name) VALUES ($1)", "Alice")
        # Пропускаем commit/rollback, если возникает ошибка ниже
        raise Exception("Unexpected error!")

async def main():
    pool = await asyncpg.create_pool(user="user", password="password", database="test_db", host="127.0.0.1")

    async with pool.acquire() as connection:
        try:
            await insert_data(connection)
        except Exception as e:
            print(f"Error: {e}")
            # Транзакция остается незавершенной

    await pool.close()

asyncio.run(main())
```

#### Ошибка:
- **`asyncpg.exceptions.InFailedSQLTransaction`**: "Current transaction is aborted, commands ignored until end of transaction block."
- Это происходит из-за незавершенной транзакции.

#### Решение:
Транзакции должны корректно завершаться через `commit` или `rollback`. Используйте `try`-`except` внутри блока транзакции:
```python
async def insert_data(connection):
    try:
        async with connection.transaction():
            await connection.execute("INSERT INTO users (name) VALUES ($1)", "Alice")
    except Exception as e:
        print(f"Error during transaction: {e}")
```

#### 3. **Отсутствие ограничения числа соединений (pool starvation)**

Если пул соединений исчерпан, новые запросы будут ожидать освобождения соединения, что может привести к "зависанию" приложения.

#### Пример:
```python
async def fetch_data(pool):
    async with pool.acquire() as connection:
        await connection.fetch("SELECT pg_sleep(5);")  # Симуляция долгого запроса

async def main():
    pool = await asyncpg.create_pool(user="user", password="password", database="test_db", host="127.0.0.1", max_size=5)

    # 10 задач, а пул ограничен 5 соединениями
    tasks = [fetch_data(pool) for _ in range(10)]
    await asyncio.gather(*tasks)

    await pool.close()

asyncio.run(main())
```

#### Решение:
- Увеличьте размер пула соединений.
- Оптимизируйте количество одновременно работающих корутин:

```python
async def main():
    pool = await asyncpg.create_pool(user="user", password="password", database="test_db", host="127.0.0.1", max_size=5)

    # Используем семафор для ограничения числа одновременных задач
    semaphore = asyncio.Semaphore(5)

    async def fetch_with_limit():
        async with semaphore:
            await fetch_data(pool)

    tasks = [fetch_with_limit() for _ in range(10)]
    await asyncio.gather(*tasks)

    await pool.close()

asyncio.run(main())
```

#### 4. **Ошибки при частичной обработке курсоров**

Некоторые асинхронные библиотеки возвращают курсоры или итераторы, которые нужно полностью обработать. Неправильное завершение может заблокировать соединение.

#### Пример:
```python
async def fetch_partial(pool):
    async with pool.acquire() as connection:
        cursor = await connection.cursor("SELECT * FROM users")
        rows = await cursor.fetchmany(5)  # Получаем только 5 строк
        print(rows)
        # Не закрываем курсор!

async def main():
    pool = await asyncpg.create_pool(user="user", password="password", database="test_db", host="127.0.0.1")
    await fetch_partial(pool)
    await pool.close()

asyncio.run(main())
```

#### Решение:
Всегда закрывайте курсоры явно или используйте их в контекстных менеджерах:
```python
async def fetch_partial(pool):
    async with pool.acquire() as connection:
        async with connection.transaction():
            async for row in connection.cursor("SELECT * FROM users"):
                print(row)
```

### Пул соединений

Пул соединений позволяет повторно использовать открытые соединения с базой данных. Это сокращает время, затрачиваемое на установку соединения, и снижает нагрузку на сервер базы данных.

#### Пример реализации пула в `SQLAlchemy`

```python
from sqlalchemy import create_engine, text
from sqlalchemy.orm import sessionmaker

# Создаем пул соединений с ограничением размера
engine = create_engine(
    "postgresql://user:password@localhost/test_db",
    pool_size=5,  # Максимальное количество соединений
    max_overflow=10,  # Дополнительные соединения, создаваемые при перегрузке пула
    pool_timeout=30  # Таймаут ожидания свободного соединения
)

Session = sessionmaker(bind=engine)

# Использование пула соединений
with Session() as session:
    result = session.execute(text("SELECT * FROM users"))
    for row in result:
        print(row)
```

#### Когда это полезно?
- При высоконагруженных системах, где множество запросов обрабатываются одновременно.
- Для асинхронных приложений пул соединений особенно важен (например, в `asyncpg`).

### Использование индексов

Индексы ускоряют операции поиска в больших таблицах. Их можно создавать с помощью SQL-запросов или ORM.

Пример индексов в `SQLAlchemy`:

```python
from sqlalchemy import Column, Integer, String, Index, create_engine, MetaData
from sqlalchemy.ext.declarative import declarative_base

Base = declarative_base()

class User(Base):
    __tablename__ = 'users'

    id = Column(Integer, primary_key=True)
    name = Column(String, index=True)  # Индекс для столбца "name"

    __table_args__ = (
        Index('ix_users_name_age', 'name', 'age'),  # Составной индекс
    )
```

#### Когда это полезно?
- При работе с таблицами, содержащими миллионы строк, где требуется быстро находить данные по ключу.


### Логирование SQL-запросов

Включение логирования в SQLAlchemy:

```python
import logging
logging.basicConfig()
logging.getLogger('sqlalchemy.engine').setLevel(logging.INFO)

engine = create_engine("postgresql://user:password@localhost/test_db")
```

При выполнении запросов они будут выводиться в консоль:
```plaintext
INFO sqlalchemy.engine.Engine SELECT * FROM users
```


### Параллельная обработка запросов

Для сложных вычислений или работы с большими объёмами данных можно разделять запросы на несколько потоков или процессов.

#### Пример: использование `concurrent.futures`

```python
from concurrent.futures import ThreadPoolExecutor
import psycopg2

def fetch_data(user_id):
    connection = psycopg2.connect(user="user", password="password", database="test_db", host="127.0.0.1")
    cursor = connection.cursor()
    cursor.execute("SELECT * FROM users WHERE id = %s", (user_id,))
    result = cursor.fetchone()
    connection.close()
    return result

with ThreadPoolExecutor() as executor:
    results = executor.map(fetch_data, range(1, 101))
    for result in results:
        print(result)
```

## ORM (Object-Relational Mapping)


**ORM (Object-Relational Mapping)** — это подход к работе с реляционными базами данных, при котором данные из таблиц преобразуются в объекты языка программирования, и наоборот. Это позволяет взаимодействовать с базой данных через объектно-ориентированный код, а не с использованием SQL-запросов.

ORM делает работу с базами данных более интуитивной и удобной, но также имеет свои ограничения и особенности, которые важно учитывать.


### 1. Что такое ORM?

**Классический подход**:
- При работе напрямую с базой данных программисты пишут SQL-запросы для выполнения операций, таких как `SELECT`, `INSERT`, `UPDATE`, `DELETE`.
  
**Подход ORM**:
- ORM предоставляет интерфейс, где разработчик работает с таблицами базы данных как с объектами.

#### Пример без ORM

```python
import sqlite3

connection = sqlite3.connect("example.db")
cursor = connection.cursor()

cursor.execute("INSERT INTO users (name, age) VALUES (?, ?)", ("Alice", 25))
connection.commit()

cursor.execute("SELECT * FROM users")
rows = cursor.fetchall()
for row in rows:
    print(row)

connection.close()
```

#### Пример с ORM (SQLAlchemy)

```python
from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker

Base = declarative_base()

class User(Base):
    __tablename__ = 'users'
    id = Column(Integer, primary_key=True)
    name = Column(String)
    age = Column(Integer)

engine = create_engine("sqlite:///example.db")
Base.metadata.create_all(engine)

Session = sessionmaker(bind=engine)
session = Session()

new_user = User(name="Alice", age=25)
session.add(new_user)
session.commit()

for user in session.query(User).all():
    print(user.name, user.age)
```

### 2. Плюсы ORM

#### 2.1. Простота и читаемость кода
- ORM позволяет работать с данными в виде объектов, что упрощает код и делает его более понятным.
- Пример:
  ```python
  user = session.query(User).filter(User.id == 1).first()
  user.name = "Bob"
  session.commit()
  ```
  Вместо ручного написания SQL-запросов:
  ```sql
  UPDATE users SET name = 'Bob' WHERE id = 1;
  ```

#### 2.2. Абстракция SQL
- ORM скрывает сложность SQL-запросов, позволяя сосредоточиться на бизнес-логике.
- Например:
  ```python
  session.query(User).filter(User.age > 18).all()
  ```
  автоматически генерирует SQL-запрос:
  ```sql
  SELECT * FROM users WHERE age > 18;
  ```

#### 2.3. Поддержка кросс-баз данных
- ORM часто поддерживают несколько СУБД (например, SQLite, PostgreSQL, MySQL). Вы можете переключиться с одной базы данных на другую, изменив строку подключения.
- Это полезно для тестирования: можно использовать SQLite для локальной разработки и PostgreSQL в продакшене.

#### 2.4. Управление связями между таблицами
- ORM упрощает работу с отношениями (1-к-1, 1-ко-многим, многие-ко-многим).
- Пример (отношение 1-ко-многим):
  ```python
  class Post(Base):
      __tablename__ = 'posts'
      id = Column(Integer, primary_key=True)
      title = Column(String)
      user_id = Column(Integer, ForeignKey('users.id'))
      user = relationship("User", back_populates="posts")

  class User(Base):
      __tablename__ = 'users'
      id = Column(Integer, primary_key=True)
      name = Column(String)
      posts = relationship("Post", back_populates="user")
  ```

#### 2.5. Интеграция с другими инструментами
- ORM, такие как SQLAlchemy, поддерживают миграции через Alembic, пул соединений, асинхронную работу и другие продвинутые функции.


### 3. Минусы ORM

#### 3.1. Потеря производительности
- ORM добавляет накладные расходы из-за необходимости преобразования объектов в SQL и обратно.
- Для сложных запросов ORM может быть менее эффективным, чем оптимизированный SQL-запрос.

**Пример проблемы**:
```python
session.query(User).filter(User.name.like('%Alice%')).all()
```
Этот запрос может генерировать неоптимальный SQL, например:
```sql
SELECT * FROM users WHERE name LIKE '%Alice%';
```

**Решение**: Для сложных запросов можно использовать "сырой SQL":
```python
session.execute("SELECT * FROM users WHERE name LIKE '%Alice%'")
```

#### 3.2. Ограничения при сложных запросах
- ORM сложно использовать для выполнения некоторых специфических запросов (например, аналитических запросов, работы с временными таблицами).

**Пример**:
Попытка выполнить сложную агрегацию:
```python
SELECT department, COUNT(*)
FROM employees
GROUP BY department
HAVING COUNT(*) > 5;
```

Для подобных запросов лучше использовать сырой SQL.

#### 3.3. Абстракция может скрывать ошибки
- Из-за автоматизации ORM разработчик может не заметить неэффективные запросы.
- Например, "N+1 проблема" возникает, когда вместо одного запроса ORM выполняет множество запросов для выборки связанных данных.

**Пример** (неоптимальный запрос):
```python
for user in session.query(User).all():
    print(user.posts)
```
Генерирует N запросов:
```sql
SELECT * FROM users;
SELECT * FROM posts WHERE user_id = 1;
SELECT * FROM posts WHERE user_id = 2;
...
```

**Решение**: Используйте `joinedload`:
```python
from sqlalchemy.orm import joinedload
users = session.query(User).options(joinedload(User.posts)).all()
```

#### 3.4. Сложность отладки
- Генерируемый SQL-запрос может быть сложным для понимания, особенно при использовании сложных ORM-функций.

#### 3.5. Обучение и кривая освоения
- Для начинающих разработчиков ORM может быть сложным инструментом из-за необходимости изучения баз данных и специфики ORM (например, связей, ленивой загрузки).


### 4. Когда стоит использовать ORM?

#### Подходит:
1. **Простые CRUD-операции**:
   - Если большая часть операций состоит из создания, чтения, обновления и удаления записей, ORM идеально подходит.
2. **Поддержка отношений**:
   - Если нужно работать с связанными таблицами, ORM упрощает процесс.
3. **Быстрое прототипирование**:
   - ORM ускоряет разработку, позволяя сосредоточиться на логике приложения.

#### Не подходит:
1. **Сложные запросы**:
   - Для аналитических задач, агрегации и оптимизации сложных запросов лучше использовать сырой SQL.
2. **Высоконагруженные системы**:
   - В системах с большими объёмами данных SQL-запросы часто более производительны.
3. **Специфичные для СУБД функции**:
   - Если нужно использовать функции, специфичные для конкретной базы данных (например, полнотекстовый поиск в PostgreSQL), ORM может ограничивать вас.


## N+1 Problem

**N+1 проблема** — это распространённая проблема производительности, возникающая при работе с ORM, когда вместо одного SQL-запроса для выборки связанных данных ORM выполняет N дополнительных запросов для каждого объекта. Это приводит к значительным задержкам при работе с большими объёмами данных.

1. **Ожидаемое поведение**:
   ORM должен выполнять **один запрос**, чтобы извлечь данные и их связи (например, через `JOIN`).

2. **Что происходит на самом деле**:
   ORM сначала выполняет **один запрос**, чтобы извлечь основную таблицу, а затем выполняет дополнительные запросы (N запросов), чтобы получить связанные данные для каждого объекта.

#### Пример структуры данных

Допустим, у нас есть две таблицы:
1. **users** — хранит данные о пользователях.
2. **posts** — хранит публикации, связанные с пользователями (отношение "один ко многим").

```sql
CREATE TABLE users (
    id SERIAL PRIMARY KEY,
    name VARCHAR(100)
);

CREATE TABLE posts (
    id SERIAL PRIMARY KEY,
    title VARCHAR(100),
    user_id INTEGER REFERENCES users(id)
);

-- Данные
INSERT INTO users (name) VALUES ('Alice'), ('Bob');
INSERT INTO posts (title, user_id) VALUES ('Post 1', 1), ('Post 2', 1), ('Post 3', 2);
```

### Демонстрация проблемы N+1

#### Код с N+1 проблемой

Используем SQLAlchemy для взаимодействия с базой данных:

```python
from sqlalchemy import create_engine, Column, Integer, String, ForeignKey
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import relationship, sessionmaker

Base = declarative_base()

# Модели
class User(Base):
    __tablename__ = 'users'
    id = Column(Integer, primary_key=True)
    name = Column(String)
    posts = relationship("Post", back_populates="user")

class Post(Base):
    __tablename__ = 'posts'
    id = Column(Integer, primary_key=True)
    title = Column(String)
    user_id = Column(Integer, ForeignKey('users.id'))
    user = relationship("User", back_populates="posts")

# Настройка базы данных
engine = create_engine("sqlite:///example.db")
Base.metadata.create_all(engine)
Session = sessionmaker(bind=engine)
session = Session()

# Добавление данных
if not session.query(User).first():
    user1 = User(name="Alice", posts=[Post(title="Post 1"), Post(title="Post 2")])
    user2 = User(name="Bob", posts=[Post(title="Post 3")])
    session.add_all([user1, user2])
    session.commit()

# N+1 проблема
users = session.query(User).all()
for user in users:
    print(f"User: {user.name}")
    for post in user.posts:  # Каждый раз делает отдельный запрос для постов
        print(f"  Post: {post.title}")
```

#### Что происходит в запросах?

1. **Первый запрос**:
   ```sql
   SELECT * FROM users;
   ```

2. **Два дополнительных запроса (по количеству пользователей)**:
   ```sql
   SELECT * FROM posts WHERE user_id = 1;
   SELECT * FROM posts WHERE user_id = 2;
   ```

**Итого: 1 + N запросов.**

### Логирование SQL-запросов

```python
import logging
logging.basicConfig()
logging.getLogger('sqlalchemy.engine').setLevel(logging.INFO)
```

### Исправление N+1 проблемы

#### Использование `joinedload`

Решение проблемы — это загрузка связанных данных заранее (т.н. **жадная загрузка**, eager loading). В SQLAlchemy для этого используется `joinedload`.

```python
from sqlalchemy.orm import joinedload

# Устранение N+1 проблемы
users = session.query(User).options(joinedload(User.posts)).all()
for user in users:
    print(f"User: {user.name}")
    for post in user.posts:  # Посты уже загружены, дополнительных запросов нет
        print(f"  Post: {post.title}")
```

#### Что происходит в запросах?

- ORM выполняет один SQL-запрос с `JOIN` для извлечения пользователей и их постов:
  ```sql
  SELECT users.id, users.name, posts.id, posts.title, posts.user_id
  FROM users
  LEFT OUTER JOIN posts ON users.id = posts.user_id;
  ```

#### Использование `subqueryload`

Альтернативный способ — использование `subqueryload`, когда связанные данные загружаются подзапросом.

```python
from sqlalchemy.orm import subqueryload

# Устранение N+1 проблемы
users = session.query(User).options(subqueryload(User.posts)).all()
for user in users:
    print(f"User: {user.name}")
    for post in user.posts:
        print(f"  Post: {post.title}")
```

**Генерируемые запросы:**

1. Основной запрос для получения пользователей:
   ```sql
   SELECT * FROM users;
   ```

2. Второй запрос для получения всех постов (один раз для всех пользователей):
   ```sql
   SELECT * FROM posts WHERE user_id IN (1, 2);
   ```

**Итого: 2 запроса вместо N+1.**

### Производительность

Для убедительности можно измерить время выполнения запросов в двух вариантах:
1. С N+1 проблемой.
2. С использованием `joinedload` или `subqueryload`.

```python
import time

# С N+1 проблемой
start = time.time()
users = session.query(User).all()
for user in users:
    for post in user.posts:
        pass
end = time.time()
print(f"Time with N+1: {end - start} seconds")

# С использованием joinedload
start = time.time()
users = session.query(User).options(joinedload(User.posts)).all()
for user in users:
    for post in user.posts:
        pass
end = time.time()
print(f"Time with joinedload: {end - start} seconds")
```

### Сравнение подходов

| Подход           | Количество запросов | Производительность | Применение                       |
|-------------------|---------------------|--------------------|----------------------------------|
| **Без оптимизации** (N+1) | 1 + N               | Низкая             | Не рекомендуется               |
| **joinedload**    | 1                   | Высокая            | Для связанных данных            |
| **subqueryload**  | 2                   | Средняя            | При сложных связях              |


## Ссылки с лекции:

1. [SQL-инъекции для самых маленьких](https://habr.com/ru/articles/725134/)
2. [Всё, что вы не знали о CAP теореме](https://habr.com/ru/articles/328792/)
3. [Курс по SQLAlchemy и Alembic от Артёма Шумейко](https://github.com/artemonsh/sqlalchemy_course)
4. [Оконные функции SQL простым языком с примерами](https://habr.com/ru/articles/664000/)
5. [Мем айсберг SQL: погружение в глубины баз данных](https://habr.com/ru/articles/825970/)
6. [Stepik: Интерактивный тренажер по SQL](https://stepik.org/course/63054)
7. [Leetcode: Window Functions in SQL](https://leetcode.com/discuss/study-guide/1600719/database-sql-primer-part-2-window-functions#2)
8. [Colab c курса инструментов разработки](https://colab.research.google.com/drive/1peNZZeGSbUK-urs_cvJ9rF3C-N72LohI?usp=sharing)