<a href="https://colab.research.google.com/github/andreidm92/Agents_in_code/blob/main/practice/Lesson_09_sql_warehouse_full.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>


# 🎯 Day 9 — Warehouse Supervisor: SQL Data Analyst Bot

---

## 📘 Теория (≈45 мин)

### 📌 Часть 1 — LlamaIndex: `SQLDatabaseReader`

**Назначение**: загрузка таблиц из SQL-баз данных как `Document`-объектов для последующей индексации и RAG.

**Импорт**:
```python
from llama_index.readers.database import SQLDatabaseReader
```

**Создание объекта**:
```python
from sqlalchemy import create_engine
from llama_index.readers.database import SQLDatabaseReader

engine = create_engine("sqlite:///example.db")  # или postgres, mysql и т.п.
reader = SQLDatabaseReader(engine)
documents = reader.load_data()
```

**Параметры**:
- `engine`: SQLAlchemy Engine
- `database_name` (опционально)
- `include_table_schema` (bool): добавлять описание схем таблиц
- `sample_rows_in_table_info` (int): сколько строк показать для каждого table_info
- `show_table_names_only` (bool): только список таблиц

**Применяется для**: загрузки фактических данных с WMS/ERP систем, создания агентов‑аналитиков по логистике.

---

### 📌 Часть 2 — LangGraph: LangSmith Metrics

**Цель**: трассировка и анализ поведения агентов через LangSmith: от логов до A/B тестов и визуализации.

**Компоненты**:
- `langsmith.Client()` — клиент SDK
- Метки (tags), Трейсы (traces), ранкинги
- Интеграция с LangChain и LangGraph без дополнительного кода (авто‑hook)

**Пример включения логирования**:
```python
from langsmith import traceable

@traceable(name="sql_query_step")
def run_query(query):
    return execute_query(query)
```

**Используется для**:
- Оптимизации агентов, выявления слабых мест
- A/B тестов (две версии промпта или кода)
- Визуализация поведения агентов

---

### 📌 Часть 3 — LangGraph: Human-in-the-Loop Node

**Назначение**: вставка шага, где человек подтверждает или дополняет решение агента.

```python
def sql_confirmation_node(state):
    print("🔍 SQL-запрос от агента:")
    print(state["sql"])
    input("Подтвердите запрос и нажмите Enter...")
    return state
```

Или встроенный input:

```python
query = "Какие товары есть на складе меньше чем по 100 штук?"
input(f"🤖 Агент предложил запрос:\n'{query}'\n\n✅ Подтвердите и нажмите Enter...")
```

---

## 💡 Ключевые ссылки
- [SQLDatabaseReader – Docs](https://docs.llamaindex.ai/en/stable/api_reference/readers/integrations/sql.html)
- [LangSmith Observability](https://docs.smith.langchain.com)

---

## 🛠 Практика (≈75 мин)

### 📌 Мини-проект: Агент‑аналитик остатков на складе

**Описание**: Агент принимает вопрос и генерирует SQL-запрос к WMS-базе (в SQLite), анализирует остатки, возвращает результат с пояснением.

---

### ✅ Шаги:

1. 📦 Загрузить WMS SQLite DB (сгенерируем mock-данные)
2. 📊 Подключить SQLDatabaseReader → получить Documents
3. 🧠 Построить векторный индекс (VectorStoreIndex)
4. 🤖 Сделать агент-чатбот: получает вопрос → извлекает релевантные фрагменты → формирует SQL-запрос → интерпретирует результат
5. 📉 Добавить LangSmith trace логирование
6. 🔁 Включить Human-in-the-Loop подтверждение запроса
7. 🧪 Написать 2-3 теста (unit-test-like)

---

🔗 Используй ноутбук [`day09_sql_warehouse_HIL.ipynb`](sandbox:/mnt/data/day09_sql_warehouse_HIL.ipynb)


In [2]:
!pip install llama-index langchain langsmith sqlalchemy

Collecting llama-index
  Downloading llama_index-0.12.37-py3-none-any.whl.metadata (12 kB)
Collecting llama-index-agent-openai<0.5,>=0.4.0 (from llama-index)
  Downloading llama_index_agent_openai-0.4.8-py3-none-any.whl.metadata (438 bytes)
Collecting llama-index-cli<0.5,>=0.4.1 (from llama-index)
  Downloading llama_index_cli-0.4.1-py3-none-any.whl.metadata (1.5 kB)
Collecting llama-index-core<0.13,>=0.12.36 (from llama-index)
  Downloading llama_index_core-0.12.37-py3-none-any.whl.metadata (2.4 kB)
Collecting llama-index-embeddings-openai<0.4,>=0.3.0 (from llama-index)
  Downloading llama_index_embeddings_openai-0.3.1-py3-none-any.whl.metadata (684 bytes)
Collecting llama-index-indices-managed-llama-cloud>=0.4.0 (from llama-index)
  Downloading llama_index_indices_managed_llama_cloud-0.6.11-py3-none-any.whl.metadata (3.6 kB)
Collecting llama-index-llms-openai<0.4,>=0.3.0 (from llama-index)
  Downloading llama_index_llms_openai-0.3.44-py3-none-any.whl.metadata (3.0 kB)
Collecting llam

In [4]:
!pip install llama-index-readers-database

Collecting llama-index-readers-database
  Downloading llama_index_readers_database-0.4.0-py3-none-any.whl.metadata (3.6 kB)
Downloading llama_index_readers_database-0.4.0-py3-none-any.whl (6.8 kB)
Installing collected packages: llama-index-readers-database
Successfully installed llama-index-readers-database-0.4.0


In [1]:
# 📌 Генерация mock-таблицы WMS (остатки)
import sqlite3

conn = sqlite3.connect("wms.db")
cursor = conn.cursor()

cursor.execute("DROP TABLE IF EXISTS inventory")
cursor.execute('''
CREATE TABLE inventory (
    id INTEGER PRIMARY KEY AUTOINCREMENT,
    product_name TEXT,
    quantity INTEGER,
    updated_at TEXT
)
''')

products = [("Шурупы", 1200, "2024-05-21"),
            ("Гайки", 800, "2024-05-22"),
            ("Болты", 300, "2024-05-23"),
            ("Петли", 50, "2024-05-20")]
cursor.executemany("INSERT INTO inventory (product_name, quantity, updated_at) VALUES (?, ?, ?)", products)
conn.commit()
conn.close()

In [5]:
from sqlalchemy import create_engine
from llama_index.readers.database import DatabaseReader

engine = create_engine("sqlite:///wms.db")
reader = DatabaseReader(engine=engine)

# Пример SQL-запроса
query = "SELECT product_name, quantity FROM inventory WHERE quantity < 100"
documents = reader.load_data(query=query)

for doc in documents:
    print(doc.text)



product_name: Петли, quantity: 50


In [3]:
import os, getpass
os.environ["OPENAI_API_KEY"] = getpass.getpass("Вставь OpenAI API ключ: ")

Вставь OpenAI API ключ: ··········


In [11]:
# 📌 Построение индекса и запуск query engine
from llama_index.core import VectorStoreIndex
index = VectorStoreIndex.from_documents(documents)
engine = index.as_query_engine()

response = engine.query(
    "Какой товар есть в базе и в каком количестве, если он числится в списке с количеством менее 100?"
)


print(response)



Товар "Петли" есть в базе и его количество составляет 50.


In [13]:
response = engine.query("Что ты можешь сказать о товаре Петли?")

print(response)

The product "Петли" has a quantity of 50 available.


In [8]:
# TODO: Включи LangSmith наблюдаемость, если используешь langsmith.run или @traceable
from langsmith import traceable
@traceable(name="sql_answer")
def query_inventory(q): return engine.query(q)

📌 Что делает @traceable
@traceable — это декоратор из langsmith, который позволяет:

логировать вызовы функций

отслеживать шаги агента

анализировать поведение модели

передавать результаты в LangSmith Dashboard (если настроен)

✅ Как его использовать
Убедись, что у тебя есть LangSmith API-ключ

import os
os.environ["LANGCHAIN_API_KEY"] = "sk-..."
Импортируй и оберни функцию:


from langsmith import traceable

@traceable(name="sql_answer")
def query_inventory(q):
    return engine.query(q)
Вызов:

response = query_inventory("Какие товары остались меньше чем 100 штук?")
print(response)
Результат будет виден в LangSmith UI (https://smith.langchain.com)

🔒 Без API-ключа?
Если ты не используешь LangSmith сейчас, просто оставь как комментарий или убери. Это опционально.



In [9]:
print(response.response)


The product is "Петли" and the quantity is 50.


In [14]:
# 🔎 Проверка, что в ответе упоминается нужный товар
assert "Петли" in response.response, "❌ Товар 'Петли' не найден в ответе"

# 🔢 Проверка, что упоминается количество
assert any(x in response.response for x in ["50", "50 штук", "количество 50"]), "❌ Количество не найдено"

print("✅ Все тесты прошли.")


✅ Все тесты прошли.


### 📌 Часть 3 — LangGraph: Human-in-the-Loop Node


Human-in-the-Loop (HITL) из LangGraph, чтобы вставить ручную проверку на этапе исполнения агента. Это особенно полезно, когда:

Агент генерирует SQL-запрос

Перед выполнением нужно подтвердить или отредактировать его вручную

✅ Пример полного применения в LangGraph

In [16]:
!pip install langgraph


Collecting langgraph
  Downloading langgraph-0.4.7-py3-none-any.whl.metadata (6.8 kB)
Collecting langgraph-checkpoint>=2.0.26 (from langgraph)
  Downloading langgraph_checkpoint-2.0.26-py3-none-any.whl.metadata (4.6 kB)
Collecting langgraph-prebuilt>=0.2.0 (from langgraph)
  Downloading langgraph_prebuilt-0.2.1-py3-none-any.whl.metadata (4.5 kB)
Collecting langgraph-sdk>=0.1.42 (from langgraph)
  Downloading langgraph_sdk-0.1.70-py3-none-any.whl.metadata (1.5 kB)
Collecting ormsgpack<2.0.0,>=1.8.0 (from langgraph-checkpoint>=2.0.26->langgraph)
  Downloading ormsgpack-1.10.0-cp311-cp311-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (43 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m43.7/43.7 kB[0m [31m1.7 MB/s[0m eta [36m0:00:00[0m
Downloading langgraph-0.4.7-py3-none-any.whl (154 kB)
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m154.9/154.9 kB[0m [31m6.0 MB/s[0m eta [36m0:00:00[0m
[?25hDownloading langgraph_checkpoint-2.0.26-py3

In [19]:
from langgraph.graph import StateGraph
from typing import TypedDict

# 👇 Описание структуры состояния
class SQLState(TypedDict):
    sql: str
    result: str

# 👤 Узел HITL
def confirm_sql_node(state: SQLState) -> SQLState:
    print("🔍 SQL-запрос от агента:")
    print(state["sql"])
    input("✅ Нажми Enter для подтверждения")
    return state

# 👷 Примерный pipeline
graph = StateGraph(SQLState)
graph.add_node("generate_sql", lambda state: {"sql": "SELECT * FROM inventory WHERE quantity < 100"})
graph.add_node("confirm_sql", sql_confirmation_node)
graph.add_node("run_sql", lambda state: {"result": "Петли, 50"})

graph.set_entry_point("generate_sql")
graph.add_edge("generate_sql", "confirm_sql")
graph.add_edge("confirm_sql", "run_sql")
graph.set_finish_point("run_sql")

# 🧪 Запуск
app = graph.compile()
output = app.invoke({})
print(output)


🔍 SQL-запрос от агента:
SELECT * FROM inventory WHERE quantity < 100
✅ Подтвердите и нажмите Enter...
{'sql': 'SELECT * FROM inventory WHERE quantity < 100', 'result': 'Петли, 50'}
