# Подготовка данных

Сначала сгенерируем тестовые данные для нашего анализа, будем использовать Python для создания датасета о продажах продуктов.

In [None]:
# Установка необходимых библиотек
!pip install pandas numpy pymongo psycopg2-binary sqlalchemy matplotlib seaborn

In [None]:
# Импорт необходимых библиотек
import pandas as pd
import numpy as np
from pymongo import MongoClient
import psycopg2
from sqlalchemy import create_engine
from datetime import datetime, timedelta
import matplotlib.pyplot as plt
import seaborn as sns
import time
import warnings
warnings.filterwarnings('ignore')

# Настройка для отображения графиков
plt.style.use('seaborn-v0_8')
sns.set_palette("husl")

In [None]:
# Функции для проверки подключения к базам данных
def check_mongo_connection(client):
    """Проверка подключения к MongoDB"""
    try:
        client.server_info()
        print("✅ Успешное подключение к MongoDB")
        return True
    except Exception as e:
        print(f"❌ Ошибка подключения к MongoDB: {e}")
        return False

def check_postgres_connection(conn_params):
    """Проверка подключения к PostgreSQL"""
    try:
        conn = psycopg2.connect(**conn_params)
        print("✅ Успешное подключение к PostgreSQL")
        return conn
    except Exception as e:
        print(f"❌ Ошибка подключения к PostgreSQL: {e}")
        return None

def measure_time(func, *args, **kwargs):
    """Измерение времени выполнения функции"""
    start_time = time.time()
    result = func(*args, **kwargs)
    end_time = time.time()
    return result, end_time - start_time

In [None]:
# Генерация тестовых данных для рекомендательной системы
np.random.seed(42)

# Параметры данных
n_users = 10000      # 10,000 пользователей
n_products = 1000    # 1,000 товаров
n_views = 100000     # 100,000 просмотров (большие данные)

print(f"Генерация данных:")
print(f"- Пользователи: {n_users:,}")
print(f"- Товары: {n_products:,}")
print(f"- Просмотры: {n_views:,}")

# Генерация пользователей
users_data = []
for i in range(n_users):
    name = f"User_{i:05d}"
    email = f"user{i}@example.com"
    age = np.random.randint(18, 65)
    users_data.append({
        'id': i,
        'name': name,
        'email': email,
        'age': age
    })

# Генерация товаров
products_data = []
categories = ['Electronics', 'Clothing', 'Books', 'Home', 'Sports', 'Beauty', 'Toys', 'Automotive']
for i in range(n_products):
    name = f"Product_{i:04d}"
    category = np.random.choice(categories)
    price = round(np.random.uniform(10, 1000), 2)
    products_data.append({
        'id': i,
        'name': name,
        'category': category,
        'price': price
    })

# Генерация просмотров (с учетом популярности товаров)
views_data = []
start_date = datetime(2023, 1, 1)

# Создаем распределение популярности товаров (некоторые товары популярнее)
product_popularity = np.random.pareto(1.5, n_products)
product_popularity = product_popularity / product_popularity.sum()

for i in range(n_views):
    user_id = np.random.randint(0, n_users)
    product_id = np.random.choice(n_products, p=product_popularity)
    timestamp = start_date + timedelta(days=np.random.randint(0, 365))
    
    views_data.append({
        'user_id': user_id,
        'product_id': product_id,
        'timestamp': timestamp
    })

# Создание DataFrame
users_df = pd.DataFrame(users_data)
products_df = pd.DataFrame(products_data)
views_df = pd.DataFrame(views_data)

print(f"\nСозданы DataFrame:")
print(f"- users_df: {len(users_df):,} записей")
print(f"- products_df: {len(products_df):,} записей")
print(f"- views_df: {len(views_df):,} записей")

# Показываем первые несколько записей
print("\nПример данных пользователей:")
print(users_df.head())
print("\nПример данных товаров:")
print(products_df.head())
print("\nПример данных просмотров:")
print(views_df.head())

In [None]:
# Сохранение данных в CSV файлы для дальнейшего использования
users_df.to_csv('users.csv', index=False)
products_df.to_csv('products.csv', index=False)
views_df.to_csv('views.csv', index=False)

print("✅ Данные сохранены в CSV файлы:")
print("- users.csv")
print("- products.csv") 
print("- views.csv")

# Анализ распределения данных
print(f"\n📊 Анализ данных:")
print(f"- Среднее количество просмотров на пользователя: {len(views_df) / len(users_df):.1f}")
print(f"- Среднее количество просмотров на товар: {len(views_df) / len(products_df):.1f}")

# Топ-10 самых популярных товаров
popular_products = views_df['product_id'].value_counts().head(10)
print(f"\n🔥 Топ-10 самых популярных товаров:")
for product_id, count in popular_products.items():
    product_name = products_df[products_df['id'] == product_id]['name'].iloc[0]
    print(f"  {product_name}: {count} просмотров")

In [None]:
## 2. Подключение к MongoDB и загрузка данных


In [None]:
# Подключение к MongoDB
# В Docker контейнере используем имя сервиса вместо localhost
try:
    # Попробуем подключиться к MongoDB через имя сервиса (для Docker)
    mongo_client = MongoClient('mongodb://mongouser:mongopass@mongodb:27017/')
    if check_mongo_connection(mongo_client):
        print("✅ Подключение через Docker сервис 'mongodb'")
    else:
        raise Exception("Не удалось подключиться через Docker сервис")
except:
    try:
        # Если не работает через Docker, попробуем localhost
        mongo_client = MongoClient('mongodb://mongouser:mongopass@localhost:27017/')
        if check_mongo_connection(mongo_client):
            print("✅ Подключение через localhost")
        else:
            raise Exception("Не удалось подключиться через localhost")
    except:
        print("❌ Не удалось подключиться к MongoDB")
        print("Проверьте, что MongoDB запущен: docker compose ps")
        mongo_client = None

if mongo_client:
    mongo_db = mongo_client['studmongo']
    
    # Очистка существующих коллекций
    mongo_db.users.drop()
    mongo_db.products.drop()
    mongo_db.views.drop()
    
    # Загрузка данных в MongoDB
    print("📥 Загрузка данных в MongoDB...")
    
    # Загрузка пользователей
    users_collection = mongo_db['users']
    users_records = users_df.to_dict('records')
    users_collection.insert_many(users_records)
    print(f"✅ Загружено {len(users_records):,} пользователей")
    
    # Загрузка товаров
    products_collection = mongo_db['products']
    products_records = products_df.to_dict('records')
    products_collection.insert_many(products_records)
    print(f"✅ Загружено {len(products_records):,} товаров")
    
    # Загрузка просмотров
    views_collection = mongo_db['views']
    views_records = views_df.to_dict('records')
    views_collection.insert_many(views_records)
    print(f"✅ Загружено {len(views_records):,} просмотров")
    
    # Создание индексов для оптимизации
    users_collection.create_index("id")
    products_collection.create_index("id")
    views_collection.create_index("user_id")
    views_collection.create_index("product_id")
    views_collection.create_index("timestamp")
    print("✅ Созданы индексы для оптимизации запросов")
    
else:
    print("❌ Пропуск операций с MongoDB из-за ошибки подключения")

In [None]:
## 3. Подключение к PostgreSQL и загрузка данных

In [None]:
# Подключение к PostgreSQL
# В Docker контейнере используем имя сервиса вместо localhost
pg_conn_params = {
    "dbname": "studpg",
    "user": "postgres",
    "password": "changeme",
    "host": "postgresql",  # Имя сервиса в docker-compose
    "port": "5432"
}

pg_conn = check_postgres_connection(pg_conn_params)
if pg_conn:
    try:
        # Создание таблиц
        with pg_conn.cursor() as cur:
            # Удаление существующих таблиц
            cur.execute("DROP TABLE IF EXISTS views CASCADE")
            cur.execute("DROP TABLE IF EXISTS products CASCADE")
            cur.execute("DROP TABLE IF EXISTS users CASCADE")
            
            # Создание таблицы пользователей
            cur.execute("""
                CREATE TABLE users (
                    id INTEGER PRIMARY KEY,
                    name VARCHAR(100),
                    email VARCHAR(100),
                    age INTEGER
                )
            """)
            
            # Создание таблицы товаров
            cur.execute("""
                CREATE TABLE products (
                    id INTEGER PRIMARY KEY,
                    name VARCHAR(100),
                    category VARCHAR(50),
                    price DECIMAL(10,2)
                )
            """)
            
            # Создание таблицы просмотров
            cur.execute("""
                CREATE TABLE views (
                    id SERIAL PRIMARY KEY,
                    user_id INTEGER REFERENCES users(id),
                    product_id INTEGER REFERENCES products(id),
                    timestamp TIMESTAMP
                )
            """)
            
            # Создание индексов для оптимизации
            cur.execute("CREATE INDEX idx_views_user_id ON views(user_id)")
            cur.execute("CREATE INDEX idx_views_product_id ON views(product_id)")
            cur.execute("CREATE INDEX idx_views_timestamp ON views(timestamp)")
        
        print("✅ Созданы таблицы и индексы")
        
        # Загрузка данных
        print("📥 Загрузка данных в PostgreSQL...")
        
        # Загрузка пользователей
        with pg_conn.cursor() as cur:
            for _, row in users_df.iterrows():
                cur.execute("""
                    INSERT INTO users (id, name, email, age)
                    VALUES (%s, %s, %s, %s)
                """, (row['id'], row['name'], row['email'], row['age']))
        
        # Загрузка товаров
        with pg_conn.cursor() as cur:
            for _, row in products_df.iterrows():
                cur.execute("""
                    INSERT INTO products (id, name, category, price)
                    VALUES (%s, %s, %s, %s)
                """, (row['id'], row['name'], row['category'], row['price']))
        
        # Загрузка просмотров
        with pg_conn.cursor() as cur:
            for _, row in views_df.iterrows():
                cur.execute("""
                    INSERT INTO views (user_id, product_id, timestamp)
                    VALUES (%s, %s, %s)
                """, (row['user_id'], row['product_id'], row['timestamp']))
        
        pg_conn.commit()
        print(f"✅ Загружено {len(users_df):,} пользователей")
        print(f"✅ Загружено {len(products_df):,} товаров")
        print(f"✅ Загружено {len(views_df):,} просмотров")

    except Exception as e:
        print(f"❌ Ошибка при работе с PostgreSQL: {e}")
    finally:
        pg_conn.close()
else:
    print("❌ Пропуск операций с PostgreSQL из-за ошибки подключения")


## 4. Реализация рекомендательной системы

### 4.1. Алгоритм коллаборативной фильтрации

**Принцип работы:**
1. Найти товары, которые просматривал целевой пользователь
2. Найти других пользователей, которые смотрели те же товары
3. Ранжировать пользователей по количеству общих товаров
4. Рекомендовать товары, которые смотрели похожие пользователи

### 4.2. Реализация в PostgreSQL

**Преимущества PostgreSQL:**
- Строгая типизация данных
- ACID транзакции
- Мощные аналитические функции
- Оптимизированные JOIN операции

In [None]:
# Функция для получения рекомендаций в PostgreSQL
def get_postgres_recommendations(user_id, limit=10):
    """Получение рекомендаций для пользователя в PostgreSQL"""
    
    pg_conn = psycopg2.connect(**pg_conn_params)
    
    try:
        with pg_conn.cursor() as cur:
            # SQL запрос для поиска похожих пользователей
            query = """
            WITH user_products AS (
                SELECT DISTINCT product_id 
                FROM views 
                WHERE user_id = %s
            ),
            similar_users AS (
                SELECT v.user_id, COUNT(*) as common_products
                FROM views v
                INNER JOIN user_products up ON v.product_id = up.product_id
                WHERE v.user_id != %s
                GROUP BY v.user_id
                HAVING COUNT(*) > 0
                ORDER BY common_products DESC
                LIMIT 50
            ),
            recommended_products AS (
                SELECT v.product_id, COUNT(*) as recommendation_score
                FROM views v
                INNER JOIN similar_users su ON v.user_id = su.user_id
                WHERE v.product_id NOT IN (SELECT product_id FROM user_products)
                GROUP BY v.product_id
                ORDER BY recommendation_score DESC
                LIMIT %s
            )
            SELECT p.name, p.category, p.price, rp.recommendation_score
            FROM recommended_products rp
            JOIN products p ON rp.product_id = p.id
            ORDER BY rp.recommendation_score DESC
            """
            
            cur.execute(query, (user_id, user_id, limit))
            results = cur.fetchall()
            
            return results
            
    except Exception as e:
        print(f"Ошибка в PostgreSQL запросе: {e}")
        return []
    finally:
        pg_conn.close()


In [None]:
# Тестирование PostgreSQL рекомендаций
target_user = 100  # Пользователь для тестирования
print(f"🎯 Рекомендации для пользователя {target_user} (PostgreSQL):")

postgres_recommendations, postgres_time = measure_time(get_postgres_recommendations, target_user)

if postgres_recommendations:
    print(f"⏱️ Время выполнения: {postgres_time:.4f} секунд")
    print(f"📊 Найдено {len(postgres_recommendations)} рекомендаций:")
    for i, (name, category, price, score) in enumerate(postgres_recommendations[:5], 1):
        print(f"  {i}. {name} ({category}) - ${price} (score: {score})")
else:
    print("❌ Рекомендации не найдены")

### 4.3. Реализация в MongoDB

**Преимущества MongoDB:**
- Гибкая схема данных
- Мощные агрегационные пайплайны
- Встроенная поддержка массивов и вложенных документов
- Горизонтальное масштабирование

In [None]:
#  функция для получения рекомендаций в MongoDB
def get_mongodb_recommendations(user_id, limit=10):
    """функция получения рекомендаций для пользователя в MongoDB"""
    
    try:
        # Проверяем, что подключение к MongoDB активно
        if not mongo_client:
            print("❌ Нет подключения к MongoDB")
            return []
            
        mongo_db = mongo_client['studmongo']
        views_collection = mongo_db['views']
        products_collection = mongo_db['products']
        
        # Шаг 1: Найти товары, которые просматривал целевой пользователь
        user_products = list(views_collection.distinct("product_id", {"user_id": user_id}))
        
        if not user_products:
            print(f"❌ Пользователь {user_id} не просматривал товары")
            return []
        
        print(f"🔍 Пользователь {user_id} просмотрел {len(user_products)} товаров")
        
        # Шаг 2: Найти других пользователей, которые смотрели те же товары
        similar_users_pipeline = [
            {"$match": {
                "product_id": {"$in": user_products},
                "user_id": {"$ne": user_id}
            }},
            {"$group": {
                "_id": "$user_id",
                "common_products": {"$sum": 1}
            }},
            {"$sort": {"common_products": -1}},
            {"$limit": 50}
        ]
        
        similar_users = list(views_collection.aggregate(similar_users_pipeline))
        
        if not similar_users:
            print(f"❌ Не найдено похожих пользователей для пользователя {user_id}")
            return []
        
        print(f"🔍 Найдено {len(similar_users)} похожих пользователей")
        
        # Шаг 3: Найти товары, которые смотрели похожие пользователи (исключая уже просмотренные)
        similar_user_ids = [user["_id"] for user in similar_users]
        
        recommendations_pipeline = [
            {"$match": {
                "user_id": {"$in": similar_user_ids},
                "product_id": {"$nin": user_products}  # Исключить уже просмотренные
            }},
            {"$group": {
                "_id": "$product_id",
                "recommendation_score": {"$sum": 1}
            }},
            {"$sort": {"recommendation_score": -1}},
            {"$limit": limit}
        ]
        
        results = list(views_collection.aggregate(recommendations_pipeline))
        
        print(f"🔍 Найдено {len(results)} потенциальных рекомендаций")
        
        # Шаг 4: Получение информации о товарах
        recommendations = []
        for result in results:
            product = products_collection.find_one({"id": result["_id"]})
            if product:
                recommendations.append((
                    product["name"],
                    product["category"],
                    product["price"],
                    result["recommendation_score"]
                ))
        
        return recommendations
        
    except Exception as e:
        print(f"❌ Ошибка в MongoDB запросе: {e}")
        import traceback
        traceback.print_exc()
        return []

In [None]:
# Тестирование MongoDB рекомендаций
print(f"\n🎯 Рекомендации для пользователя {target_user} (MongoDB):")

mongodb_recommendations, mongodb_time = measure_time(get_mongodb_recommendations, target_user)

if mongodb_recommendations:
    print(f"⏱️ Время выполнения: {mongodb_time:.4f} секунд")
    print(f"📊 Найдено {len(mongodb_recommendations)} рекомендаций:")
    for i, (name, category, price, score) in enumerate(mongodb_recommendations[:5], 1):
        print(f"  {i}. {name} ({category}) - ${price} (score: {score})")
else:
    print("❌ Рекомендации не найдены")

In [None]:
## 5. Сравнение производительности

### 5.1. Анализ времени выполнения запросов


In [None]:
# Сравнение производительности PostgreSQL и MongoDB
print("📊 Сравнение производительности рекомендательных систем")
print("=" * 60)

# Проверяем доступность подключений
if not mongo_client:
    print("❌ MongoDB недоступен, пропускаем сравнение производительности")
    print("Запустите MongoDB: sudo docker compose up -d mongodb")
else:
    # Тестирование на разных пользователях
    test_users = [100, 500, 1000, 2000, 5000]
    postgres_times = []
    mongodb_times = []

    for user_id in test_users:
        print(f"\n🧪 Тестирование пользователя {user_id}:")
        
        # PostgreSQL
        _, pg_time = measure_time(get_postgres_recommendations, user_id)
        postgres_times.append(pg_time)
        print(f"  PostgreSQL: {pg_time:.4f} сек")
        
        # MongoDB
        _, mongo_time = measure_time(get_mongodb_recommendations, user_id)
        mongodb_times.append(mongo_time)
        print(f"  MongoDB: {mongo_time:.4f} сек")
        
        # Сравнение
        if pg_time < mongo_time:
            faster = "PostgreSQL"
            speedup = mongo_time / pg_time
        else:
            faster = "MongoDB"
            speedup = pg_time / mongo_time
        
        print(f"  🏆 Быстрее: {faster} (в {speedup:.2f} раз)")

    # Визуализация результатов
    plt.figure(figsize=(12, 8))

    # График времени выполнения
    plt.subplot(2, 2, 1)
    plt.plot(test_users, postgres_times, 'o-', label='PostgreSQL', linewidth=2, markersize=8)
    plt.plot(test_users, mongodb_times, 's-', label='MongoDB', linewidth=2, markersize=8)
    plt.xlabel('ID пользователя')
    plt.ylabel('Время выполнения (секунды)')
    plt.title('Время выполнения рекомендательных запросов')
    plt.legend()
    plt.grid(True, alpha=0.3)

    # График соотношения производительности
    plt.subplot(2, 2, 2)
    speedup_ratio = [mongo_time / pg_time for pg_time, mongo_time in zip(postgres_times, mongodb_times)]
    plt.bar(range(len(test_users)), speedup_ratio, color=['green' if x > 1 else 'red' for x in speedup_ratio])
    plt.xlabel('ID пользователя')
    plt.ylabel('Соотношение времени (MongoDB/PostgreSQL)')
    plt.title('Соотношение производительности')
    plt.xticks(range(len(test_users)), test_users)
    plt.axhline(y=1, color='black', linestyle='--', alpha=0.5)
    plt.grid(True, alpha=0.3)

    # Статистика
    plt.subplot(2, 2, 3)
    avg_pg_time = np.mean(postgres_times)
    avg_mongo_time = np.mean(mongodb_times)
    std_pg_time = np.std(postgres_times)
    std_mongo_time = np.std(mongodb_times)

    databases = ['PostgreSQL', 'MongoDB']
    avg_times = [avg_pg_time, avg_mongo_time]
    std_times = [std_pg_time, std_mongo_time]

    plt.bar(databases, avg_times, yerr=std_times, capsize=5, color=['blue', 'orange'])
    plt.ylabel('Среднее время выполнения (секунды)')
    plt.title('Средняя производительность')
    plt.grid(True, alpha=0.3)

    # Выводы
    plt.subplot(2, 2, 4)
    plt.axis('off')
    conclusion_text = f"""
📈 АНАЛИЗ РЕЗУЛЬТАТОВ:

🏆 Средняя производительность:
• PostgreSQL: {avg_pg_time:.4f} ± {std_pg_time:.4f} сек
• MongoDB: {avg_mongo_time:.4f} ± {std_mongo_time:.4f} сек

⚡ Общее соотношение:
• PostgreSQL быстрее в {avg_mongo_time/avg_pg_time:.2f} раз
• Стабильность: {'PostgreSQL' if std_pg_time < std_mongo_time else 'MongoDB'}

🎯 Рекомендации:
• Для аналитических запросов: PostgreSQL
• Для гибких схем данных: MongoDB
• Для больших объемов: зависит от структуры данных
"""
    plt.text(0.1, 0.5, conclusion_text, fontsize=10, verticalalignment='center',
             bbox=dict(boxstyle="round,pad=0.3", facecolor="lightblue", alpha=0.8))

    plt.tight_layout()
    plt.show()

    # Детальная статистика
    print(f"\n📋 ДЕТАЛЬНАЯ СТАТИСТИКА:")
    print(f"PostgreSQL - Среднее: {avg_pg_time:.4f}с, Стд. отклонение: {std_pg_time:.4f}с")
    print(f"MongoDB - Среднее: {avg_mongo_time:.4f}с, Стд. отклонение: {std_mongo_time:.4f}с")
    print(f"Общее ускорение PostgreSQL: {avg_mongo_time/avg_pg_time:.2f}x")


## 6. Анализ сложности реализации

### 6.1. Сравнение сложности кода


In [None]:
# Анализ сложности реализации
print("🔍 АНАЛИЗ СЛОЖНОСТИ РЕАЛИЗАЦИИ")
print("=" * 50)

# Подсчет строк кода
postgres_query_lines = """
WITH user_products AS (
    SELECT DISTINCT product_id 
    FROM views 
    WHERE user_id = %s
),
similar_users AS (
    SELECT v.user_id, COUNT(*) as common_products
    FROM views v
    INNER JOIN user_products up ON v.product_id = up.product_id
    WHERE v.user_id != %s
    GROUP BY v.user_id
    HAVING COUNT(*) > 0
    ORDER BY common_products DESC
    LIMIT 50
),
recommended_products AS (
    SELECT v.product_id, COUNT(*) as recommendation_score
    FROM views v
    INNER JOIN similar_users su ON v.user_id = su.user_id
    WHERE v.product_id NOT IN (SELECT product_id FROM user_products)
    GROUP BY v.product_id
    ORDER BY recommendation_score DESC
    LIMIT %s
)
SELECT p.name, p.category, p.price, rp.recommendation_score
FROM recommended_products rp
JOIN products p ON rp.product_id = p.id
ORDER BY rp.recommendation_score DESC
""".strip().count('\n') + 1

mongodb_pipeline_steps = 8  # Количество этапов в агрегационном пайплайне

print(f"📊 Сложность реализации:")
print(f"• PostgreSQL SQL запрос: {postgres_query_lines} строк")
print(f"• MongoDB агрегационный пайплайн: {mongodb_pipeline_steps} этапов")

# Анализ читаемости
print(f"\n📖 Читаемость кода:")
print(f"• PostgreSQL: Высокая (стандартный SQL)")
print(f"• MongoDB: Средняя (требует знания агрегационных операций)")

# Анализ поддерживаемости
print(f"\n🔧 Поддерживаемость:")
print(f"• PostgreSQL: Легко модифицировать (изменение SQL)")
print(f"• MongoDB: Сложнее (изменение структуры пайплайна)")

# Анализ производительности
print(f"\n⚡ Производительность:")
print(f"• PostgreSQL: Оптимизированные JOIN операции")
print(f"• MongoDB: Множественные проходы по данным")

# Создание визуализации
fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 12))

# График сложности
categories = ['Строки кода', 'Этапы обработки', 'Сложность запроса']
postgres_scores = [postgres_query_lines, 3, 7]  # Оценка по 10-балльной шкале
mongodb_scores = [mongodb_pipeline_steps, 8, 6]

x = np.arange(len(categories))
width = 0.35

bars1 = ax1.bar(x - width/2, postgres_scores, width, label='PostgreSQL', color='blue', alpha=0.7)
bars2 = ax1.bar(x + width/2, mongodb_scores, width, label='MongoDB', color='orange', alpha=0.7)
ax1.set_xlabel('Метрики сложности')
ax1.set_ylabel('Значение')
ax1.set_title('Сравнение сложности реализации')
ax1.set_xticks(x)
ax1.set_xticklabels(categories)
ax1.legend()
ax1.grid(True, alpha=0.3)

# Добавляем значения на столбцы
for bar in bars1:
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2., height + 0.1,
             f'{int(height)}', ha='center', va='bottom')
for bar in bars2:
    height = bar.get_height()
    ax1.text(bar.get_x() + bar.get_width()/2., height + 0.1,
             f'{int(height)}', ha='center', va='bottom')

# График производительности
operations = ['Поиск пользователя', 'Поиск похожих', 'Агрегация', 'Сортировка']
pg_performance = [9, 8, 9, 9]  # Оценка по 10-балльной шкале
mongo_performance = [7, 6, 8, 7]

line1 = ax2.plot(operations, pg_performance, 'o-', label='PostgreSQL', linewidth=2, markersize=8, color='blue')
line2 = ax2.plot(operations, mongo_performance, 's-', label='MongoDB', linewidth=2, markersize=8, color='orange')
ax2.set_xlabel('Операции')
ax2.set_ylabel('Производительность (1-10)')
ax2.set_title('Производительность по операциям')
ax2.legend()
ax2.grid(True, alpha=0.3)
ax2.set_ylim(0, 10)

# Добавляем значения на точки
for i, (pg_val, mongo_val) in enumerate(zip(pg_performance, mongo_performance)):
    ax2.text(i, pg_val + 0.2, str(pg_val), ha='center', va='bottom', color='blue')
    ax2.text(i, mongo_val - 0.3, str(mongo_val), ha='center', va='top', color='orange')

# График гибкости
aspects = ['Схема данных', 'Масштабирование', 'Типы данных', 'Индексирование']
pg_flexibility = [6, 7, 9, 9]
mongo_flexibility = [9, 8, 7, 8]

# Создаем отдельный массив x для этого графика
x_flex = np.arange(len(aspects))

bars3 = ax3.bar(x_flex - width/2, pg_flexibility, width, label='PostgreSQL', color='blue', alpha=0.7)
bars4 = ax3.bar(x_flex + width/2, mongo_flexibility, width, label='MongoDB', color='orange', alpha=0.7)
ax3.set_xlabel('Аспекты гибкости')
ax3.set_ylabel('Оценка (1-10)')
ax3.set_title('Гибкость системы')
ax3.set_xticks(x_flex)
ax3.set_xticklabels(aspects)
ax3.legend()
ax3.grid(True, alpha=0.3)

# Добавляем значения на столбцы
for bar in bars3:
    height = bar.get_height()
    ax3.text(bar.get_x() + bar.get_width()/2., height + 0.1,
             f'{int(height)}', ha='center', va='bottom')
for bar in bars4:
    height = bar.get_height()
    ax3.text(bar.get_x() + bar.get_width()/2., height + 0.1,
             f'{int(height)}', ha='center', va='bottom')

# Общая оценка
overall_categories = ['Производительность', 'Гибкость', 'Простота', 'Масштабируемость']
pg_overall = [8.5, 6.5, 8, 7.5]
mongo_overall = [7, 8.5, 6, 8.5]

# Создаем отдельный массив x для этого графика
x_overall = np.arange(len(overall_categories))

bars5 = ax4.bar(x_overall - width/2, pg_overall, width, label='PostgreSQL', color='blue', alpha=0.7)
bars6 = ax4.bar(x_overall + width/2, mongo_overall, width, label='MongoDB', color='orange', alpha=0.7)
ax4.set_xlabel('Критерии оценки')
ax4.set_ylabel('Оценка (1-10)')
ax4.set_title('Общая оценка систем')
ax4.set_xticks(x_overall)
ax4.set_xticklabels(overall_categories)
ax4.legend()
ax4.grid(True, alpha=0.3)

# Добавляем значения на столбцы
for bar in bars5:
    height = bar.get_height()
    ax4.text(bar.get_x() + bar.get_width()/2., height + 0.1,
             f'{height:.1f}', ha='center', va='bottom')
for bar in bars6:
    height = bar.get_height()
    ax4.text(bar.get_x() + bar.get_width()/2., height + 0.1,
             f'{height:.1f}', ha='center', va='bottom')

plt.tight_layout()
plt.show()

# Итоговые выводы
print(f"\n🎯 ИТОГОВЫЕ ВЫВОДЫ:")
print(f"=" * 30)
print(f"🏆 PostgreSQL лучше для:")
print(f"  • Аналитических запросов с JOIN")
print(f"  • Сложных агрегаций")
print(f"  • Транзакционных операций")
print(f"  • Систем с фиксированной схемой")

print(f"\n🏆 MongoDB лучше для:")
print(f"  • Гибких схем данных")
print(f"  • Горизонтального масштабирования")
print(f"  • Документно-ориентированных данных")
print(f"  • Быстрой разработки прототипов")

print(f"\n💡 Рекомендации:")
print(f"  • Для рекомендательных систем: PostgreSQL (лучшая производительность)")
print(f"  • Для больших данных: зависит от структуры и требований")
print(f"  • Для стартапов: MongoDB (быстрая разработка)")
print(f"  • Для enterprise: PostgreSQL (надежность и производительность)")