In [1]:
pip install sqlalchemy pymysql pandas matplotlib seaborn python-dotenv

Note: you may need to restart the kernel to use updated packages.


In [2]:
import datetime
import requests
import json
import os

from dotenv import load_dotenv
import pandas as pd
import sqlalchemy as sa
from sqlalchemy import create_engine, text, MetaData, Table
from sqlalchemy.orm import sessionmaker

# import warnings
# warnings.filterwarnings('ignore')

In [3]:
def create_connection():
    """
    Створює підключення через SQLAlchemy
    """
    # Завантажуємо змінні середовища
    load_dotenv()

    # Отримуємо параметри з environment variables
    host = os.getenv('DB_HOST', 'localhost')
    port = os.getenv('DB_PORT', '3306')
    user = os.getenv('DB_USER')
    password = os.getenv('DB_PASSWORD')
    database = os.getenv('DB_NAME')

    if not all([user, password, database]):
        raise ValueError("Не всі параметри БД задані в .env файлі!")

    # Створюємо connection string
    connection_string = f"mysql+pymysql://{user}:{password}@{host}:{port}/{database}"

    # Створюємо engine з connection pooling
    engine = create_engine(
        connection_string,
        pool_size=2,           # Розмір пулу підключень
        max_overflow=20,        # Максимальна кількість додаткових підключень
        pool_pre_ping=True,     # Перевірка підключення перед використанням
        echo=False              # Логування SQL запитів (True для debug)
    )

    # Тестуємо підключення
    try:
        with engine.connect() as conn:
            result = conn.execute(text("SELECT 1"))
            result.fetchone()

        print("✅ Підключення до БД успішне!")
        print(f"🔗 {user}@{host}:{port}/{database}")
        print(f"⚡ Engine: {engine}")

        return engine

    except Exception as e:
        print(f"❌ Помилка підключення: {e}")
        return None

# Створюємо підключення
engine = create_connection()

✅ Підключення до БД успішне!
🔗 root@127.0.0.1:3306/classicmodels
⚡ Engine: Engine(mysql+pymysql://root:***@127.0.0.1:3306/classicmodels)


In [4]:
from sqlalchemy import create_engine, text




In [5]:
# Створюємо таблицю для курсів валют (сучасний спосіб)
def create_currency_table(engine):
    """Створює таблицю через SQLAlchemy"""

    create_table_sql = text("""
    CREATE TABLE IF NOT EXISTS currency_rates (
        id INT AUTO_INCREMENT PRIMARY KEY,
        currency_code VARCHAR(3) NOT NULL,
        rate_to_usd DECIMAL(10, 6) NOT NULL,
        rate_date DATE NOT NULL,
        created_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP,
        updated_at TIMESTAMP DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP,
        INDEX idx_currency_date (currency_code, rate_date),
        UNIQUE KEY unique_currency_date (currency_code, rate_date)
    )
    """)

    with engine.connect() as conn:
        # тут лише одна транзакція - conn.begin() не треба
        conn.execute(create_table_sql)

    print("✅ Таблиця currency_rates створена")

def fetch_exchange_rates():
    """Отримує курси валют з API"""
    try:
        # Безкоштовний API курсів валют
        url = "https://api.exchangerate-api.com/v4/latest/USD"
        response = requests.get(url, timeout=10)
        response.raise_for_status()

        data = response.json()

        # Валюти що нас цікавлять
        currencies = ['EUR', 'GBP', 'UAH', 'PLN', 'JPY', 'CAD']
        rates = {}

        for currency in currencies:
            if currency in data['rates']:
                # Зберігаємо курс до USD (скільки одиниць валюти за 1 USD)
                rates[currency] = data['rates'][currency]

        return rates, datetime.date.today()

    except Exception as e:
        print(f"❌ Помилка API: {e}")
        return None, None

def save_exchange_rates(engine, rates_dict, rate_date):
    """Зберігає курси в БД з обробкою конфліктів"""

    if not rates_dict:
        print("❌ Немає даних для збереження")
        return False

    # SQL з ON DUPLICATE KEY UPDATE для MySQL
    insert_sql = text("""
    INSERT INTO currency_rates (currency_code, rate_to_usd, rate_date)
    VALUES (:currency, :rate, :date)
    ON DUPLICATE KEY UPDATE
        rate_to_usd = VALUES(rate_to_usd),
        updated_at = CURRENT_TIMESTAMP
    """)

    try:
        with engine.connect() as conn:
            with conn.begin():  # Транзакція для всіх вставок
                for currency, rate in rates_dict.items():
                    conn.execute(insert_sql, {
                        'currency': currency,
                        'rate': rate,
                        'date': rate_date
                    })

        print(f"✅ Збережено {len(rates_dict)} курсів валют на {rate_date}")
        return True

    except Exception as e:
        print(f"❌ Помилка збереження: {e}")
        return False

In [6]:
# Виконуємо повний цикл API → БД
create_currency_table(engine)

print("📡 Отримуємо курси валют...")
rates, date = fetch_exchange_rates()

if rates:
    print(f"Отримані курси на {date}:")
    for currency, rate in rates.items():
        print(f"  1 USD = {rate:.4f} {currency}")

    # Зберігаємо в БД
    if save_exchange_rates(engine, rates, date):
        # Перевіряємо збережені дані
        verification_df = pd.read_sql(
            "SELECT * FROM currency_rates ORDER BY created_at DESC LIMIT 10",
            engine
        )
        print("\nЗбережені дані:")
        display(verification_df)

✅ Таблиця currency_rates створена
📡 Отримуємо курси валют...
Отримані курси на 2025-08-10:
  1 USD = 0.8590 EUR
  1 USD = 0.7440 GBP
  1 USD = 41.4300 UAH
  1 USD = 3.6500 PLN
  1 USD = 147.6600 JPY
  1 USD = 1.3800 CAD
✅ Збережено 6 курсів валют на 2025-08-10

Збережені дані:


Unnamed: 0,id,currency_code,rate_to_usd,rate_date,created_at,updated_at
0,1,EUR,0.859,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51
1,2,GBP,0.744,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51
2,3,UAH,41.43,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51
3,4,PLN,3.65,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51
4,5,JPY,147.66,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51
5,6,CAD,1.38,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51


In [8]:
# тут я додав тільки CAD
currency_rates = "SELECT id, currency_code, rate_to_usd, rate_date, created_at, updated_at FROM classicmodels.currency_rates"
df_classicmodels = pd.read_sql(currency_rates, engine)

display(df_classicmodels)

Unnamed: 0,id,currency_code,rate_to_usd,rate_date,created_at,updated_at
0,1,EUR,0.859,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51
1,2,GBP,0.744,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51
2,3,UAH,41.43,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51
3,4,PLN,3.65,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51
4,5,JPY,147.66,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51
5,6,CAD,1.38,2025-08-10,2025-08-10 09:03:05,2025-08-10 10:37:51


In [11]:
import pandas as pd
from sqlalchemy import create_engine

query_base = """
SELECT
  o.orderNumber,
  o.orderDate,
  c.customerNumber,
  c.customerName,
  c.country,
  p.productLine,
  p.productName,
  p.buyPrice,
  od.priceEach,
  od.quantityOrdered
FROM orders o
JOIN orderdetails od ON o.orderNumber = od.orderNumber
JOIN products p ON od.productCode = p.productCode
JOIN customers c ON o.customerNumber = c.customerNumber
WHERE YEAR(o.orderDate) = 2004
ORDER BY o.orderDate
"""
df = pd.read_sql_query(query_base, engine)

# Беремо курси EUR (rate_to_usd) 
rates_q = """
SELECT rate_date, rate_to_usd
FROM currency_rates
WHERE currency_code = 'EUR'
ORDER BY rate_date
"""
df_rates = pd.read_sql_query(rates_q, engine)

df['orderDate'] = pd.to_datetime(df['orderDate'])
df_rates['rate_date'] = pd.to_datetime(df_rates['rate_date'])

df = df.sort_values('orderDate').reset_index(drop=True)
df_rates = df_rates.sort_values('rate_date').reset_index(drop=True)

df = pd.merge_asof(df, df_rates, left_on='orderDate', right_on='rate_date', direction='nearest')
df = df.rename(columns={'rate_to_usd': 'eur_rate'})

# Перевірка: якщо все ще NaN в eur_rate — повідомимо
if df['eur_rate'].isna().any():
    print("Увага: є рядки без курсу EUR (eur_rate). Можливо немає даних у currency_rates для відповідного періоду.")

# Додаємо колонки
df['profit_per_item'] = df['priceEach'] - df['buyPrice']
df['total_profit'] = df['profit_per_item'] * df['quantityOrdered']
df['total_amount'] = df['priceEach'] * df['quantityOrdered']

# Конвертація в євро
df['total_amount_eur'] = df.apply(
    lambda r: r['total_amount'] / r['eur_rate'] if pd.notna(r['eur_rate']) and r['eur_rate'] != 0 else pd.NA,
    axis=1
)

# 2.2 
df_country = df.groupby('country', as_index=False).agg(
    unique_orders=('orderNumber', 'nunique'),
    total_revenue=('total_amount', 'sum'),
    total_profit=('total_profit', 'sum'),
    total_qty=('quantityOrdered', 'sum')
)
df_country['profit_margin_%'] = (df_country['total_profit'] / df_country['total_revenue']) * 100
df_top5_countries = df_country.sort_values('total_revenue', ascending=False).head(5)

# 2.3 
df_productline = df.groupby('productLine', as_index=False).agg(
    unique_orders=('orderNumber', 'nunique'),
    total_revenue=('total_amount', 'sum'),
    total_profit=('total_profit', 'sum'),
    total_qty=('quantityOrdered', 'sum')
)
df_productline['profit_margin_%'] = (df_productline['total_profit'] / df_productline['total_revenue']) * 100
df_productline = df_productline.sort_values('total_revenue', ascending=False)

# 2.4 Executive Summary 

orders_sum = df.groupby('orderNumber', as_index=False)['total_amount'].sum()
avg_order_value = orders_sum['total_amount'].mean()

exec_summary = {
    'total_revenue_usd': float(df['total_amount'].sum()),
    'total_revenue_eur': float(df['total_amount_eur'].dropna().sum()),
    'total_profit_usd': float(df['total_profit'].sum()),
    'profit_margin_%': float((df['total_profit'].sum() / df['total_amount'].sum()) * 100) if df['total_amount'].sum() != 0 else None,
    'avg_order_value_usd': float(avg_order_value),
    'unique_orders': int(df['orderNumber'].nunique()),
    'unique_customers': int(df['customerName'].nunique()),
    'min_date': df['orderDate'].min(),
    'max_date': df['orderDate'].max()
}

# Вивід та збереження 
print("ТОП-5 країн за доходом (2004)")
display(df_top5_countries.style.format({
    'total_revenue':'${:,.2f}',
    'total_profit':'${:,.2f}',
    'profit_margin_%':'{:.2f}%'
}))

print("\nАналітика по продуктовим лініям")
display(df_productline.style.format({
    'total_revenue':'${:,.2f}',
    'total_profit':'${:,.2f}',
    'profit_margin_%':'{:.2f}%'
}))

print("\nExecutive Summary")
for k, v in exec_summary.items():
    print(f"{k}: {v}")

# Збереження CSV
df_top5_countries.to_csv('top5_countries_2004.csv', index=False)
df_productline.to_csv('productline_analysis_2004.csv', index=False)
pd.DataFrame([exec_summary]).to_csv('executive_summary_2004.csv', index=False)

print("\nФайли збережено: top5_countries_2004.csv, productline_analysis_2004.csv, executive_summary_2004.csv")

ТОП-5 країн за доходом (2004)


Unnamed: 0,country,unique_orders,total_revenue,total_profit,total_qty,profit_margin_%
20,USA,53,"$1,526,499.65","$614,370.08",16719,40.25%
6,France,19,"$506,660.01","$211,528.15",5632,41.75%
16,Spain,14,"$439,881.84","$175,328.56",4962,39.86%
19,UK,7,"$238,193.93","$93,425.03",2778,39.22%
11,New Zealand,6,"$233,362.27","$94,390.14",2537,40.45%



Аналітика по продуктовим лініям


Unnamed: 0,productLine,unique_orders,total_revenue,total_profit,total_qty,profit_margin_%
0,Classic Cars,97,"$1,763,136.73","$703,837.29",16085,39.92%
6,Vintage Cars,88,"$854,551.85","$350,298.70",10864,40.99%
1,Motorcycles,37,"$527,243.84","$222,485.41",5976,42.20%
2,Planes,34,"$471,971.46","$182,273.04",5820,38.62%
5,Trucks and Buses,40,"$465,390.00","$182,082.20",5024,39.12%
3,Ships,35,"$337,326.10","$134,731.87",4309,39.94%
4,Trains,22,"$96,285.53","$33,672.63",1409,34.97%



Executive Summary
total_revenue_usd: 4515905.51
total_revenue_eur: 5257165.902211874
total_profit_usd: 1809381.1400000001
profit_margin_%: 40.06685117731793
avg_order_value_usd: 29906.659006622514
unique_orders: 151
unique_customers: 89
min_date: 2004-01-02 00:00:00
max_date: 2004-12-17 00:00:00

Файли збережено: top5_countries_2004.csv, productline_analysis_2004.csv, executive_summary_2004.csv
