# Инициализация базы данных и загрузка данных

### Создание базы данных
Создадим базу данных, которая будет использоваться для хранения и анализа финансовой информации.

In [2]:
%%sql
-- Создаем базу данных
CREATE DATABASE postgres;

Exception: [42P04] ОШИБКА: база данных "postgres" уже существует

# Установка соединения с базой данных PostgreSQL
### Настроим подключение к базе данных PostgreSQL для выполнения SQL-запросов непосредственно из Jupyter Notebook.

In [1]:
# Устанавливаем соединение с базой данных PostgreSQL
%load_ext sql

# Подключение к базе данных PostgreSQL
%sql postgresql://postgres:postgres@localhost:5432/postgres


In [ ]:
# Устанавливаем соединение с базой данных PostgreSQL, если уже создали соединение используем этот участок кода, так как он будет производить пересоединение
%reload_ext sql

# Подключение к базе данных PostgreSQL
%sql postgresql://postgres:postgres@localhost:5432/postgres


# Создание таблицы
### Создаем структуру таблицы для хранения данных о ресурсном использовании

In [ ]:
%%sql
-- Создаем таблицу для хранения данных
CREATE TABLE IF NOT EXISTS resources_usage (
    id SERIAL PRIMARY KEY,
    date DATE,
    bank VARCHAR(255),
    currency VARCHAR(255),
    planned_limit NUMERIC,
    actual_usage NUMERIC
);


# Заполнение таблицы начальными данными
### Вводим начальные данные в таблицу для последующего анализа.

In [ ]:
%%sql
-- Вставляем данные в таблицу
INSERT INTO resources_usage (date, bank, currency, planned_limit, actual_usage)
VALUES 
('2022-01-01', 'ТРАСТ', 'USD', 100, 90),
('2022-01-02', 'ТРАСТ', 'USD', 100, 95),
('2022-02-01', 'ТРАСТ', 'USD', 100, 85),
('2022-02-02', 'ТРАСТ', 'USD', 100, 88),
('2022-03-01', 'ТРАСТ', 'USD', 100, 92),
('2022-03-02', 'ТРАСТ', 'USD', 100, 90),
('2022-04-01', 'ТРАСТ', 'USD', 100, 91),
('2022-04-02', 'ТРАСТ', 'USD', 100, 94);

# Автоматическое заполнение данных
### Используем Python для генерации и вставки данных, чтобы обеспечить большее разнообразие и реалистичность.

In [3]:
import psycopg2
from datetime import datetime, timedelta
import random

# Параметры подключения к базе данных
conn = psycopg2.connect(
    dbname='postgres',
    user='postgres',
    password='postgres',
    host='localhost'
)
cur = conn.cursor()

# Определение банков и валют
banks = ['ТРАСТ', 'АЛЬФА', 'ТБАНК']
currencies = ['RUB', 'EUR', 'USD']
limits = {'RUB': 300000, 'EUR': 1500, 'USD': 2000}

# Генерация данных
for bank in banks:
    start_date = datetime(2022, 1, 1)
    for i in range(365):
        current_date = start_date + timedelta(days=i)
        currency = random.choice(currencies)
        planned_limit = limits[currency]
        actual_usage = random.randint(0, planned_limit)

        # Сформировать и выполнить SQL запрос
        query = """
        INSERT INTO resources_usage (date, bank, currency, planned_limit, actual_usage)
        VALUES (%s, %s, %s, %s, %s);
        """
        cur.execute(query, (current_date, bank, currency, planned_limit, actual_usage))

# Фиксация изменений в базе данных
conn.commit()

# Закрытие соединения
cur.close()
conn.close()

print("Данные успешно добавлены в базу данных.")


Данные успешно добавлены в базу данных.


# Индексация для улучшения производительности запросов
### Создаем индексы для оптимизации запросов по ключевым полям.
(можно использовать как несколько индексов так и один композитный)

In [ ]:
%%sql
-- Создание индексов для ускорения запросов с учетом банка и валюты
CREATE INDEX IF NOT EXISTS idx_bank_currency ON resources_usage(bank, currency);
CREATE INDEX IF NOT EXISTS idx_date ON resources_usage(date);


In [ ]:
%%sql
-- Создание композитного индекса для ускорения запросов
CREATE INDEX IF NOT EXISTS idx_date_bank_currency ON resources_usage(date, bank, currency);


### Проводим проверку на то что есть в нашей таблицы  или существует она


In [15]:
%%sql
-- Проверка данных в таблице
SELECT * FROM resources_usage;


Unnamed: 0,id,date,bank,currency,planned_limit,actual_usage
0,1,2022-01-01,ТРАСТ,USD,100,90
1,2,2022-01-02,ТРАСТ,USD,100,95
2,3,2022-02-01,ТРАСТ,USD,100,85
3,4,2022-02-02,ТРАСТ,USD,100,88
4,5,2022-03-01,ТРАСТ,USD,100,92
5,6,2022-03-02,ТРАСТ,USD,100,90
6,7,2022-04-01,ТРАСТ,USD,100,91
7,8,2022-04-02,ТРАСТ,USD,100,94
8,9,2022-01-01,ТРАСТ,USD,100,90
9,10,2022-01-02,ТРАСТ,USD,100,95


# Визуализация данных
### Используем Python и библиотеки визуализации для отображения анализа данных.
(Выполнено в виде удобного приложения которым может воспользоваться каждый)

In [1]:
import pandas as pd
import matplotlib.pyplot as plt
from sqlalchemy import create_engine, text
from sqlalchemy.orm import sessionmaker
import ipywidgets as widgets
from IPython.display import display, clear_output

# Подключение к базе данных
engine = create_engine('postgresql://postgres:postgres@localhost:5432/postgres')
Session = sessionmaker(bind=engine)

def load_data(query):
    session = Session()
    try:
        result = session.execute(text(query))
        df = pd.DataFrame(result.fetchall(), columns=result.keys())
        return df
    finally:
        session.close()

def plot_data(df, x_label, y_label, title):
    plt.figure(figsize=(10, 6))
    plt.plot(df['period'], df['avg_planned_limit'], label='Плановый лимит')
    plt.plot(df['period'], df['avg_actual_usage'], label='Фактическое использование')
    plt.xlabel(x_label)
    plt.ylabel(y_label)
    plt.title(title)
    plt.legend()
    plt.grid(True)
    plt.show()

# Радиокнопки для банков
bank_radio = widgets.RadioButtons(options=['ТРАСТ', 'АЛЬФА', 'ТБАНК'], value='ТРАСТ', description='Банк:', layout=widgets.Layout(width='300px', margin='10px'))

# Радиокнопки для валют
currency_radio = widgets.RadioButtons(options=['USD', 'EUR', 'RUB'], value='USD', description='Валюта:', layout=widgets.Layout(width='300px', margin='10px'))

# Радиокнопки для периодов
period_radio = widgets.RadioButtons(options=['Дни', 'Месяцы', 'Кварталы'], value='Дни', description='Период:', layout=widgets.Layout(width='300px', margin='10px'))

button = widgets.Button(description="Построить график", layout=widgets.Layout(width='300px', margin='10px'))
output = widgets.Output()

def on_button_clicked(b):
    update_graph(period_radio.value, bank_radio.value, currency_radio.value)

def update_graph(period, bank, currency):
    # Определяем функцию агрегации в зависимости от выбранного периода
    if period == 'Дни':
        date_trunc = 'date'
        date_format = '%Y-%m-%d'  # Формат даты для дней
    elif period == 'Месяцы':
        date_trunc = "DATE_TRUNC('month', date)"
        date_format = '%Y-%m'  # Формат даты для месяцев
    elif period == 'Кварталы':
        date_trunc = "DATE_TRUNC('quarter', date)"
        date_format = '%Y-%q'  # Формат даты для кварталов

    query = f"""
    SELECT 
        {date_trunc} AS period,
        AVG(planned_limit) AS avg_planned_limit, 
        AVG(actual_usage) AS avg_actual_usage 
    FROM 
        resources_usage 
    WHERE 
        EXTRACT(YEAR FROM date) = 2022 
        AND bank = '{bank}'
        AND currency = '{currency}'
    GROUP BY period
    ORDER BY period;
    """
    df = load_data(query)
    with output:
        clear_output(wait=True)
        if df is not None and not df.empty:
            df['period'] = pd.to_datetime(df['period']).dt.strftime(date_format)
            plot_data(df, 'Период', 'Ресурсы', f'График использования ресурсов за 2022 год ({period}) - {bank} - {currency}')
        else:
            print("Не удалось загрузить данные или данные отсутствуют.")


button.on_click(on_button_clicked)

# Организация виджетов
widgets_container = widgets.VBox([bank_radio, currency_radio, period_radio, button, output])
display(widgets_container)

VBox(children=(RadioButtons(description='Банк:', layout=Layout(margin='10px', width='300px'), options=('ТРАСТ'…

## Заключение

В данном проекте была успешно разработана автоматизированная система для загрузки и анализа финансовых данных различных банков. Я создал и оптимизировал базу данных, обеспечил её реалистичными данными, и разработал интерактивные инструменты для визуального анализа данных, что позволило улучшить понимание ключевых финансовых показателей.

### Основные достижения:
- **Применение визуализации данных:** Разработка графических представлений помогла в демонстрации динамики и тенденций в использовании ресурсов, что упрощает процесс принятия решений на основе данных.
- **Оптимизация процессов:** Усовершенствованные SQL-запросы и индексация базы данных существенно сократили время ответа на запросы, повысив тем самым эффективность работы с большим объемом данных.

### Рекомендации:
- **Адаптация стратегий ресурсного планирования:** Рекомендуется пересмотреть стратегии распределения ресурсов, основываясь на аналитических данных о сезонности и валютных колебаниях.
- **Расширение аналитических функций:** Включение дополнительных аналитических инструментов углубит анализ и обеспечит более точное предсказание тенденций.

### Планы на будущее:
- **Интеграция с внешними источниками данных:** Планируется расширение базы данных путем интеграции информации о курсах валют и экономических индикаторах, что позволит проводить более глубокий анализ.
- **Разработка моделей машинного обучения:** Предполагается создание прогностических моделей для предсказания изменений в использовании ресурсов, что способствует более точному планированию бюджета.

Этот проект не только показал возможности современных аналитических технологий в области обработки и анализа больших данных, но и предоставил ценные инструменты для стратегического планирования и оптимизации финансовых операций в различных банках.
