# Анализ выгрузки финансов

Эта тетрадка сделана, чтобы разрабатывать и тестировать функции бота

## Загрузка данных

In [None]:
# импорт библиотек
# работа с данными
import numpy as np
import pandas as pd

# графика
from matplotlib import pyplot as plt
import seaborn as sns

In [None]:
# чтение csv
df = pd.read_csv('fin.csv', sep=';')

## Предобработка данных

In [None]:
# обзор данных
df.head()

In [None]:
# анализ типов данных
df.info()

In [None]:
# удаление лишних данных
df = df[['Дата операции', 'Сумма операции', 'Категория', 'Описание']]
#df.head()

In [None]:
# переименование столбцов
df.columns = ['dt', 'sum', 'category', 'description']
df.head()

In [None]:
# приведение типов
df['dt'] = pd.to_datetime(df['dt'], dayfirst=True)
df['sum'] = pd.to_numeric(df['sum'].str.replace(',', '.'))

In [None]:
# Установка индекса
df.index = df['dt']

In [None]:
# сортировка по индексу
df.sort_index(inplace=True)

In [None]:
# добавление столбца баланса
df['balance'] = df['sum'].cumsum()

In [None]:
# анализ содержимого
df.describe(include='all').T

## Исследовательский анализ

In [None]:
# график трат
fig, ax = plt.subplots(figsize=(12, 4))
ax.plot(df['sum'])
ax.set_title('Расходы за всё время')
ax.set_xlabel('Дата')
ax.set_ylabel('Расходы')
plt.show()

In [None]:
# диаграмма частотности трат по категориям
fig, ax = plt.subplots(figsize=(4, 4))
ax.barh(df['category'].value_counts().sort_values(ascending=False).head(10).index, 
        df['category'].value_counts().sort_values(ascending=False).head(10))
ax.set_xlabel('Количество')
ax.set_ylabel('Категория')
ax.invert_yaxis()
ax.set_title('Частотность по категориям')
plt.show()

In [None]:
# диаграмма суммы трат по категориям
fig, ax = plt.subplots(figsize=(4, 4))
ax.barh(df.pivot_table(index='category', values='sum', aggfunc='sum').sort_values(by='sum', ascending=True)['sum'].head(10).index, 
        df.pivot_table(index='category', values='sum', aggfunc='sum').sort_values(by='sum', ascending=True)['sum'].head(10))
ax.set_xlabel('Сумма расходов')
ax.set_ylabel('Категория')
ax.invert_yaxis()
ax.invert_xaxis()
ax.set_title('Сумма расходов по категориям')
plt.show()

In [None]:
# диаграмма частотности трат по описанию
fig, ax = plt.subplots(figsize=(4, 4))
ax.barh(df['description'].value_counts().sort_values(ascending=False).head(10).index, 
        df['description'].value_counts().sort_values(ascending=False).head(10))
ax.set_xlabel('Количество')
ax.set_ylabel('Описание')
ax.invert_yaxis()
ax.set_title('Частотность по описанию покупок')
plt.show()

In [None]:
# диаграмма суммы трат по описанию
fig, ax = plt.subplots(figsize=(4, 4))
ax.barh(df.pivot_table(index='description', values='sum', aggfunc='sum').sort_values(by='sum', ascending=True)['sum'].head(10).index, 
        df.pivot_table(index='description', values='sum', aggfunc='sum').sort_values(by='sum', ascending=True)['sum'].head(10))
ax.set_xlabel('Сумма расходов')
ax.set_ylabel('Описание')
ax.invert_yaxis()
ax.invert_xaxis()
ax.set_title('Сумма трат по описанию покупок')
plt.show()

## Разработка функционала бота

**Функционал бота**
- Отображение баланса (на подобие кумулятивной функции);
- Сравнение годовых изменений баланса (сабплоты);
- Сравнение месячных трат по категориям;
- Сравнение месячных трат по частоте;
- Оценка среднемесячных расходов;
- Прогноз времени опустошения бюджета.

In [None]:
# кумулятивное отображение баланса
df['balance'].plot()


In [None]:
# годовые изменения баланса

In [None]:
# месячные траты по категориям

In [None]:
# месячные траты по частоте

In [None]:
# оценка среднемесячных расходов

In [None]:
# расчет времени опустошения бюджета