# Data Aggregation and Group Operations


In [1]:
import pandas as pd
import numpy as np

In [2]:
data = {
    'Дата': ['2023-01-01', '2023-01-05', '2023-02-10', '2023-02-15', '2023-03-03'],
    'Сумма': [100, 200, 150, 300, 250],
    'Тип': ['покупка', 'перевод', 'покупка', 'снятие', 'перевод'],
    'Клиент': ['Клиент1', 'Клиент2', 'Клиент1', 'Клиент3', 'Клиент2']
} 


In [3]:
# Преобразуйте столбец 'Дата' в формат datetime
# Группируйте данные по клиентам и суммируем сумму транзакций для каждого клиента
# Группируйте данные по типу транзакции и вычисляем среднюю сумму транзакций
# Добавьте столбец с месяцем транзакции
# Группируйте данные по клиентам и месяцам и суммируем сумму транзакций для каждого клиента в каждом месяце
# примините основные агрегирующие операции : 
# Посчитать общую сумму операций для каждого клиента.
# Найти среднюю сумму операции для каждого типа операции.
# Определить день с наибольшей суммой операций.
# Рассчитать общую сумму операций за каждый месяц
# Найти клиента с наибольшей общей суммой операций
# Посчитать общее количество операций для каждого типа
# Определить день с наибольшим количеством операций
# Найти клиента, который совершил наибольшее количество операций

In [4]:
# Преобразуйте столбец 'Дата' в формат datetime
df = pd.DataFrame(data)

df['Дата'] = pd.to_datetime(df['Дата'])

print(df)

        Дата  Сумма      Тип   Клиент
0 2023-01-01    100  покупка  Клиент1
1 2023-01-05    200  перевод  Клиент2
2 2023-02-10    150  покупка  Клиент1
3 2023-02-15    300   снятие  Клиент3
4 2023-03-03    250  перевод  Клиент2


In [5]:
#Группируйте данные по клиентам и суммируем сумму транзакций для каждого клиента
df_grouped = df.groupby('Клиент')['Сумма'].sum().reset_index()

print(df_grouped)

    Клиент  Сумма
0  Клиент1    250
1  Клиент2    450
2  Клиент3    300


In [6]:
# Группируйте данные по типу транзакции и вычисляем среднюю сумму транзакций
mean_transactions = df.groupby('Тип')['Сумма'].mean()

print(mean_transactions)

Тип
перевод    225.0
покупка    125.0
снятие     300.0
Name: Сумма, dtype: float64


In [7]:
# Добавьте столбец с месяцем транзакции
df['Месяц'] = df['Дата'].dt.month

print(df)

        Дата  Сумма      Тип   Клиент  Месяц
0 2023-01-01    100  покупка  Клиент1      1
1 2023-01-05    200  перевод  Клиент2      1
2 2023-02-10    150  покупка  Клиент1      2
3 2023-02-15    300   снятие  Клиент3      2
4 2023-03-03    250  перевод  Клиент2      3


In [8]:
# Группируйте данные по клиентам и месяцам и суммируем сумму транзакций для каждого клиента в каждом месяце
df_grouped = df.groupby(['Клиент', 'Месяц'])['Сумма'].sum().reset_index()

print(df_grouped)

    Клиент  Месяц  Сумма
0  Клиент1      1    100
1  Клиент1      2    150
2  Клиент2      1    200
3  Клиент2      3    250
4  Клиент3      2    300


In [9]:
df_grouped = df.groupby(['Клиент', 'Месяц'])['Сумма'].agg(['sum', 'mean', 'min', 'max']).reset_index()

print(df_grouped)

    Клиент  Месяц  sum   mean  min  max
0  Клиент1      1  100  100.0  100  100
1  Клиент1      2  150  150.0  150  150
2  Клиент2      1  200  200.0  200  200
3  Клиент2      3  250  250.0  250  250
4  Клиент3      2  300  300.0  300  300


In [10]:
# примините основные агрегирующие операции : 
df_grouped = df.groupby(['Клиент', 'Месяц'])['Сумма'].agg(['sum', 'mean', 'min', 'max']).reset_index()

print(df_grouped)

    Клиент  Месяц  sum   mean  min  max
0  Клиент1      1  100  100.0  100  100
1  Клиент1      2  150  150.0  150  150
2  Клиент2      1  200  200.0  200  200
3  Клиент2      3  250  250.0  250  250
4  Клиент3      2  300  300.0  300  300


In [11]:
# Посчитать общую сумму операций для каждого клиента.
total_operations = df.groupby('Клиент')['Сумма'].sum()

print(total_operations)

Клиент
Клиент1    250
Клиент2    450
Клиент3    300
Name: Сумма, dtype: int64


In [12]:
# Найти среднюю сумму операции для каждого типа операции.
average_transaction_amount = df.groupby('Тип')['Сумма'].mean()

print(average_transaction_amount)

Тип
перевод    225.0
покупка    125.0
снятие     300.0
Name: Сумма, dtype: float64


In [13]:
# Определить день с наибольшей суммой операций.
total_transactions_per_day = df.groupby('Дата')['Сумма'].sum()
day_with_max_transactions = total_transactions_per_day.idxmax()

print("День с наибольшей суммой операций:", day_with_max_transactions)

День с наибольшей суммой операций: 2023-02-15 00:00:00


In [14]:
# Рассчитать общую сумму операций за каждый месяц
total_transactions_per_month = df.groupby('Месяц')['Сумма'].sum()

print(total_transactions_per_month)

Месяц
1    300
2    450
3    250
Name: Сумма, dtype: int64


In [15]:
# Найти клиента с наибольшей общей суммой операций
total_transactions_per_client = df.groupby('Клиент')['Сумма'].sum()
client_with_max_total_transactions = total_transactions_per_client.idxmax()

print("Клиент с наибольшей общей суммой операций:", client_with_max_total_transactions)

Клиент с наибольшей общей суммой операций: Клиент2


In [16]:
# Группируем данные по типу операции и считаем количество операций для каждого типа
total_operations_per_type = df.groupby('Тип').size()

print(total_operations_per_type)

Тип
перевод    2
покупка    2
снятие     1
dtype: int64


In [17]:
# Определить день с наибольшим количеством операций
total_operations_per_day = df.groupby('Дата').size()

day_with_max_operations = total_operations_per_day.idxmax()

print("День с наибольшим количеством операций:", day_with_max_operations)

День с наибольшим количеством операций: 2023-01-01 00:00:00


In [18]:
#Найти клиента, который совершил наибольшее количество операций
total_operations_per_client = df.groupby('Клиент').size()

client_with_max_operations = total_operations_per_client.idxmax()

print("Клиент с наибольшим количеством операций:", client_with_max_operations)

Клиент с наибольшим количеством операций: Клиент1
