# Zarlykov Kelsinbek Ain-1-21
# Data Aggregation and Group Operations


In [20]:
import pandas as pd
import numpy as np

In [21]:
data = {
    'Дата': ['2023-01-01', '2023-01-05', '2023-02-10', '2023-02-15', '2023-03-03'],
    'Сумма': [100, 200, 150, 300, 250],
    'Тип': ['покупка', 'перевод', 'покупка', 'снятие', 'перевод'],
    'Клиент': ['Клиент1', 'Клиент2', 'Клиент1', 'Клиент3', 'Клиент2']
} 


In [22]:
# Преобразуйте столбец 'Дата' в формат datetime
data['Дата'] = pd.to_datetime(data['Дата'])


In [23]:
# Группируйте данные по клиентам и суммируем сумму транзакций для каждого клиента
df = pd.DataFrame(data)
grouped_data = df.groupby('Клиент')['Сумма'].sum().reset_index()

In [24]:
# Группируйте данные по типу транзакции и вычисляем среднюю сумму транзакций
group_data = df.groupby('Тип')['Сумма'].mean().reset_index()

In [25]:
# Добавьте столбец с месяцем транзакции
df['Месяц'] = df['Дата'].dt.month

In [26]:
# Группируйте данные по клиентам и месяцам и суммируем сумму транзакций для каждого клиента в каждом месяце
grouped_data_every_month = df.groupby(['Клиент', df['Дата'].dt.month])['Сумма'].sum().reset_index()


In [27]:
# примините основные агрегирующие операции : 
# Сумма суммы транзакций по типу
sum_by_type = df.groupby('Тип')['Сумма'].sum()
print("Сумма суммы транзакций по типу:\n", sum_by_type, '\n')

# Среднее значение суммы транзакций по клиентам
mean_by_client = df.groupby('Клиент')['Сумма'].mean()
print("Среднее значение суммы транзакций по клиентам:\n", mean_by_client, '\n')

# Минимальная сумма транзакции по месяцам
min_by_month = df.groupby(df['Дата'].dt.month)['Сумма'].min()
print("Минимальная сумма транзакции по месяцам:\n", min_by_month, '\n')

# Максимальная сумма транзакции по клиентам и типу
max_by_client_type = df.groupby(['Клиент', 'Тип'])['Сумма'].max()
print("Максимальная сумма транзакции по клиентам и типу:\n", max_by_client_type, '\n')


Сумма суммы транзакций по типу:
 Тип
перевод    450
покупка    250
снятие     300
Name: Сумма, dtype: int64 

Среднее значение суммы транзакций по клиентам:
 Клиент
Клиент1    125.0
Клиент2    225.0
Клиент3    300.0
Name: Сумма, dtype: float64 

Минимальная сумма транзакции по месяцам:
 Дата
1    100
2    150
3    250
Name: Сумма, dtype: int64 

Максимальная сумма транзакции по клиентам и типу:
 Клиент   Тип    
Клиент1  покупка    150
Клиент2  перевод    250
Клиент3  снятие     300
Name: Сумма, dtype: int64 


In [28]:
# Посчитать общую сумму операций для каждого клиента.
total_sum_by_client = df.groupby('Клиент')['Сумма'].sum().reset_index()
print(total_sum_by_client)


    Клиент  Сумма
0  Клиент1    250
1  Клиент2    450
2  Клиент3    300


In [29]:
# Найти среднюю сумму операции для каждого типа операции.
# Общая сумма операций для каждого клиента
total_sum_by_client = df.groupby('Клиент')['Сумма'].sum()
print("Общая сумма операций для каждого клиента:\n", total_sum_by_client, '\n')

# Средняя сумма операции для каждого типа операции
average_sum_by_type = df.groupby('Тип')['Сумма'].mean()
print("Средняя сумма операции для каждого типа операции:\n", average_sum_by_type, '\n')

Общая сумма операций для каждого клиента:
 Клиент
Клиент1    250
Клиент2    450
Клиент3    300
Name: Сумма, dtype: int64 

Средняя сумма операции для каждого типа операции:
 Тип
перевод    225.0
покупка    125.0
снятие     300.0
Name: Сумма, dtype: float64 


In [30]:
# Определить день с наибольшей суммой операций.
# Группировка данных по дню и подсчет общей суммы операций в каждый день
sum_by_day = df.groupby(df['Дата'].dt.date)['Сумма'].sum()

# Нахождение дня с наибольшей суммой операций
max_sum_day = sum_by_day.idxmax()

print("День с наибольшей суммой операций:", max_sum_day)
print("Общая сумма операций в этот день:", sum_by_day[max_sum_day])

День с наибольшей суммой операций: 2023-02-15
Общая сумма операций в этот день: 300


In [31]:
# Рассчитать общую сумму операций за каждый месяц
total_sum_by_month = df.groupby(df['Дата'].dt.to_period('M'))['Сумма'].sum()

# Вывод результатов
print("Общая сумма операций за каждый месяц:\n", total_sum_by_month)

Общая сумма операций за каждый месяц:
 Дата
2023-01    300
2023-02    450
2023-03    250
Freq: M, Name: Сумма, dtype: int64


In [32]:
# Группировка данных по клиенту и подсчет общей суммы операций для каждого клиента
total_sum_by_client = df.groupby('Клиент')['Сумма'].sum()

# Нахождение клиента с наибольшей общей суммой операций
max_sum_client = total_sum_by_client.idxmax()

print("Клиент с наибольшей общей суммой операций:", max_sum_client)
print("Общая сумма операций для этого клиента:", total_sum_by_client[max_sum_client])


Клиент с наибольшей общей суммой операций: Клиент2
Общая сумма операций для этого клиента: 450


In [33]:
# Посчитать общее количество операций для каждого типа
total_operations_by_type = df['Тип'].value_counts()

# Вывод результатов
print("Общее количество операций для каждого типа:\n", total_operations_by_type)

Общее количество операций для каждого типа:
 Тип
покупка    2
перевод    2
снятие     1
Name: count, dtype: int64


In [34]:
# Подсчет количества операций для каждого дня
operations_by_day = df['Дата'].value_counts()

# Определить день с наибольшим количеством операций
max_operations_day = operations_by_day.idxmax()

print("День с наибольшим количеством операций:", max_operations_day)
print("Количество операций в этот день:", operations_by_day[max_operations_day])


День с наибольшим количеством операций: 2023-01-01 00:00:00
Количество операций в этот день: 1


In [35]:
# Подсчет количества операций для каждого клиента
operations_by_client = df['Клиент'].value_counts()

# Найти клиента, который совершил наибольшее количество операций
max_operations_client = operations_by_client.idxmax()

print("Клиент с наибольшим количеством операций:", max_operations_client)
print("Количество операций для этого клиента:", operations_by_client[max_operations_client])

Клиент с наибольшим количеством операций: Клиент1
Количество операций для этого клиента: 2
