In [68]:
import pandas as pd
import plotly.express as px

In [69]:
df = pd.read_csv('sales_data.csv')
df

Unnamed: 0,Фрукт,Магазин,Дата,Количество,Цена
0,Яблоки,Фермер,2023-01-01,350,100.0
1,Апельсины,Фермер,2023-01-01,380,120.0
2,Манго,Фермер,2023-01-01,120,480.0
3,Виноград,Фермер,2023-01-01,300,150.0
4,Лимоны,Фермер,2023-01-01,150,130.0
...,...,...,...,...,...
163,Апельсины,Радуга,2023-07-01,200,110.0
164,Манго,Радуга,2023-07-01,280,550.0
165,Виноград,Радуга,2023-07-01,260,220.0
166,Лимоны,Радуга,2023-07-01,130,150.0


In [70]:
df_sales = df.groupby(df.Магазин)['Количество'].sum().reset_index()
df_sales

Unnamed: 0,Магазин,Количество
0,Континент,15845
1,Органика,11330
2,Радуга,11385
3,Фермер,10135


In [71]:
fig1 = px.pie(df_sales, names=df_sales.Магазин, values=df_sales.Количество, title='Продажи в разрезе магазинов')
fig1.show()

Сначала сделаем общий график, чтобы видеть динамику продаж фруктов в разрезе магазинов и в сравнении друг с другом.

In [72]:
df_stores = df.groupby(['Магазин', 'Фрукт'])['Количество'].sum().reset_index()
df_stores

Unnamed: 0,Магазин,Фрукт,Количество
0,Континент,Апельсины,3080
1,Континент,Бананы,4510
2,Континент,Виноград,2190
3,Континент,Лимоны,1465
4,Континент,Манго,1640
5,Континент,Яблоки,2960
6,Органика,Апельсины,1800
7,Органика,Бананы,3530
8,Органика,Виноград,1320
9,Органика,Лимоны,1190


In [73]:
fig2 = px.line(df_stores, x='Фрукт', y="Количество",
               title='Продажи в разрезе фруктов в разрезе магазинов',
               color="Магазин",
               labels={"Фрукт": "Фрукты", "Магазин": '<b>Магазины</b>',
                       'Количество': 'Количество (шт)'},
               color_discrete_map={'Континент': 'blue', 'Радуга': 'red', 'Органика': 'green', 'Фермер': 'violet'})
fig2.show()

In [74]:
df_cont = df[df.Магазин == 'Континент'][['Фрукт', 'Количество']].groupby(df.Фрукт)['Количество'].sum().reset_index()
df_cont

Unnamed: 0,Фрукт,Количество
0,Апельсины,3080
1,Бананы,4510
2,Виноград,2190
3,Лимоны,1465
4,Манго,1640
5,Яблоки,2960


In [75]:
fig3 = px.bar(df_cont, x='Фрукт', y="Количество",
              title='Продажи в разрезе фруктов в магазине Континент',
              labels={"Фрукт": "Фрукты", 'Количество': 'Количество (шт)'}, color='Фрукт')
fig3.show()

In [76]:
df_rad = df[df.Магазин == 'Радуга'][['Фрукт', 'Количество']].groupby(df.Фрукт)['Количество'].sum().reset_index()
df_rad

Unnamed: 0,Фрукт,Количество
0,Апельсины,1490
1,Бананы,3380
2,Виноград,1900
3,Лимоны,1155
4,Манго,2060
5,Яблоки,1400


In [77]:
fig4 = px.bar(df_rad, x='Фрукт', y="Количество",
              title='Продажи в разрезе фруктов в магазине Радуга',
              labels={"Фрукт": "Фрукты", 'Количество': 'Количество (шт)'}, color='Фрукт')
fig4.show()

In [78]:
df_org = df[df.Магазин == 'Органика'][['Фрукт', 'Количество']].groupby(df.Фрукт)['Количество'].sum().reset_index()
df_org

Unnamed: 0,Фрукт,Количество
0,Апельсины,1800
1,Бананы,3530
2,Виноград,1320
3,Лимоны,1190
4,Манго,1510
5,Яблоки,1980


In [79]:
fig5 = px.bar(df_org, x='Фрукт', y="Количество",
              title='Продажи в разрезе фруктов в магазине Органика',
              labels={"Фрукт": "Фрукты", 'Количество': 'Количество (шт)'}, color='Фрукт')
fig5.show()

In [80]:
df_ferm = df[df.Магазин == 'Фермер'][['Фрукт', 'Количество']].groupby(df.Фрукт)['Количество'].sum().reset_index()
df_ferm

Unnamed: 0,Фрукт,Количество
0,Апельсины,1640
1,Бананы,3560
2,Виноград,840
3,Лимоны,1415
4,Манго,1110
5,Яблоки,1570


In [81]:
fig6 = px.bar(df_rad, x='Фрукт', y="Количество",
              title='Продажи в разрезе фруктов в магазине Фермер',
              labels={"Фрукт": "Фрукты", 'Количество': 'Количество (шт)'}, color='Фрукт')
fig6.show()

Сделаем аналитику по ценам в разрезе товаров для всех магазинов. Сначала посчитаем средневзвешенную цену за 1 кг для каждого вида фруктов в разрезе магазинов. Далее построим более наглядную на мой взгляд диаграмму.

In [66]:
df_price = df.copy()
df_price['Сумма'] = df_price.Количество * df_price.Цена
df_price = df_price.groupby(['Магазин','Фрукт'])[['Количество','Сумма']].sum().reset_index()
df_price['Цена за 1 кг/руб'] = df_price.Сумма / df_price.Количество
df_price['Цена за 1 кг/руб'] = df_price['Цена за 1 кг/руб'].astype(int)
df_price

Unnamed: 0,Магазин,Фрукт,Количество,Сумма,Цена за 1 кг/руб
0,Континент,Апельсины,3080,415200.0,134
1,Континент,Бананы,4510,382320.0,84
2,Континент,Виноград,2190,453500.0,207
3,Континент,Лимоны,1465,167300.0,114
4,Континент,Манго,1640,949000.0,578
5,Континент,Яблоки,2960,348200.0,117
6,Органика,Апельсины,1800,220000.0,122
7,Органика,Бананы,3530,315800.0,89
8,Органика,Виноград,1320,251600.0,190
9,Органика,Лимоны,1190,132900.0,111


In [67]:
fig7 = px.histogram(df_price, x='Магазин', y="Цена за 1 кг/руб",
               title='Цены на фрукты за 1 кг в разрезе магазинов',
               color="Фрукт",
               labels={"Магазин": "Магазины", "Фрукт": '<b>Фрукты</b>',
                       'Цена за 1 кг/руб': 'Цена за 1 руб/кг (руб)'},
               color_discrete_map={'Яблоки': 'blue', 'Апельсины': 'red', 'Манго': 'green', 'Виноград': 'violet',
                                   'Лимоны': 'yellow', 'Бананы': 'orange'}, barmode='group')
fig7.show()