# **Практическое задание: Анализ продаж интернет-магазина**

## **Цель задания**

Закрепить все изученные темы по Series pandas на практике, выполнив полный анализ данных о продажах.

## **Исходные данные**

У вас есть данные о продажах интернет-магазина за последний месяц:

In [1]:
import pandas as pd
import numpy as np

# Данные о продуктах
product_ids = [101, 102, 103, 104, 105, 106, 107, 108, 109, 110]
product_names = [
    'Ноутбук Dell XPS 13',
    'Смартфон iPhone 15',
    'Наушники Sony WH-1000XM5',
    'Планшет iPad Air',
    'Умные часы Apple Watch',
    'Фотоаппарат Canon EOS R6',
    'Игровая консоль PlayStation 5',
    'Телевизор Samsung QLED',
    'Кофемашина DeLonghi',
    'Робот-пылесос iRobot'
]
categories = ['Электроника', 'Электроника', 'Аксессуары', 'Электроника', 'Аксессуары',
              'Электроника', 'Развлечения', 'Электроника', 'Бытовая техника', 'Бытовая техника']

# Данные о продажах
units_sold = [45, 120, 85, 60, 90, 25, 70, 35, 40, 55]
unit_prices = [899.99, 999.99, 349.99, 749.99, 399.99, 2499.99, 499.99, 1299.99, 599.99, 449.99]
discounts = [0.10, 0.05, 0.15, 0.00, 0.20, 0.08, 0.12, 0.05, 0.10, 0.07]
return_rates = [0.02, 0.01, 0.03, 0.01, 0.04, 0.02, 0.05, 0.01, 0.03, 0.02]


## **Часть 1: Создание и базовый анализ**

### **Задача 1.1: Изучение структуры Series**

```python
# 1. Создайте Series для каждого набора данных
# 2. Выведите информацию о каждой Series: тип, размер, индекс
# 3. Проверьте, есть ли пропущенные значения в каждой Series
```


In [2]:
# Создайте Series для каждого набора данных
products = pd.Series(product_names, index=product_ids, name='Продукт')
category_series = pd.Series(categories, index=product_ids, name='Категория')
units = pd.Series(units_sold, index=product_ids, name='Продано_шт')
prices = pd.Series(unit_prices, index=product_ids, name='Цена_за_шт')
discount_series = pd.Series(discounts, index=product_ids, name='Скидка')
returns = pd.Series(return_rates, index=product_ids, name='Процент_возвратов')

In [3]:
# Выведите информацию о каждой Series: тип, размер, индекс
print(products.dtype, products.size, products.index)
print(category_series.dtype, category_series.size, category_series.index)
print(units.dtype, units.size, units.index)
print(prices.dtype, prices.size, prices.index)
print(discount_series.dtype, discount_series.size, discount_series.index)
print(returns.dtype, returns.size, returns.index)

object 10 Index([101, 102, 103, 104, 105, 106, 107, 108, 109, 110], dtype='int64')
object 10 Index([101, 102, 103, 104, 105, 106, 107, 108, 109, 110], dtype='int64')
int64 10 Index([101, 102, 103, 104, 105, 106, 107, 108, 109, 110], dtype='int64')
float64 10 Index([101, 102, 103, 104, 105, 106, 107, 108, 109, 110], dtype='int64')
float64 10 Index([101, 102, 103, 104, 105, 106, 107, 108, 109, 110], dtype='int64')
float64 10 Index([101, 102, 103, 104, 105, 106, 107, 108, 109, 110], dtype='int64')


In [4]:
# Проверьте, есть ли пропущенные значения в каждой Series
print(products.isnull().any())
print(category_series.isnull().any())
print(units.isnull().any())
print(prices.isnull().any())
print(discount_series.isnull().any())
print(returns.isnull().any())

False
False
False
False
False
False



### **Задача 1.2: Работа с индексами**

```python
# 1. Переименуйте индексы, добавив префикс 'P_' (например, P_101 вместо 101)
# 2. Отсортируйте Series 'products' по алфавиту названий продуктов
# 3. Отсортируйте Series 'prices' по убыванию цен
```

In [5]:
# Переименуйте индексы, добавив префикс 'P_' (например, P_101 вместо 101)
products.index = 'P_' + products.index.astype(str)
category_series.index = 'P_' + category_series.index.astype(str)
units.index = 'P_' + units.index.astype(str)
prices.index = 'P_' + prices.index.astype(str)
discount_series.index = 'P_' + discount_series.index.astype(str)
returns.index = 'P_' + returns.index.astype(str)

In [6]:
# Отсортируйте Series 'products' по алфавиту названий продуктов
products = products.sort_values()
print(products)

P_107    Игровая консоль PlayStation 5
P_109              Кофемашина DeLonghi
P_103         Наушники Sony WH-1000XM5
P_101              Ноутбук Dell XPS 13
P_104                 Планшет iPad Air
P_110             Робот-пылесос iRobot
P_102               Смартфон iPhone 15
P_108           Телевизор Samsung QLED
P_105           Умные часы Apple Watch
P_106         Фотоаппарат Canon EOS R6
Name: Продукт, dtype: object


In [7]:
# Отсортируйте Series 'prices' по убыванию цен
prices = prices.sort_values(ascending=False)
print(prices)

P_106    2499.99
P_108    1299.99
P_102     999.99
P_101     899.99
P_104     749.99
P_109     599.99
P_107     499.99
P_110     449.99
P_105     399.99
P_103     349.99
Name: Цена_за_шт, dtype: float64



### **Задача 1.3: Доступ к данным**

```python
# 1. Получите цену продукта с ID 103 (тремя способами)
# 2. Получите продукты с ID 101, 104, 107
# 3. Получите последние 3 продукта по позиции
# 4. Получите все продукты дороже 1000 единиц
```

In [8]:
# Получите цену продукта с ID 103 (тремя способами)
print(prices.loc['P_103'])
print(prices['P_103'])
print(prices.iloc[list(prices.index).index('P_103')])

349.99
349.99
349.99


In [9]:
# Получите продукты с ID 101, 104, 107
print(products.loc[['P_101', 'P_104', 'P_107']])

P_101              Ноутбук Dell XPS 13
P_104                 Планшет iPad Air
P_107    Игровая консоль PlayStation 5
Name: Продукт, dtype: object


In [10]:
# Получите последние 3 продукта по позиции
products.sort_index(inplace=True)
print(products.tail(3))

P_108    Телевизор Samsung QLED
P_109       Кофемашина DeLonghi
P_110      Робот-пылесос iRobot
Name: Продукт, dtype: object


In [11]:
# Получите все продукты дороже 1000 единиц
print(products[prices > 1000])

P_106    Фотоаппарат Canon EOS R6
P_108      Телевизор Samsung QLED
Name: Продукт, dtype: object



## **Часть 2: Векторные операции**

### **Задача 2.1: Расчет выручки**

```python
# 1. Рассчитайте выручку от каждого продукта (продано_шт * цена_за_шт)
# 2. Учтите скидки: выручка_со_скидкой = выручка * (1 - скидка)
# 3. Рассчитайте чистую выручку (за вычетом возвратов)
```


In [12]:
# Рассчитайте выручку от каждого продукта (продано_шт * цена_за_шт)
revenue = units * prices
print(revenue)

P_101     40499.55
P_102    119998.80
P_103     29749.15
P_104     44999.40
P_105     35999.10
P_106     62499.75
P_107     34999.30
P_108     45499.65
P_109     23999.60
P_110     24749.45
dtype: float64


In [13]:
# Учтите скидки: выручка_со_скидкой = выручка * (1 - скидка)
revenue_with_discount = revenue * (1 - discount_series)
print(revenue_with_discount)

P_101     36449.5950
P_102    113998.8600
P_103     25286.7775
P_104     44999.4000
P_105     28799.2800
P_106     57499.7700
P_107     30799.3840
P_108     43224.6675
P_109     21599.6400
P_110     23016.9885
dtype: float64


In [14]:
# Рассчитайте чистую выручку (за вычетом возвратов)
revenue_with_refunds = revenue_with_discount * (1 - returns)
print(revenue_with_refunds)

P_101     35720.603100
P_102    112858.871400
P_103     24528.174175
P_104     44549.406000
P_105     27647.308800
P_106     56349.774600
P_107     29259.414800
P_108     42792.420825
P_109     20951.650800
P_110     22556.648730
dtype: float64



### **Задача 2.2: Цепочка операций**

```python
# 1. Создайте Series с итоговой ценой после скидки для каждого продукта
# 2. Рассчитайте общее количество проданных единиц по категориям
# 3. Рассчитайте среднюю цену продукта в каждой категории
```


In [15]:
# Создайте Series с итоговой ценой после скидки для каждого продукта
final_prices = prices * (1 - discount_series)
print(final_prices)

P_101     809.9910
P_102     949.9905
P_103     297.4915
P_104     749.9900
P_105     319.9920
P_106    2299.9908
P_107     439.9912
P_108    1234.9905
P_109     539.9910
P_110     418.4907
dtype: float64


In [16]:
# Рассчитайте общее количество проданных единиц по категориям
total_units_by_category = units.groupby(category_series).sum()
print(total_units_by_category)

Категория
Аксессуары         175
Бытовая техника     95
Развлечения         70
Электроника        285
Name: Продано_шт, dtype: int64


In [17]:
# Рассчитайте среднюю цену продукта в каждой категории
average_price_by_category = prices.groupby(category_series).mean()
print(average_price_by_category)

Категория
Аксессуары          374.99
Бытовая техника     524.99
Развлечения         499.99
Электроника        1289.99
Name: Цена_за_шт, dtype: float64



## **Часть 3: Логические операции и фильтрация**

### **Задача 3.1: Фильтрация продуктов**

```python
# 1. Найдите все продукты категории "Электроника"
# 2. Найдите продукты, которые продались более 50 штук
# 3. Найдите продукты с ценой от 500 до 1000 единиц
# 4. Найдите продукты с высокой скидкой (>10%) и низким процентом возвратов (<3%)
```


In [18]:
# Найдите все продукты категории "Электроника"
electronics_products = products[category_series == 'Электроника']
print(electronics_products)

P_101         Ноутбук Dell XPS 13
P_102          Смартфон iPhone 15
P_104            Планшет iPad Air
P_106    Фотоаппарат Canon EOS R6
P_108      Телевизор Samsung QLED
Name: Продукт, dtype: object


In [19]:
# Найдите продукты, которые продались более 50 штук
print(products[units > 50])

P_102               Смартфон iPhone 15
P_103         Наушники Sony WH-1000XM5
P_104                 Планшет iPad Air
P_105           Умные часы Apple Watch
P_107    Игровая консоль PlayStation 5
P_110             Робот-пылесос iRobot
Name: Продукт, dtype: object


In [20]:
# Найдите продукты с ценой от 500 до 1000 единиц
print(products[(prices >= 500) & (prices <= 1000)])

P_101    Ноутбук Dell XPS 13
P_102     Смартфон iPhone 15
P_104       Планшет iPad Air
P_109    Кофемашина DeLonghi
Name: Продукт, dtype: object


In [21]:
# Найдите продукты с высокой скидкой (>10%) и низким процентом возвратов (<3%)
print(products[(discount_series > 0.10) & (returns < 0.03)])

Series([], Name: Продукт, dtype: object)



### **Задача 3.2: Категоризация**

```python
# 1. Создайте категорию продуктов по цене:
#    - Бюджетные: < 500
#    - Средние: 500-1000
#    - Премиум: > 1000
# 2. Создайте категорию по популярности (продано_шт):
#    - Хиты: > 100
#    - Популярные: 50-100
#    - Обычные: < 50
```


In [22]:
# 1. Создайте категорию продуктов по цене:
#    - Бюджетные: < 500
#    - Средние: 500-1000
#    - Премиум: > 1000

budget_products = products[prices < 500]
print(budget_products)

medium_products = products[(prices >= 500) & (prices <= 1000)]
print(medium_products)

premium_products = products[prices > 1000]
print(premium_products)

P_103         Наушники Sony WH-1000XM5
P_105           Умные часы Apple Watch
P_107    Игровая консоль PlayStation 5
P_110             Робот-пылесос iRobot
Name: Продукт, dtype: object
P_101    Ноутбук Dell XPS 13
P_102     Смартфон iPhone 15
P_104       Планшет iPad Air
P_109    Кофемашина DeLonghi
Name: Продукт, dtype: object
P_106    Фотоаппарат Canon EOS R6
P_108      Телевизор Samsung QLED
Name: Продукт, dtype: object


In [23]:
# 2. Создайте категорию по популярности (продано_шт):
#    - Хиты: > 100
#    - Популярные: 50-100
#    - Обычные: < 50

hit_products = products[units > 100]
print(hit_products)

popular_products = products[(units >= 50) & (units <= 100)]
print(popular_products)

ordinary_products = products[units < 50]
print(ordinary_products)

P_102    Смартфон iPhone 15
Name: Продукт, dtype: object
P_103         Наушники Sony WH-1000XM5
P_104                 Планшет iPad Air
P_105           Умные часы Apple Watch
P_107    Игровая консоль PlayStation 5
P_110             Робот-пылесос iRobot
Name: Продукт, dtype: object
P_101         Ноутбук Dell XPS 13
P_106    Фотоаппарат Canon EOS R6
P_108      Телевизор Samsung QLED
P_109         Кофемашина DeLonghi
Name: Продукт, dtype: object


## **Часть 4: Работа с пропущенными значениями**

### **Задача 4.1: Моделирование реальных данных**

# Добавьте пропуски в данные (имитация реальной ситуации)

In [24]:
np.random.seed(42)
prices_with_nan = prices.copy()
prices_with_nan.iloc[[2, 5, 8]] = np.nan

units_with_nan = units.copy()
units_with_nan.iloc[[1, 4, 7]] = np.nan # type: ignore


### **Задача 4.2: Обработка пропусков**

```python
# 1. Определите количество пропусков в каждой Series
# 2. Заполните пропуски в ценах медианной ценой по категории
# 3. Заполните пропуски в количестве продаж нулями
# 4. Сравните статистику до и после заполнения пропусков
```


In [25]:
# Определите количество пропусков в каждой Series
print(prices_with_nan.isnull().sum())
print(units_with_nan.isnull().sum())

3
3


In [26]:
# Заполните пропуски в ценах медианной ценой по категории
prices_with_nan = prices_with_nan.fillna(
    prices_with_nan.groupby(category_series).transform('median')
)

In [27]:
# Заполните пропуски в количестве продаж нулями
units_with_nan.fillna(0, inplace=True)

In [28]:
# Сравните статистику до и после заполнения пропусков
print(prices_with_nan.describe())
print(units_with_nan.describe())

count      10.000000
mean      864.990000
std       661.668766
min       349.990000
25%       449.990000
50%       624.990000
75%      1049.990000
max      2499.990000
Name: Цена_за_шт, dtype: float64
count    10.000000
mean     38.000000
std      30.840089
min       0.000000
25%       6.250000
50%      42.500000
75%      58.750000
max      85.000000
Name: Продано_шт, dtype: float64



## **Часть 5: Преобразование значений**

### **Задача 5.1: Форматирование данных**

```python
# 1. Приведите все названия продуктов к нижнему регистру
# 2. Удалите лишние пробелы в названиях продуктов
# 3. Преобразуйте цены в целые числа (округлите)
# 4. Преобразуйте проценты скидок в проценты с точностью до 2 знаков
```


In [29]:
# Приведите все названия продуктов к нижнему регистру
products = products.str.lower()
print(products)

P_101              ноутбук dell xps 13
P_102               смартфон iphone 15
P_103         наушники sony wh-1000xm5
P_104                 планшет ipad air
P_105           умные часы apple watch
P_106         фотоаппарат canon eos r6
P_107    игровая консоль playstation 5
P_108           телевизор samsung qled
P_109              кофемашина delonghi
P_110             робот-пылесос irobot
Name: Продукт, dtype: object


In [30]:
# Удалите лишние пробелы в названиях продуктов
products = products.str.strip()
print(products)

P_101              ноутбук dell xps 13
P_102               смартфон iphone 15
P_103         наушники sony wh-1000xm5
P_104                 планшет ipad air
P_105           умные часы apple watch
P_106         фотоаппарат canon eos r6
P_107    игровая консоль playstation 5
P_108           телевизор samsung qled
P_109              кофемашина delonghi
P_110             робот-пылесос irobot
Name: Продукт, dtype: object


In [31]:
# Преобразуйте цены в целые числа (округлите)
prices = prices.round().astype(int)
print(prices)

P_106    2500
P_108    1300
P_102    1000
P_101     900
P_104     750
P_109     600
P_107     500
P_110     450
P_105     400
P_103     350
Name: Цена_за_шт, dtype: int64


In [32]:
# Преобразуйте проценты скидок в проценты с точностью до 2 знаков
discount_series = discount_series.round(2)
print(discount_series)

P_101    0.10
P_102    0.05
P_103    0.15
P_104    0.00
P_105    0.20
P_106    0.08
P_107    0.12
P_108    0.05
P_109    0.10
P_110    0.07
Name: Скидка, dtype: float64



### **Задача 5.2: Создание новых признаков**

```python
# 1. Создайте Series с общей выручкой от каждого продукта
# 2. Создайте Series с маржинальностью (разница между ценой и себестоимостью)
#    (предположим, себестоимость = цена * 0.6)
# 3. Создайте Series с рентабельностью (прибыль / выручка)
```


In [33]:
# Создайте Series с общей выручкой от каждого продукта
revenue = units * prices
print(revenue)

P_101     40500
P_102    120000
P_103     29750
P_104     45000
P_105     36000
P_106     62500
P_107     35000
P_108     45500
P_109     24000
P_110     24750
dtype: int64


In [34]:
# Создайте Series с маржинальностью (разница между ценой и себестоимостью) (предположим, себестоимость = цена * 0.6)
margin = prices - (prices * 0.6)
print(margin)

P_106    1000.0
P_108     520.0
P_102     400.0
P_101     360.0
P_104     300.0
P_109     240.0
P_107     200.0
P_110     180.0
P_105     160.0
P_103     140.0
Name: Цена_за_шт, dtype: float64


In [35]:
# Создайте Series с рентабельностью (прибыль / выручка)
profit = revenue - (prices * 0.6 * units)
rentability = profit / revenue
print(rentability)

P_101    0.4
P_102    0.4
P_103    0.4
P_104    0.4
P_105    0.4
P_106    0.4
P_107    0.4
P_108    0.4
P_109    0.4
P_110    0.4
dtype: float64



## **Часть 6: Статистический анализ**

### **Задача 6.1: Описательная статистика**

```python
# 1. Рассчитайте основные статистики для цен и количества продаж
# 2. Найдите квартили для выручки
# 3. Рассчитайте стандартное отклонение и коэффициент вариации для цен
# 4. Постройте распределение продуктов по категориям
```


In [36]:
# Рассчитайте основные статистики для цен и количества продаж
print(prices.describe())
print(units.describe())

count      10.000000
mean      875.000000
std       645.604798
min       350.000000
25%       462.500000
50%       675.000000
75%       975.000000
max      2500.000000
Name: Цена_за_шт, dtype: float64
count     10.000000
mean      62.500000
std       29.178569
min       25.000000
25%       41.250000
50%       57.500000
75%       81.250000
max      120.000000
Name: Продано_шт, dtype: float64


In [37]:
# Найдите квартили для выручки
print(revenue.quantile([0.25, 0.5, 0.75]))

0.25    31062.5
0.50    38250.0
0.75    45375.0
dtype: float64


In [38]:
# Рассчитайте стандартное отклонение и коэффициент вариации для цен
print(prices.std())
print(prices.std() / prices.mean())

645.6047982748855
0.7378340551712977


In [39]:
# Постройте распределение продуктов по категориям
category_distribution = category_series.value_counts()
print(category_distribution)

Категория
Электроника        5
Аксессуары         2
Бытовая техника    2
Развлечения        1
Name: count, dtype: int64



### **Задача 6.2: Нормализация и ранжирование**

```python
# 1. Нормализуйте цены (минимаксная нормализация)
# 2. Стандартизируйте количество продаж (Z-нормализация)
# 3. Проранжируйте продукты по выручке (от самого прибыльного к самому убыточному)
# 4. Рассчитайте накопленную выручку
```


In [40]:
# Нормализуйте цены (минимаксная нормализация)
min_price = prices.min()
max_price = prices.max()
normalized_prices = (prices - min_price) / (max_price - min_price)
print(normalized_prices)

P_106    1.000000
P_108    0.441860
P_102    0.302326
P_101    0.255814
P_104    0.186047
P_109    0.116279
P_107    0.069767
P_110    0.046512
P_105    0.023256
P_103    0.000000
Name: Цена_за_шт, dtype: float64


In [41]:
# Стандартизируйте количество продаж (Z-нормализация)
print(units.std())
print(units.std() / units.mean())

29.178569000019326
0.4668571040003092


In [42]:
# Проранжируйте продукты по выручке (от самого прибыльного к самому убыточному)
total_spent = units * prices
ranked_products = total_spent.sort_values(ascending=False)
print(ranked_products)

P_102    120000
P_106     62500
P_108     45500
P_104     45000
P_101     40500
P_105     36000
P_107     35000
P_103     29750
P_110     24750
P_109     24000
dtype: int64


In [43]:
# Рассчитайте накопленную выручку
print(ranked_products.sum())

463000



## **Часть 7: Series как основа DataFrame**

### **Задача 7.1: Создание DataFrame**

```python
# 1. Создайте DataFrame из всех Series
# 2. Добавьте вычисляемые столбцы (выручка, прибыль и т.д.)
# 3. Извлеките отдельные столбцы обратно в Series и выполните операции
```


In [44]:
# Создайте DataFrame из всех Series
df = pd.DataFrame({
    'Продукт': products,
    'Категория': category_series,
    'Продано_шт': units,
    'Цена_за_шт': prices,
    'Скидка': discount_series,
    'Процент_возвратов': returns
})
print(df)

                             Продукт        Категория  Продано_шт  Цена_за_шт  \
P_101            ноутбук dell xps 13      Электроника          45         900   
P_102             смартфон iphone 15      Электроника         120        1000   
P_103       наушники sony wh-1000xm5       Аксессуары          85         350   
P_104               планшет ipad air      Электроника          60         750   
P_105         умные часы apple watch       Аксессуары          90         400   
P_106       фотоаппарат canon eos r6      Электроника          25        2500   
P_107  игровая консоль playstation 5      Развлечения          70         500   
P_108         телевизор samsung qled      Электроника          35        1300   
P_109            кофемашина delonghi  Бытовая техника          40         600   
P_110           робот-пылесос irobot  Бытовая техника          55         450   

       Скидка  Процент_возвратов  
P_101    0.10               0.02  
P_102    0.05               0.01  
P_1

In [45]:
# Добавьте вычисляемые столбцы (выручка, прибыль и т.д.)
prices.sort_index()
total_spent = units * prices
df["Выручка"] = total_spent
df["Прибыль"] = total_spent - (prices * 0.6 * units)
df["Рентабельность"] = df["Прибыль"] / df["Выручка"]
print(df)

                             Продукт        Категория  Продано_шт  Цена_за_шт  \
P_101            ноутбук dell xps 13      Электроника          45         900   
P_102             смартфон iphone 15      Электроника         120        1000   
P_103       наушники sony wh-1000xm5       Аксессуары          85         350   
P_104               планшет ipad air      Электроника          60         750   
P_105         умные часы apple watch       Аксессуары          90         400   
P_106       фотоаппарат canon eos r6      Электроника          25        2500   
P_107  игровая консоль playstation 5      Развлечения          70         500   
P_108         телевизор samsung qled      Электроника          35        1300   
P_109            кофемашина delonghi  Бытовая техника          40         600   
P_110           робот-пылесос irobot  Бытовая техника          55         450   

       Скидка  Процент_возвратов  Выручка  Прибыль  Рентабельность  
P_101    0.10               0.02    405

In [46]:
# Извлеките отдельные столбцы обратно в Series и выполните операции
s_units = df["Продано_шт"]
s_prices = df["Цена_за_шт"]
s_revenue = s_units * s_prices
print(s_revenue)

P_101     40500
P_102    120000
P_103     29750
P_104     45000
P_105     36000
P_106     62500
P_107     35000
P_108     45500
P_109     24000
P_110     24750
dtype: int64



### **Задача 7.2: Комплексный анализ**

```python
# 1. С помощью цепочки методов (method chaining):
#    - Отфильтруйте продукты категории "Электроника"
#    - Рассчитайте для них среднюю цену и общую выручку
#    - Отсортируйте по убыванию выручки
#    - Выведите топ-3 продукта
```


In [47]:
electronics_summary = (
    df[df["Категория"] == "Электроника"]
    .assign(Выручка=lambda x: x["Продано_шт"] * x["Цена_за_шт"])
    .groupby("Продукт")
    .agg(Средняя_Цена=("Цена_за_шт", "mean"), Общая_Выручка=("Выручка", "sum"))
    .sort_values(by="Общая_Выручка", ascending=False)
    .head(3)
)
print(electronics_summary)

                          Средняя_Цена  Общая_Выручка
Продукт                                              
смартфон iphone 15              1000.0         120000
фотоаппарат canon eos r6        2500.0          62500
телевизор samsung qled          1300.0          45500



## **Часть 8: Итоговый отчет**

### **Задача 8.1: Сводный анализ**

```python
# 1. Какие 3 продукта принесли наибольшую выручку?
# 2. Какая категория самая прибыльная?
# 3. Как скидки влияют на количество продаж?
# 4. Есть ли корреляция между ценой и процентом возвратов?
```


In [48]:
# Какие 3 продукта принесли наибольшую выручку?
top_3_products = df.sort_values(by="Выручка", ascending=False).head(3)
print(top_3_products["Продукт"])

P_102          смартфон iphone 15
P_106    фотоаппарат canon eos r6
P_108      телевизор samsung qled
Name: Продукт, dtype: object


In [49]:
# Какая категория самая прибыльная?
top_category = df.groupby("Категория")["Прибыль"].sum().idxmax()
print(top_category)

Электроника


In [50]:
# Как скидки влияют на количество продаж?
print(df.sort_values(by="Скидка", ascending=False))

# Скидки положительно влияют на количество продаж (чем выше скидка, тем чаще выше продажи),
#     но есть исключение в виде iPhone 15 (скидка 5%, но сам бренд по себе известный, поэтому много продаж)

                             Продукт        Категория  Продано_шт  Цена_за_шт  \
P_105         умные часы apple watch       Аксессуары          90         400   
P_103       наушники sony wh-1000xm5       Аксессуары          85         350   
P_107  игровая консоль playstation 5      Развлечения          70         500   
P_101            ноутбук dell xps 13      Электроника          45         900   
P_109            кофемашина delonghi  Бытовая техника          40         600   
P_106       фотоаппарат canon eos r6      Электроника          25        2500   
P_110           робот-пылесос irobot  Бытовая техника          55         450   
P_102             смартфон iphone 15      Электроника         120        1000   
P_108         телевизор samsung qled      Электроника          35        1300   
P_104               планшет ipad air      Электроника          60         750   

       Скидка  Процент_возвратов  Выручка  Прибыль  Рентабельность  
P_105    0.20               0.04    360

In [51]:
# Есть ли корреляция между ценой и процентом возвратов?
print(df[['Цена_за_шт', 'Процент_возвратов']].corr())

# По последним выходным данным, корреляция составляет -0.42 (сильно отрицательная)

                   Цена_за_шт  Процент_возвратов
Цена_за_шт           1.000000          -0.420731
Процент_возвратов   -0.420731           1.000000



### **Задача 8.2: Рекомендации**

```python
# На основе анализа предложите:
# 1. На какие продукты увеличить скидки? – робот-пылесос irobot, ноутбук dell xps 13, apple watch, ps5, sony wh-1000xm5
# 2. Какие продукты стоит снять с продажи? – кофемашина delonghi и робот-пылесос irobot (уменьшить запасы, но не полностью снимать с продаж)
# 3. Как оптимизировать ассортимент? – оптимизация скидочной политики (ниже)
```


| Тип товара      | Стратегия     |
| --------------- | ------------- |
| Сильный бренд   | скидки ≤ 5%   |
| Аксессуары      | скидки 10–20% |
| Бытовая техника | скидки 7–10%  |
| Премиум         | скидки ≤ 8%   |


## **Дополнительные задачи для продвинутых:**

1. **Анализ временных трендов** — добавьте Series с датами продаж
2. **Прогнозирование** — используйте скользящее среднее для прогноза продаж
3. **Кластеризация** — разделите продукты на группы по цене и популярности
4. **A/B тестирование** — смоделируйте изменение цены и оцените влияние на продажи



## **Подсказки:**

- Используйте метод `.copy()` при работе с данными, которые нужно изменять
- Помните про выравнивание по индексам при операциях между Series
- Используйте `.loc` и `.iloc` для доступа к данным
- Применяйте векторные операции вместо циклов
- Проверяйте наличие пропусков перед анализом
