### 🧭 Создание признака `season` (времена года)

Для анализа сезонных колебаний продаж был создан новый категориальный признак `season`, отражающий время года.

📌 **Логика распределения месяцев по сезонам:**
- **Winter** (зима): декабрь, январь, февраль
- **Spring** (весна): март, апрель, май
- **Summer** (лето): июнь, июль, август
- **Autumn** (осень): сентябрь, октябрь, ноябрь

🔧 Для этого была написана пользовательская функция `get_season(month)`, которая применяется к каждому значению месяца в колонке `date`.

⬇️ После применения функции создан новый столбец `season`, который используется для:
- группировки и агрегации продаж по сезонам,
- построения сравнительных графиков,
- выявления сезонных закономерностей.

✅ Результат:
Признак `season` добавлен к таблице и готов к использованию в аналитике.
---

---
### 📆 Сравнение продаж по сезонам

После создания признака `season` была выполнена группировка продаж по времени года. Анализ выполнен по двум метрикам:

- **Суммарные продажи (`total_sales`)**
- **Средние продажи в неделю (`avg_sales`)**

📌 **Результаты:**

| Сезон   | Total Sales (млрд) | Avg Sales (в неделю) |
|---------|---------------------|------------------------|
| Summer  | $1.88 млрд          | $1,047,622             |
| Spring  | $1.80 млрд          | $1,023,801             |
| Autumn  | $1.58 млрд          | $1,030,432             |
| Winter  | $1.48 млрд          | **$1,094,937**         |

✅ **Интерпретация:**
- **Лето** — лидер по общей выручке (за счёт продолжительности)
- **Зима** — лидер по средней интенсивности продаж (возможно, из-за новогодних праздников)
- **Осень** — сезон с наименьшими продажами (потенциальная зона для стимулирования спроса)
---

### 🎉 Анализ влияния праздничных недель на продажи

Для оценки влияния праздничных недель был использован бинарный признак `holiday_flag`:

- `1` — неделя включает официальный праздник
- `0` — обычная неделя

📊 Были рассчитаны **средние значения `weekly_sales`** для обеих категорий.

📌 **Результаты:**
- **Праздничные недели:** $1,122,887.89
- **Обычные недели:** $1,041,256.38
- **Разница:** ≈ **+7.84%** в пользу праздничных недель
- ** Формула прироста в процентах:
`Разница % = (holiday_sales − non_holiday_sales)/non_holiday_sales × 100`

✅ **Вывод:**
Праздничные недели демонстрируют **заметно более высокую среднюю выручку**, что подтверждает их значимость при планировании маркетинга, логистики и ассортимента.

---

### 📈 Динамика понедельных продаж по сети Walmart (2010–2012)

Для анализа краткосрочных колебаний и общей тенденции продаж была построена **линейная визуализация понедельных продаж** по всей сети Walmart.

🔧 **Что было сделано:**
- Продажи агрегированы по каждой уникальной дате (неделе)
- Построен график, отражающий изменение `weekly_sales` во времени
- Использована линейная диаграмма с точками и сглаженной линией

📌 **Что показывает график:**
- Объём продаж колеблется от недели к неделе
- Видны **периодические пики** (в праздничные периоды)
- Есть **сезонные провалы** (в межсезонье и после праздников)
- Визуализированы данные с **февраля 2010 по октябрь 2012**

✅ **Вывод:**
График позволяет быстро выявить **временные закономерности** и понять, когда происходят **резкие всплески или падения** продаж, что важно для прогноза и подготовки операционных ресурсов.

---

### 📅 Анализ понедельных продаж по неделям календарного года

Для выявления наиболее прибыльных недель в году был проведён анализ средних продаж по **номеру недели** (от 1 до 52), независимо от года.

🔧 **Этапы выполнения:**
1. Из даты `date` был извлечён номер недели с помощью `.dt.isocalendar().week`
2. Продажи агрегированы по каждой неделе года с расчётом **среднего значения**
3. Построена линейная визуализация для наглядного сравнения всех недель

📊 **Результаты:**
- Наибольшие средние продажи наблюдаются в **неделях 47–52**, что соответствует:
  - Концу ноября (Black Friday -  пятница после Дня благодарения в США. С неё начинается традиционный рождественский сезон распродаж.)
  - Декабрю (предновогодние покупки)
- Также выделяется **6-я неделя года (февраль)** как период активности

📌 **Бизнес-интерпретация:**
- Это ключевые недели для:
  - Увеличения товарных запасов
  - Маркетинговых кампаний
  - Управления логистикой

✅ **Вывод:**
Недели с конца ноября по декабрь — стратегически важные периоды с пиковыми продажами.  
Компании необходимо заранее готовиться к этим нагрузкам.

---

---
### 📉 Анализ влияния макроэкономических факторов на продажи Walmart

Для оценки того, как **CPI (индекс потребительских цен)** и **Unemployment (уровень безработицы)** влияют на недельные продажи, были построены точечные диаграммы с линией тренда и рассчитаны коэффициенты корреляции.

---

🔧 **Этапы выполнения:**

1. Построены два **scatter plot**:
   - `CPI vs weekly_sales`
   - `Unemployment vs weekly_sales`

2. Добавлены **линии линейного тренда** с помощью `seaborn.regplot()`  
   Это позволило визуально отследить направление зависимости.

3. Расчитаны **коэффициенты корреляции** методом Пирсона (`.corr()`), чтобы количественно оценить силу связи.

---

📊 **Результаты:**

- **CPI (индекс цен)**:
  - Линия тренда почти горизонтальная → **слабая обратная связь**
  - Коэффициент корреляции: ~ **−0.07**
  
- **Unemployment (безработица)**:
  - Линия тренда направлена вниз → **Слабая обратная связь**
  - Коэффициент корреляции: **−0.11**

---

📌 **Интерпретация:**

- При росте **уровня безработицы** продажи **слабо снижаются** — логично: меньше доходов, меньше покупок.
- При росте **CPI** (инфляции) продажи **почти не меняются** — Walmart удерживает стабильный спрос даже при росте цен.

---

✅ **Вывод:**

Макроэкономические факторы **оказывают слабое отрицательное влияние** на продажи Walmart.  
Сеть сохраняет **относительную устойчивость** к экономическим колебаниям, что делает её стабильной в кризисные периоды.

---

---

### ⛽📉 Анализ влияния погодных условий и цен на топливо на продажи

Для оценки влияния **внешних факторов** на недельные продажи Walmart были изучены зависимости от:

- **Температуры воздуха** (`temperature`)
- **Цены на топливо** (`fuel_price`)

---

🔧 **Этапы выполнения:**

1. Построены 2 диаграммы рассеяния (`scatter plot`) с линиями линейного тренда:
   - `temperature` vs `weekly_sales`
   - `fuel_price` vs `weekly_sales`

2. Для каждой пары рассчитан **коэффициент корреляции** методом Пирсона (`.corr()`)

3. Выполнена интерпретация направлений и силы связи между переменными

---

📊 **Результаты:**

- **Температура:**
  - Коэффициент корреляции: **−0.06**
  - Очень слабая обратная связь — при росте температуры продажи почти не меняются

- **Цена топлива:**
  - Коэффициент корреляции: **+0.01**
  - Практически нулевая связь — рост цен на топливо не влияет на продажи

---

📌 **Бизнес-интерпретация:**

- Продажи Walmart **практически не зависят** от температуры и стоимости топлива
- Это указывает на **устойчивость спроса** и привычки клиентов
- При планировании продаж и логистики **эти переменные можно не учитывать как ключевые**

---

✅ **Вывод:**

**Температура и топливо не оказывают значимого влияния на продажи.**  
Walmart сохраняет стабильность даже при изменении внешней среды.

---