<a href="https://colab.research.google.com/github/debaggi/Junior-Data-Analyst-Cases/blob/main/Tech_Interview.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

Вот 15 задач для технического интервью на позицию Data Analyst (Middle) в ведущие технологические компании, такие как Disney, Google, Uber, Spotify, Apple, Pixar, и Netflix. Каждая задача направлена на проверку знаний и умений в области анализа данных, математической статистики и интерпретации результатов.

---

### **Задача 1: Анализ пользовательской активности**
**Описание:** У вас есть данные о действиях пользователей за последний месяц. Как вы определите, какой из дней был наиболее активным, и что могло повлиять на этот всплеск активности?
**Решение:** Используя SQL, можно агрегировать данные по дням и определить день с наибольшим числом действий. В Python можно построить графики для визуализации трендов. Дополнительно провести анализ на предмет внешних факторов (например, маркетинговых кампаний), которые могли повлиять на активность.

---

### **Задача 2: A/B тестирование**
**Описание:** Ваша команда провела A/B тест для двух версий кнопки на сайте. Как вы будете анализировать результаты, и как определить, какая версия лучше?
**Решение:** С помощью Python можно использовать библиотеки, такие как SciPy, для проверки статистической значимости различий между группами. Вычислите p-value, определите доверительный интервал, и сделайте выводы на основе полученных данных.

---

### **Задача 3: Временные ряды**
**Описание:** Компания хочет предсказать доход на следующий квартал. У вас есть данные за предыдущие три года. Как вы построите прогноз?
**Решение:** Сначала исследуйте сезонность и тренды в данных. Затем можно использовать Python (например, библиотеку Prophet или ARIMA) для создания модели временных рядов и прогноза.

---

### **Задача 4: SQL запрос для поиска активных пользователей**
**Описание:** Напишите SQL-запрос, который вернет всех пользователей, совершивших хотя бы одну покупку за последние 30 дней.
**Решение:** Используя SQL, можно написать запрос с использованием `WHERE` и `GROUP BY`, чтобы найти уникальных пользователей, которые совершали покупки в последние 30 дней.

```sql
SELECT user_id
FROM transactions
WHERE purchase_date >= DATE_SUB(CURDATE(), INTERVAL 30 DAY)
GROUP BY user_id;
```

---

### **Задача 5: Корреляционный анализ**
**Описание:** У вас есть данные по продажам и маркетинговым затратам. Как вы проверите, есть ли между ними связь?
**Решение:** В Python можно использовать библиотеку Pandas и метод `.corr()` для вычисления корреляции Пирсона. Если корреляция близка к 1 или -1, то можно сделать вывод о сильной связи между переменными.

---

### **Задача 6: Расчет NPS**
**Описание:** У вас есть данные по ответам на вопрос об удовлетворенности клиентов (от 0 до 10). Как рассчитать NPS (Net Promoter Score)?
**Решение:** NPS рассчитывается как разница между процентом промоутеров (оценки 9-10) и процентом критиков (оценки 0-6). Используя Excel или Python, можно легко рассчитать эти значения и определить общий NPS.

---

### **Задача 7: Воронка конверсии**
**Описание:** Определите узкое место в воронке конверсии для пользователей, которые регистрируются, но не завершают покупку.
**Решение:** Используя Python или SQL, можно анализировать, на каком этапе воронки конверсии пользователи выпадают. Визуализация воронки поможет выявить узкие места и сделать выводы.

---

### **Задача 8: SQL запрос для сегментации**
**Описание:** Напишите SQL-запрос для сегментации пользователей на основе их географического расположения и объема покупок.
**Решение:** Используя SQL, можно применить `CASE` для создания сегментов, а затем сгруппировать данные по сегментам для дальнейшего анализа.

```sql
SELECT
    user_id,
    CASE
        WHEN purchase_amount > 1000 THEN 'High spender'
        ELSE 'Low spender'
    END AS segment
FROM users;
```

---

### **Задача 9: Статистический тест на нормальность**
**Описание:** Как проверить, нормально ли распределены данные о доходах пользователей?
**Решение:** Используя Python, можно применить тест Шапиро-Уилка или визуализировать данные с помощью гистограммы и QQ-графика. Если p-value в тесте Шапиро-Уилка меньше 0.05, то данные отклоняются от нормального распределения.

---

### **Задача 10: Кластеризация пользователей**
**Описание:** Как вы кластеризуете пользователей на основе их поведения?
**Решение:** Используя Python и алгоритм K-Means, можно кластеризовать пользователей на основе их характеристик (например, число покупок, средняя сумма покупки). Затем можно визуализировать кластеры и интерпретировать результаты.

---

### **Задача 11: Регрессия**
**Описание:** У вас есть данные по расходам на маркетинг и выручке. Как оценить влияние расходов на выручку?
**Решение:** В Python можно использовать линейную регрессию (например, библиотеку Scikit-Learn) для оценки влияния. В Excel можно воспользоваться функцией `LINEST` для построения регрессионной модели.

---

### **Задача 12: SQL запрос для расчета LTV**
**Описание:** Напишите SQL-запрос для расчета LTV (Lifetime Value) пользователей.
**Решение:** Для расчета LTV можно использовать сумму всех транзакций пользователя за определенный период, разделив её на число активных пользователей.

```sql
SELECT user_id, SUM(purchase_amount) / COUNT(DISTINCT user_id) AS LTV
FROM transactions
GROUP BY user_id;
```

---

### **Задача 13: Bootstrap**
**Описание:** Опишите, как можно использовать метод бутстреппинга для оценки доверительного интервала среднего значения доходов.
**Решение:** Используя Python, можно многократно выбирать выборки из данных с заменой и рассчитывать среднее значение. Затем на основе этих выборок строится распределение, по которому оценивается доверительный интервал.

---

### **Задача 14: SQL запрос для расчета ARPU**
**Описание:** Напишите SQL-запрос для расчета ARPU (Average Revenue Per User) за последний месяц.
**Решение:** Рассчитывается как отношение общей выручки к количеству активных пользователей.

```sql
SELECT SUM(revenue) / COUNT(DISTINCT user_id) AS ARPU
FROM transactions
WHERE transaction_date >= DATE_SUB(CURDATE(), INTERVAL 1 MONTH);
```

---

### **Задача 15: Анализ воронки в Excel**
**Описание:** В компании был проведен эксперимент с новой версией приложения. Как проанализировать результаты эксперимента с помощью Excel?
**Решение:** Используя сводные таблицы и графики в Excel, можно визуализировать этапы воронки, сравнить конверсии для старой и новой версии приложения и сделать выводы о результатах эксперимента.

---

Эти задачи предназначены для проверки различных навыков кандидата, таких как работа с данными, знание SQL и Python, понимание математических методов и способность интерпретировать результаты. Они позволят оценить готовность кандидата к решению реальных задач в условиях работы в ведущих технологических компаниях.