| № | Название проекта | Описание | Инструменты | Сфера деятельности |
|---|---|---|---|---|
| 1 | Исследование данных сервиса “Яндекс.Музыка” — сравнение пользователей двух городов | На реальных данных Яндекс.Музыки c помощью библиотеки Pandas и её возможностей проверить данные и сравнить поведение и предпочтения пользователей двух столиц — Москвы и Санкт-Петербурга. | Python, Pandas | Интернет-сервисы, cтриминговые сервисы |
| 2 | Исследование надёжности заёмщиков — анализ банковских данных | На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок | Python, Pandas, Предобработка данных | Банковская сфера, кредитование |
| 3 | Продажа квартир в Санкт-Петербурге — анализ рынка недвижимости | Используя данные сервиса Яндекс.Недвижимость, определить рыночную стоимость объектов недвижимости и типичные параметры квартир | Matplotlib, Pandas, Визуализация данных | Интернет сервисы,площадки обьявлений |
| 4 | Определение выгодного тарифа для телеком компании | На основе данных клиентов оператора сотовой связи проанализировать поведение клиентов и поиск оптимального тарифа | Python, Pandas, Matplotlib, Numpy, Scipy, описательная статистика, проверка статистических гипотез | Телеком |
| 5 | Изучение закономерностей, определяющих успешность игр | Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявить закономерности, определяющие успешность игры | Python, Pandas, Scikit-lean, Matplotlib, Numpy | Бизнес |
| 6 | Классификаиция клиентов телеком компании | На основе данных предложить клиенту тариф. | Python, Pandas, Scikit-lean, Matplotlib | Телеком |
| 7 | Прогнозирование оттока клиента Банка | На основе данных из банка определить клиент, который может уйти | Python, Pandas, Scikit-lean, Matplotlib | Банковская сфера, кредитование,инвестиции |
| 8 | Определение наиболее выгодного региона нефтедобычи | На основе данных геологи разведки выбрать район добычи нефти | Python, Pandas, Scikit-lean, Matplotlib, Numpy | Промышленность |
| 9 | Исследование технологического процесса очистки золота | Спрогнозировать концентрацию золота при проведении процесса очистки золота | Python, Pandas, Предобработка данных | Банковская сфера, кредитование |
| 10 | Защита данных клиентов страховой компании | Разработка модели анонимизации персональных данных | Python, Scikit-lean, Numpy | Банковская сфера,телеком |
| 11 | Построение модели определения стоимости автомобиля | Разработка системы рекомендации стоимости автомобиля на основе его описания | Python, Pandas, lightgbm | Интернет-сервисы, интернет-магазины |
| 12 | Прогнозирование количества заказов такси на следующий час | Разработка системы предсказания объема заказа. | Python, Pandas, Scikit-lean, statsmodels | Интернет сервисы |
| 13 | Обучение модели классификации комментариев | Определение токсичности комментарии. | Python, Pandas, nltk | Интернет сервисы |
| 14 | Обработка фотографий покупателя | Определение возраста по фотографии | Python, Keras | Бизнес |
| 15 | Прогнозирование оттока телеком компании | Прогнозирование оттока телеком компании | Python, Pandas, Scikit-lean, Matplotlib, Numpy | Бизнес |
Можно использовать интерпретатор Python 3.10.7.
Рекомендую использовать виртуальное окружение. Его можно создать следующей командой:
python -m venv env
Все необходимые пакеты собраны в файле requirements.txt.
Перед установкой пакетов не забудьте активировать виртуальную среду.
Вы можете установить пакеты одной командой:
pip install -r requirements.txt