Основной пул проектов по исследовательскому анализу данных, обучению моделей в задачах классификации и регрессии для различных секторов бизнеса.
-
Исследование надёжности заёмщиков банка
- Задача: Для построения модели кредитного скоринга, оценить влияние семейного положения и количества детей клиента на факт погашения кредита в срок.
- Stack: Pandas, PyMysterm.
-
Определение рыночной стоимости автомобилей
- Задача: Построить модель для определения стоимости автомобиля с пробегом.
- Stack: Pandas, NumPy, Seaborn, Scikit-learn, CatBoost, LGBM.
-
Обнаружение токсичных комментариев клиентов для последующей модерации (интернет-магазин)
- Задача: Разработка модели классифицирующей комментарии на позитивные и негативные.
- Stack: Pandas, NumPy, NLTK, Scikit-learn, CatBoost.
-
Предсказание оттока клиентов из банка
- Задача: Разработка модели прогнозирующей уход клиента из банка в ближайшее время.
- Stack: Pandas, NumPy, Scikit-learn, Seaborn.
-
Прогнозирование заказов такси на следующий час
- Задача: Построить прогноз количества заказов такси на следующий час.
- Stack: Pandas, NumPy, Seaborn, Scikit-learn, CatBoost.
-
Определение перспективного тарифа для оператора сотовой связи
- Задача: Оценка доходности тарифных планов компании.
- Stack: Pandas, NumPy, SciPy, Seaborn.
-
Прогнозирование оттока клиентов для телеком компании
- Задача: Разработка модели прогнозирующей отток клиентов.
- Stack: Pandas, NumPy, Seaborn, Scikit-learn, CatBoost.
Data Science (Учебный опыт)
Python 3 (Data: Pandas, NumPy; Statistics: SciPy; Visualization: Seaborn, Matplotlib, NLP/Text: re, PyMysterm, WordNet, NLTK; DS: Scikit-learn, CatBoost, LGBM, Bert).