В данном репозитории собраны проекты, выполненные в процессе обучения по программе профессиональной переподготовки Специалист по Data Science в Яндекс.Практикум
hmpipes.py
- содержит скрипты для автоматизации некоторых DataScience задач, которые были написаны в процессе работы над проектами
Проект | Описание | Библиотеки | Навыки |
---|---|---|---|
Прогнозирование оттока клиентов оператора связи | Прогнозирование разрыва договора на оказание услуг оператором связи для планирования промоакций с целью удержания клиентов | LightGBM NumPy CatBoost Pandas Sklearn Seaborn Matplotlib |
ML Data Analysis |
Компьютерное зрение | Определение приблизительного возраста человека по фотографии | Keras NumPy PIL Matplotlib |
ML Computer Vision |
Классификация текстовых комментариев | Классификация текстовых комментариев на позитивные и негативные | LightGBM Pandas Sklearn Seaborn NLTK Matplotlib |
ML NLP tf-idf |
Прогнозирование количества заказов такси | Модель машинного обучения для прогнозирования спроса на такси на следующий час | CatBoost NumPy LightGBM Pandas Sklearn Seaborn Statsmodels Matplotlib |
ML Time Series |
Определение стоимости поддержанных авто | Создание модели машинного обучения для определения стоимости подддержанных автомобилей по параметрам из объяалений | LightGBM CatBoost Pandas Sklearn Seaborn Matplotlib pandas_profiling |
ML Регрессия |
Защита персональных данных клиентов | Разработка метода шифрования персональных данных клиентов, не ухудшающего качество моделей машинного обучения | Sklearn Pandas NumPy |
ML Линейная алгебра |
Прогнозирование восстановления золота из руды | Прогнозирование значения концентрации золота на разных этапах процесса очистки золотосодержащей руды | Sklearn Pandas NumPy Seaborn Matplotlib |
ML Регрессия |
Выбор локации для нефтяной скважины | Определение региона, где добыча принесёт наибольшую прибыль, анализ рисков | Sklearn NumPy Pandas Matplotlib |
ML Регрессия Bootstrap |
Прогнозирование оттока клиентов банка | Предсказание факта ухода клиента банка в ближайшее время (бинарная классификация) | Sklearn Pandas NumPy Seaborn Matplotlib |
ML Классификация |
Рекомендация тарифов мобильного оператора | Рекомендации подходящего тарифа для пользователя на основе его пользования услугами связи | Sklearn Pandas XGBoost NumPy Matplotlib |
ML Классификация |
Исследование игровых платформ | Анализ рынка игровых платформ в разных регионах для определения потенциально популярных игровых жанров и платформ | Pandas NumPy SciPy Seaborn Matplotlib |
Data Analysis A/B testing |
Анализ перспективности тарифов мобильного оператора | Анализ поведения клиентов оператора сотовой связи для определения наиболее выгодного для оператора тарифа | Pandas NumPy SciPy Seaborn Matplotlib |
Data Analysis A/B testing |
Исследование объявлений о продаже квартир | Анализ рынка недвижимости Санкт-Петербурга и Ленинградкой области, выявление аномалий для отслеживания мошеннической деятельности | Pandas NumPy Matplotlib Seaborn |
Data Analysis Маркетинг_анализ |
Исследование надёжности заёмщиков | Исследование факторов, влияющих на факт возврата кредита в срок, на основе статистики о платёжеспособности клиентов | Pandas Seaborn Matplotlib PyMystem3 |
Data Analysis Финансовый_анализ |