Skip to content

hairymax/Yandex.Practicum.DataScience

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

58 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Проекты Data Science. Яндекс.Практикум (Школа Анализа Данных)

В данном репозитории собраны проекты, выполненные в процессе обучения по программе профессиональной переподготовки Специалист по Data Science в Яндекс.Практикум

Сертификат (Русский | English)

Сертификат

hmpipes.py - содержит скрипты для автоматизации некоторых DataScience задач, которые были написаны в процессе работы над проектами

Описание проектов

Проект Описание Библиотеки     Навыки    
Прогнозирование оттока клиентов оператора связи Прогнозирование разрыва договора на оказание услуг оператором связи для планирования промоакций с целью удержания клиентов LightGBM NumPy CatBoost Pandas Sklearn Seaborn Matplotlib ML
Data Analysis
Компьютерное зрение Определение приблизительного возраста человека по фотографии Keras NumPy PIL Matplotlib ML
Computer Vision
Классификация текстовых комментариев Классификация текстовых комментариев на позитивные и негативные LightGBM Pandas Sklearn Seaborn NLTK Matplotlib ML
NLP tf-idf
Прогнозирование количества заказов такси Модель машинного обучения для прогнозирования спроса на такси на следующий час CatBoost NumPy LightGBM Pandas Sklearn Seaborn Statsmodels Matplotlib ML
Time Series
Определение стоимости поддержанных авто Создание модели машинного обучения для определения стоимости подддержанных автомобилей по параметрам из объяалений LightGBM CatBoost Pandas Sklearn Seaborn Matplotlib pandas_profiling ML
Регрессия
Защита персональных данных клиентов Разработка метода шифрования персональных данных клиентов, не ухудшающего качество моделей машинного обучения Sklearn Pandas NumPy ML
Линейная алгебра
Прогнозирование восстановления золота из руды Прогнозирование значения концентрации золота на разных этапах процесса очистки золотосодержащей руды Sklearn Pandas NumPy Seaborn Matplotlib ML
Регрессия
Выбор локации для нефтяной скважины Определение региона, где добыча принесёт наибольшую прибыль, анализ рисков Sklearn NumPy Pandas Matplotlib ML Регрессия Bootstrap
Прогнозирование оттока клиентов банка Предсказание факта ухода клиента банка в ближайшее время (бинарная классификация) Sklearn Pandas NumPy Seaborn Matplotlib ML
Классификация
Рекомендация тарифов мобильного оператора Рекомендации подходящего тарифа для пользователя на основе его пользования услугами связи Sklearn Pandas XGBoost NumPy Matplotlib ML
Классификация
Исследование игровых платформ Анализ рынка игровых платформ в разных регионах для определения потенциально популярных игровых жанров и платформ Pandas NumPy SciPy Seaborn Matplotlib Data Analysis
A/B testing
Анализ перспективности тарифов мобильного оператора Анализ поведения клиентов оператора сотовой связи для определения наиболее выгодного для оператора тарифа Pandas NumPy SciPy Seaborn Matplotlib Data Analysis
A/B testing
Исследование объявлений о продаже квартир Анализ рынка недвижимости Санкт-Петербурга и Ленинградкой области, выявление аномалий для отслеживания мошеннической деятельности Pandas NumPy Matplotlib Seaborn Data Analysis
Маркетинг_анализ
Исследование надёжности заёмщиков Исследование факторов, влияющих на факт возврата кредита в срок, на основе статистики о платёжеспособности клиентов Pandas Seaborn Matplotlib PyMystem3 Data Analysis
Финансовый_анализ