Skip to content

Сертификат об окончании и проекты, выполненные в рамках курса Practicum Data Science.

Notifications You must be signed in to change notification settings

reekuu/ds_projects_practicum

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Яндекс.Практикум: Data Scientist. Репозиторий проектов.

logo-wide

ЯП: Python, SQL | IDE: Jupyter Notebook | Certificate DS: 20212DS00733 | Cert in english

Проект Задача Инструменты
15 Проект "Телеком"

> посмотреть тетрадь
Научиться прогнозировать отток клиентов на основе исторических данных. Финальный проект. градиентный бустинг, shap, tqdm, catboost, pipeline, sklearn, seaborn, matplotlib, numpy, pandas
14 Определение возраста покупателей

> посмотреть тетрадь
Построить модель, которая по фотографии определит приблизительный возраст человека. компьютерное зрение, keras, os, matplotlib, pandas
13 Спрос на рейсы авиакомпании

> посмотреть тетрадь
Произвести выгрузку и подготовку данных с помощью SQL, проанализировать спрос пассажиров на рейсы в города, где проходят крупнейшие культурные фестивали. извлечение данных, sql, pyspark, matplotlib, pandas
12 Классификатор комментариев

> посмотреть тетрадь
Ускорить модерацию комментариев в сообществе, автоматизировав оценку их токсичности. Обучить классификатор для разделения комментариев на нейтральные и негативные. обработка естественного языка, лемматизация, nltk, simplemma, tqdm, re, pipeline, sklearn, seaborn, matplotlib, numpy, pandas
11 Прогнозирование заказов такси

> посмотреть тетрадь
Научиться прогнозировать количество заказов такси на следующий час. временные ряды, statsmodels, sklearn, seaborn, matplotlib, pandas
10 Определение стоимости автомобилей

> посмотреть тетрадь
Построить модель для определения стоимости автомобиля на основе исторических данных: технических характеристик, комплектации и цены. градиентный бустинг, lightgbm, sklearn, pandas
09 Защита персональных данных клиентов

> посмотреть тетрадь
Методом преобразования данных защитить личную информацию клиентов страховой компании. sklearn, numpy, pandas
08 Восстановление золота из руды

> посмотреть тетрадь
Разработать модель, предсказывающую коэффициент восстановления золота из золотосодержащей руды. sklearn, seaborn, matplotlib, numpy, pandas
07 Выбор локации для скважины

> посмотреть тетрадь
Построить модель машинного обучения, которая поможет определить регион, где добыча принесет наибольшую прибыль с наименьшим риском убытков. bootstrap, sklearn, seaborn, matplotlib, numpy, pandas
06 Отток клиентов

> посмотреть тетрадь
Провести анализ оттока клиентов банка для выбора стратегии удержания. pandas-profiling, imblearn, pipeline, sklearn, seaborn, matplotlib, numpy, pandas
05 Рекомендация тарифов

> посмотреть тетрадь
Построить модель для задачи классификации, которая подскажет подходящий тариф. sklearn, matplotlib, numpy, pandas
04 Исследование рынка игр

> посмотреть тетрадь
Используя исторические данные о продажах компьютерных игр, оценки пользователей и экспертов, жанры и платформы, выявить закономерности, определяющие успешность игры. проверка статистических гипотез, pandas-profiling, scipy, seaborn, matplotlib, numpy, pandas
03 Сравнение доходности тарифов мобильного оператора

> посмотреть тетрадь
Проанализировать поведение клиентов оператора сотовой связи и выполнить поиск оптимального тарифа. проверка статистических гипотез, scipy, seaborn, matplotlib, numpy, pandas
02 Исследование объявлений о продаже квартир

> посмотреть тетрадь
Определить рыночную стоимость объектов недвижимости и типичные параметры квартир, используя данные за прошлый период. math, seaborn, matplotlib, numpy, pandas
01 Исследование надёжности заёмщиков

> посмотреть тетрадь
На основе статистики о платёжеспособности клиентов исследовать влияет ли семейное положение и количество детей клиента на факт возврата кредита в срок. лемматизация, pymystem3, seaborn, matplotlib, pandas
00 Музыка больших городов

> посмотреть тетрадь
Сравнить данные для Москвы и Петербурга, исследовать что и в каком режиме слушают жители этих городов. pandas

About

Сертификат об окончании и проекты, выполненные в рамках курса Practicum Data Science.

Topics

Resources

Stars

Watchers

Forks