Учебные проекты в формате Jupyter Notebook, выполненные во время прохождения курса "Специалист по Data Science' на Яндекс.Практикум. Проекты реализованы на языке Python с использованием специальных библиотек.
Название проекта | Описание | Используемые библиотеки |
---|---|---|
Прогнозирование температуры стали | Построение прототипа модели машинного обучения для прогнозирования последней измеренной температуры стали в партии | Python, NumPy, pandas, Matplotlib, seaborn, scikit-learn, CatBoost, XGBoost |
Прогнозирование эффективности восстановления золота из руды | Построение прототипа модели машинного обучения для прогнозирования коэффициента восстановления золота из руды | Python, NumPy, pandas, Matplotlib, seaborn, scikit-learn. |
Оценка стоимости подержанных автомобилей | Построение модели машинного обучения для определения рыночной стоимости подержанного автомобиля. | Python, NumPy, pandas, seaborn, scikit-learn, LightGBM, CatBoost. |
Выбор оптимального региона для бурения нефтяных скважин | Определение региона для добычи нефти с минимальными рисками убытков для заданного бюджета. | Python, NumPy, pandas, seaborn, SciPy. |
Нахождение "токсичных" комментариев | Построение модели машинного обучения для классификации комментариев на позитивные и негативные. | Python, NumPy, pandas, scikit-learn, NLTK. |
Прогнозирование временных рядов | Построение модели машинного обучения для прогнозирования количества заказов такси на следующий час. | Python, NumPy, pandas, seaborn, Matplotlib, statsmodels, scikit-learn, LightGBM. |
Анализ рынка игровых платформ | Выявление закономерностей, определяющих успешность игровых платформ и игр. | Python, NumPy, pandas, Matplotlib, seaborn, SciPy. |
Компьютерное зрение - определение возраста по фото | Построение модели глубокого обучения для определения возраста покупателя по фото. | Python, NumPy, pandas, seaborn, Matplotlib, keras. |
Прогнозирование оттока клиентов из банка | Построение модели машинного обучения для решения задачи классификации - уйдет клиент из банка или нет. | Python, NumPy, pandas, Matplotlib, scikit-learn. |
Определение перспективного тарифа для мобильного оператора | Анализ потребления абонентами мобильных услуг и определение тарифа, который принесет наибольшую выручку | Python, NumPy, pandas, Matplotlib, SciPy. |
Классификация абонентов по 2 тарифным планам | Построение модели машинного обучения для выбора подходящего тарифа абонентам, пользующимся архивными планами. | Python, NumPy, pandas, scikit-learn. |
Исследование объявлений о продаже квартир | Определение параметров, влияющих на стоимость квартиры в Санкт-Петербурге. | Python, NumPy, pandas, Matplotlib. |
Исследование надежности заемщиков | Исследование того, влияет ли семейное положение и количество детей клиента на возврат кредита в срок. | Python, NumPy, pandas. |
Краткий исследовательский анализ данных авиакомпании | Анализ данных, полученных из запросов SQL к базе данных авиакомпании. | Python, NumPy, pandas, seaborn, Matplotlib. |
Защита данных клиентов | Преобразование данных клиентов страховой компании так, чтобы их сложно было восстановить, без ущерба качеству модели машинного обучения. | Python, NumPy, pandas, scikit-learn. |