Skip to content

Fincredo/yandex-projects

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Проекты, выполненные в рамках курса "Data Science" Яндекс.Практикум:

Проект Задача проекта Модуль, инструменты
1. 🎵 Анализ музыкальных предпочтений На данных музыкального интернет-сервиса сравнить поведение пользователей Москвы и Санкт-Петербурга: зависимость активности от дня недели, а также предпочтения по музыкальным жанрам. Базовый Python (pandas)
2. 🏦 Исследование надежности заемщиков Установить влияние семейного положения, количества детей и уровня дохода заемщика, а также и целей кредитования - на факт своевременного погашения банковского кредита. Подготовка данных (pandas)
3. 🏠 Исследование объявлений о продаже квартир На данных интернет-сервиса недвижимости, среди параметров объектов недвижимости Санкт-Петербурга и соседних населенных пунктов выявить факторы, влияющие на их рыночную стоимость. Исследовательский анализ данных (pandas, matplotlib)
4. 📱 Определение перспективного тарифа для телеком-компании Проанализировать два тарифа мобильного оператора на небольшой выборке клиентов и сделать вывод о наиболее перспективном из них. Статистический анализ данных (pandas, numpy, matplotlib, seaborn, scipy, sympy)
5. 🎮 Выявление закономерностей успешности компьютерных игр На основе данных о продажах игр, их жанрах и платформах, а также оценках пользователей и экспертов, выявить определяющие успешность игры закономерности. СБОРНЫЙ ПРОЕКТ 1 (pandas, numpy, matplotlib, seaborn, scipy, difflib, re)
6. 📱 Рекомендация тарифов телеком-компании Построить модель для задачи классификации, которая выберет подходящий из двух новых тарифов для предложения клиентам мобильного оператора, на основе данных о поведении уже перешедших на них абонентов. Введение в машинное обучение (pandas, seaborn, sklearn)
7. 🏦 Прогнозирование оттока клиентов банка Взяв за основу исторические данные о поведении клиентов и расторжении договоров с банком, построить модель, способную спрогнозировать уход клиента из банка в ближайшее время. Обучение с учителем (pandas, numpy, seaborn, matplotlib, sklearn, re, random)
8. ⛲ Выбор локации для скважины По информации о пробах нефти из разных месторождений трех регионов, построить модель для предсказания объема ее запасов в новых скважинах и определения региона, где добыча принесет наибольшую прибыль. Машинное обучение в бизнесе (pandas, seaborn, numpy, scipy, sklearn; Bootstrap)
9. 🧈 Восстановление золота из руды Подготовить прототип модели машинного обучения для предсказания коэффициента восстановления золота из золотосодержащей руды, на основе данных с параметрами его добычи и очистки. СБОРНЫЙ ПРОЕКТ 2 (pandas, numpy, seaborn, matplotlib, sklearn, math)
10. 🔠 Защита персональных данных клиентов Для защиты сведений о клиентах страховой компании разработать метод преобразования данных, после которого было бы сложно восстановить их персональную информацию. Линейная алгебра (pandas, matplotlib, seaborn, sklearn)
11. 🚗 Определение стоимости автомобилей На основе исторических данных о продаже автомобилей с пробегом, построить модель для определения их рыночной стоимости. Численные методы (pandas, numpy, seaborn, matplotlib, re, sklearn, catboost, lightgbm)
12. 🚖 Прогнозирование заказов такси На данных о заказах такси в аэропортах за определенный период, построить модель для предсказания количества заказов на каждый следующий час. Временные ряды (pandas, matplotlib, numpy, sklearn, lightgbm, catboost)
13. 💬 Модерация токсичных комментариев На наборе данных от интернет-магазина, о редактируемых пользователями описаниях товаров, обучить модель для определения токсичности комментариев и их классификации на позитивные и негативные. Машинное обучение для текстов (pandas, numpy, matplotlib, re, nltk, sklearn, catboost, lightgbm)
14. 👩 Определение возраста покупателей Построить и обучить сверточную нейронную сеть на наборе фотографий людей с указанием возраста, способную по фото определять приблизительный возраст покупателя сетевого супермаркета. Компьютерное зрение (pandas, seaborn, matplotlib, keras)
15. 📱 Прогнозирование оттока клиентов телеком-компании На основе персональных данных о некоторых клиентах оператора связи и информации об их тарифах и договорах, построить модель для прогноза оттока клиентов и его своевременного предотвращения. ФИНАЛЬНЫЙ ПРОЕКТ (pandas, numpy, seaborn, matplotlib, sklearn, catboost, lightgbm; OHE)