Проект | Задача проекта | Модуль, инструменты |
---|---|---|
1. 🎵 Анализ музыкальных предпочтений | На данных музыкального интернет-сервиса сравнить поведение пользователей Москвы и Санкт-Петербурга: зависимость активности от дня недели, а также предпочтения по музыкальным жанрам. | Базовый Python (pandas) |
2. 🏦 Исследование надежности заемщиков | Установить влияние семейного положения, количества детей и уровня дохода заемщика, а также и целей кредитования - на факт своевременного погашения банковского кредита. | Подготовка данных (pandas) |
3. 🏠 Исследование объявлений о продаже квартир | На данных интернет-сервиса недвижимости, среди параметров объектов недвижимости Санкт-Петербурга и соседних населенных пунктов выявить факторы, влияющие на их рыночную стоимость. | Исследовательский анализ данных (pandas, matplotlib) |
4. 📱 Определение перспективного тарифа для телеком-компании | Проанализировать два тарифа мобильного оператора на небольшой выборке клиентов и сделать вывод о наиболее перспективном из них. | Статистический анализ данных (pandas, numpy, matplotlib, seaborn, scipy, sympy) |
5. 🎮 Выявление закономерностей успешности компьютерных игр | На основе данных о продажах игр, их жанрах и платформах, а также оценках пользователей и экспертов, выявить определяющие успешность игры закономерности. | СБОРНЫЙ ПРОЕКТ 1 (pandas, numpy, matplotlib, seaborn, scipy, difflib, re) |
6. 📱 Рекомендация тарифов телеком-компании | Построить модель для задачи классификации, которая выберет подходящий из двух новых тарифов для предложения клиентам мобильного оператора, на основе данных о поведении уже перешедших на них абонентов. | Введение в машинное обучение (pandas, seaborn, sklearn) |
7. 🏦 Прогнозирование оттока клиентов банка | Взяв за основу исторические данные о поведении клиентов и расторжении договоров с банком, построить модель, способную спрогнозировать уход клиента из банка в ближайшее время. | Обучение с учителем (pandas, numpy, seaborn, matplotlib, sklearn, re, random) |
8. ⛲ Выбор локации для скважины | По информации о пробах нефти из разных месторождений трех регионов, построить модель для предсказания объема ее запасов в новых скважинах и определения региона, где добыча принесет наибольшую прибыль. | Машинное обучение в бизнесе (pandas, seaborn, numpy, scipy, sklearn; Bootstrap) |
9. 🧈 Восстановление золота из руды | Подготовить прототип модели машинного обучения для предсказания коэффициента восстановления золота из золотосодержащей руды, на основе данных с параметрами его добычи и очистки. | СБОРНЫЙ ПРОЕКТ 2 (pandas, numpy, seaborn, matplotlib, sklearn, math) |
10. 🔠 Защита персональных данных клиентов | Для защиты сведений о клиентах страховой компании разработать метод преобразования данных, после которого было бы сложно восстановить их персональную информацию. | Линейная алгебра (pandas, matplotlib, seaborn, sklearn) |
11. 🚗 Определение стоимости автомобилей | На основе исторических данных о продаже автомобилей с пробегом, построить модель для определения их рыночной стоимости. | Численные методы (pandas, numpy, seaborn, matplotlib, re, sklearn, catboost, lightgbm) |
12. 🚖 Прогнозирование заказов такси | На данных о заказах такси в аэропортах за определенный период, построить модель для предсказания количества заказов на каждый следующий час. | Временные ряды (pandas, matplotlib, numpy, sklearn, lightgbm, catboost) |
13. 💬 Модерация токсичных комментариев | На наборе данных от интернет-магазина, о редактируемых пользователями описаниях товаров, обучить модель для определения токсичности комментариев и их классификации на позитивные и негативные. | Машинное обучение для текстов (pandas, numpy, matplotlib, re, nltk, sklearn, catboost, lightgbm) |
14. 👩 Определение возраста покупателей | Построить и обучить сверточную нейронную сеть на наборе фотографий людей с указанием возраста, способную по фото определять приблизительный возраст покупателя сетевого супермаркета. | Компьютерное зрение (pandas, seaborn, matplotlib, keras) |
15. 📱 Прогнозирование оттока клиентов телеком-компании | На основе персональных данных о некоторых клиентах оператора связи и информации об их тарифах и договорах, построить модель для прогноза оттока клиентов и его своевременного предотвращения. | ФИНАЛЬНЫЙ ПРОЕКТ (pandas, numpy, seaborn, matplotlib, sklearn, catboost, lightgbm; OHE) |
-
Notifications
You must be signed in to change notification settings - Fork 0
Fincredo/yandex-projects
Folders and files
Name | Name | Last commit message | Last commit date | |
---|---|---|---|---|