-
👋 Привет! Меня зовут Ефрем Несынов.
-
🌱 Обучился по направлению Data Science в Яндекс.Практикуме (окончание обучения 05.2022)
-
📫 Со мной можно связаться по почте efrem-1991@ya.ru и тел. +7 925 66 17 222
✨ Здесь можно ознакомиться с моими учебными проектами: ✨
№ | Название проекта | Сфера | Описание | Стек |
---|---|---|---|---|
1 | Исследование надёжности заёмщиков | Финансы | Предобработка данных, поиск и устранение пропусков, дубликатов; лемматизация; категоризация и вывод сводных таблиц; исследовательский анализ данных. | Python pymystem3 Pandas NumPy |
2 | Исследование объявлений о продаже квартир | Недвижимость | Поиск и устранение проблем в данных; построение графиков и формирование сводных таблиц; расчет корелляции и интерпретация взаимосвязей. | Pandas Matplotlib NumPy |
3 | Определение перспективного тарифа для телеком компании | Телеком | Подготовка данных, выявление в них проблем; построение графиков распределений, их интерпретация; расчёт стандартного отклонения, дисперсии; формирование нулевой и альтернативной гипотезы; проверка и интерпретация гипотез. | Pandas Matplotlib math NumPy SciPy Statsmodels |
4 | Изучение закономерностей, определяющих успешность игр | Геймдэв | Интернет-магазин продаёт по всему миру компьютерные игры. Из открытых источников доступны исторические данные о продажах игр, оценки пользователей и экспертов, жанры и платформы. Выявлены параметры, определяющие успешность игры в разных регионах мира. Выявлен потенциально популярный продукт и спланированы рекламные кампании. Выбран актуальный период для анализа. Составлены портреты пользователей каждого региона. Проверены гипотезы: средние пользовательские рейтинги платформ Xbox One и PC одинаковые; средние пользовательские рейтинги жанров Action и Sports разные. При анализе использовались критерий Стьюдента для независимых выборок. | Pandas Matplotlib math NumPy SciPy Statsmodels |
5 | Определение выгодного тарифа для телеком компании | Телеком | Оператор мобильной связи выяснил: многие клиенты пользуются архивными тарифами. Проведен предварительный анализ использования тарифов на выборке клиентов, проанализировано поведение клиентов при использовании услуг оператора и рекомендованы оптимальные наборы услуг для пользователей. Проверены гипотезы о различии выручки абонентов разных тарифов и различии выручки абонентов из Москвы и других регионов. Определен выгодный тарифный план для корректировки рекламного бюджета. Разработана система, способная проанализировать поведение клиентов и предложить пользователям новый тариф. Построена модель для задачи классификации, которая выберет подходящий тариф. Построена модель с максимально большим значением accuracy. Доля правильных ответов доведена до 0.75. Проверены accuracy на тестовой выборке. | Pandas Matplotlib проверка статистических гипотез
NumPy sklearn машинное обучение
описательная статистика |
6 | Отток клиентов банка | Финансы, банки | Из банка стали уходить клиенты каждый месяц. Спрогнозирована вероятность ухода клиента из банка в ближайшее время. Построена модель с предельно большим значением F1-меры с последующей проверкой на тестовой выборке. Доведена метрика до 0.59. Дополнительно измерен AUC-ROC, соотнесен с F1-мерой. Обучение с учителем. Работа с несбалансированными данными. | Pandas Matplotlib NumPy sklearn машинное обучение
|
7 | Выбор региона для разработки новых нефтяных месторождений | Добывающая промышленность | Добывающей компании «ГлавРосГосНефть» нужно решить, где бурить новую скважину. Собраны характеристики пробы нефти для скважин: качество нефти и объём её запасов по трем регионам. Характеристики для каждой скважины в регионе уже известны. Построена модель для предсказания объёма запасов в новых скважинах. Выбраны скважины с самыми высокими оценками значений. Определены регионы с максимальной суммарной прибылью отобранных скважин. Построена модель для определения региона, где добыча принесёт наибольшую прибыль. Проанализирована возможная прибыль и риски техникой Bootstrap. | Pandas Matplotlib NumPy Bootstrap sklearn машинное обучение
|