Skip to content
View CyberEfrem's full-sized avatar
Block or Report

Block or report CyberEfrem

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Please don't include any personal information such as legal names or email addresses. Maximum 100 characters, markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
CyberEfrem/README.md
  • 👋 Привет! Меня зовут Ефрем Несынов.

  • 🌱 Обучился по направлению Data Science в Яндекс.Практикуме (окончание обучения 05.2022)

  • 📫 Со мной можно связаться по почте efrem-1991@ya.ru и тел. +7 925 66 17 222

✨ Здесь можно ознакомиться с моими учебными проектами: ✨

Название проекта Сфера Описание Стек
1 Исследование надёжности заёмщиков Финансы Предобработка данных, поиск и устранение пропусков, дубликатов; лемматизация; категоризация и вывод сводных таблиц; исследовательский анализ данных. Python pymystem3 Pandas NumPy
2 Исследование объявлений о продаже квартир Недвижимость Поиск и устранение проблем в данных; построение графиков и формирование сводных таблиц; расчет корелляции и интерпретация взаимосвязей. Pandas Matplotlib NumPy
3 Определение перспективного тарифа для телеком компании Телеком Подготовка данных, выявление в них проблем; построение графиков распределений, их интерпретация; расчёт стандартного отклонения, дисперсии; формирование нулевой и альтернативной гипотезы; проверка и интерпретация гипотез. Pandas Matplotlib math NumPy SciPy Statsmodels
4 Изучение закономерностей, определяющих успешность игр Геймдэв Интернет-магазин продаёт по всему миру компьютерные игры. Из открытых источников доступны исторические данные о продажах игр, оценки пользователей и экспертов, жанры и платформы. Выявлены параметры, определяющие успешность игры в разных регионах мира. Выявлен потенциально популярный продукт и спланированы рекламные кампании. Выбран актуальный период для анализа. Составлены портреты пользователей каждого региона. Проверены гипотезы: средние пользовательские рейтинги платформ Xbox One и PC одинаковые; средние пользовательские рейтинги жанров Action и Sports разные. При анализе использовались критерий Стьюдента для независимых выборок. Pandas Matplotlib math NumPy SciPy Statsmodels
5 Определение выгодного тарифа для телеком компании Телеком Оператор мобильной связи выяснил: многие клиенты пользуются архивными тарифами. Проведен предварительный анализ использования тарифов на выборке клиентов, проанализировано поведение клиентов при использовании услуг оператора и рекомендованы оптимальные наборы услуг для пользователей. Проверены гипотезы о различии выручки абонентов разных тарифов и различии выручки абонентов из Москвы и других регионов. Определен выгодный тарифный план для корректировки рекламного бюджета. Разработана система, способная проанализировать поведение клиентов и предложить пользователям новый тариф. Построена модель для задачи классификации, которая выберет подходящий тариф. Построена модель с максимально большим значением accuracy. Доля правильных ответов доведена до 0.75. Проверены accuracy на тестовой выборке. Pandas Matplotlib проверка статистических гипотез NumPy sklearn машинное обучение описательная статистика
6 Отток клиентов банка Финансы, банки Из банка стали уходить клиенты каждый месяц. Спрогнозирована вероятность ухода клиента из банка в ближайшее время. Построена модель с предельно большим значением F1-меры с последующей проверкой на тестовой выборке. Доведена метрика до 0.59. Дополнительно измерен AUC-ROC, соотнесен с F1-мерой. Обучение с учителем. Работа с несбалансированными данными. Pandas Matplotlib NumPy sklearn машинное обучение
7 Выбор региона для разработки новых нефтяных месторождений Добывающая промышленность Добывающей компании «ГлавРосГосНефть» нужно решить, где бурить новую скважину. Собраны характеристики пробы нефти для скважин: качество нефти и объём её запасов по трем регионам. Характеристики для каждой скважины в регионе уже известны. Построена модель для предсказания объёма запасов в новых скважинах. Выбраны скважины с самыми высокими оценками значений. Определены регионы с максимальной суммарной прибылью отобранных скважин. Построена модель для определения региона, где добыча принесёт наибольшую прибыль. Проанализирована возможная прибыль и риски техникой Bootstrap. Pandas Matplotlib NumPy Bootstrap sklearn машинное обучение

Popular repositories Loading

  1. CyberEfrem CyberEfrem Public

    Config files for my GitHub profile.

  2. Borrower-Reliability-Research Borrower-Reliability-Research Public

    Исследование надёжности заёмщиков

    Jupyter Notebook

  3. apartment-market-research apartment-market-research Public

    Исследование объявлений о продаже квартир

    Jupyter Notebook

  4. telecom-company-research telecom-company-research Public

    Определение перспективного тарифа для телеком-компании

    Jupyter Notebook

  5. yandex_praktikum_da yandex_praktikum_da Public

    Forked from dsibi/yandex_praktikum_da

    My projects for Data Analysis course by Yandex Praktikum

    Jupyter Notebook

  6. game_dev_research game_dev_research Public

    Jupyter Notebook