Skip to content

Здесь собраны все проекты по анализу данных, выполненные мной в учебных целях, для самообразования и хобби.

Notifications You must be signed in to change notification settings

merae70/Portfolio

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 

Repository files navigation

Портфолио data scientist - Бабушкина Дарья

Здесь собраны все проекты по анализу данных, выполненные мной в учебных целях, для самообразования и хобби.

Проекты

Прогноз продаж магазинов в Эквадоре

В этом проекте я провела анализ продаж магазинов в Эквадоре, установила зависимость между ценами на продукты и на нефть в этой стране, проанализировала, как сезон и цены на нефть влияют на количество совершаемых транзакций в стране.

Times Series Forecasting, Machine Learning, XGBoost, Label-Encoding, Plotly

АБ тест конверсии и CTR

В этом проекте я провела анализ A/B-тестирования, в котором сравнивались конверсия и CTR пользователей контрольной и тестовой группы, а также визуализировала полученные результаты

SciPy, t-statistic, p-value

Анализ вакансий data analyst на hh.ru

В этом проекте я собрала информацию с HeadHunter API о вакансиях дата-аналитика с целью составить представление о трендах и спросе на рынке труда.

NumPy, Pandas, API parsing, NLP, Seaborn, Matplotlib

Spaceship Titanic (kaggle)

Соревнование kaggle по анализу данных космического Титаника. Идея та же, что и у стандартного - предсказать, добрался ли пассажир до места назначения.

Logistic Regression, CatBoost, Decision Tree, Random Forest, Voting Classifier, XGBoost

Визуализация продаж магазина в PowerBI

Простые графики для отображения информации о продажах интернет-магазина - какие страны приносят больше прибыли, какие категории чаще покупают, как менялись продажи со временем?

MS Power BI, SQL

Digit Recognizer

В этом проекте я использовала методы обучения без учителя для решения стандартной задачи распознавания цифр по картинкам 28х28 пикселей.

PCA, KNN, t-SNE, Decision Tree

Еще работы:

Навыки:

  • Machine Learning, Data Visualization, Statistics, NLP, A/B testing Analysis, Time Series Analysis
  • Языки: Python (Pandas, Numpy, Scikit-Learn, Scipy, Keras, Matplotlib), SQL, C++
  • Инструменты: MySQL, Git, PowerBI, PySpark, MS Excel

Сертификаты:

About

Здесь собраны все проекты по анализу данных, выполненные мной в учебных целях, для самообразования и хобби.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published