Здесь собраны все проекты по анализу данных, выполненные мной в учебных целях, для самообразования и хобби.
Прогноз продаж магазинов в Эквадоре
В этом проекте я провела анализ продаж магазинов в Эквадоре, установила зависимость между ценами на продукты и на нефть в этой стране, проанализировала, как сезон и цены на нефть влияют на количество совершаемых транзакций в стране.
Times Series Forecasting, Machine Learning, XGBoost, Label-Encoding, Plotly
В этом проекте я провела анализ A/B-тестирования, в котором сравнивались конверсия и CTR пользователей контрольной и тестовой группы, а также визуализировала полученные результаты
SciPy, t-statistic, p-value
Анализ вакансий data analyst на hh.ru
В этом проекте я собрала информацию с HeadHunter API о вакансиях дата-аналитика с целью составить представление о трендах и спросе на рынке труда.
NumPy, Pandas, API parsing, NLP, Seaborn, Matplotlib
Соревнование kaggle по анализу данных космического Титаника. Идея та же, что и у стандартного - предсказать, добрался ли пассажир до места назначения.
Logistic Regression, CatBoost, Decision Tree, Random Forest, Voting Classifier, XGBoost
Визуализация продаж магазина в PowerBI
Простые графики для отображения информации о продажах интернет-магазина - какие страны приносят больше прибыли, какие категории чаще покупают, как менялись продажи со временем?
MS Power BI, SQL
В этом проекте я использовала методы обучения без учителя для решения стандартной задачи распознавания цифр по картинкам 28х28 пикселей.
PCA, KNN, t-SNE, Decision Tree
-
- Тренажер по SQL (STEPIK) - интерактивный тренажер по созданию SQL-запросов.
- SQL (hackerrank) - задачи по SQL разного уровня сложности.
-
- 30 days of pandas (leetcode) - практика использования pandas для обработки данных
-
- OpenML course (Домашние задания) - домашние задания курса от ODS по основам машинного обучения, затрагивающие все классические модели машинного обучения. TF-IDF, Ridge, Lasso, Bootstrap, StandartScaler, RandomForest, BaggingClassifier, SearchCV, t-SNE, PCA, SGD, Time-Series
-
- Анализ A/B теста - анализ конверсии пользователя, T-test, Chi2-test, SciPy
- Курс Hackerrank "10 дней статистики" - 10 уроков по основам статистики с практикой
- Machine Learning, Data Visualization, Statistics, NLP, A/B testing Analysis, Time Series Analysis
- Языки: Python (Pandas, Numpy, Scikit-Learn, Scipy, Keras, Matplotlib), SQL, C++
- Инструменты: MySQL, Git, PowerBI, PySpark, MS Excel