Skip to content

DmAlKr76/my_roadmap

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

23 Commits
 
 
 
 

Repository files navigation

Data Science Roadmap


Data Engineering

Courses

URL Title Status
karpov.courses Инженер данных Completed
SkillFactory Курс по Data Engineering Completed
HSE MLops: начало Completed
karpov.courses Docker с нуля Completed
T1 Открытая школа для инженеров данных Completed

Projects

URL Title Tools
GitHub Классификация водителей PySpark, MLFlow
GitHub Задачи банковского сектора PySpark
GitHub Задачи обработки данных PySpark, Airflow, PostgreSQL
GitHub Анализ данных PySpark, PyDeequ
GitHub Преобразование данных PySpark
GitHub Map-Reduce приложение Hadoop
GitHub Обучение моделей MLFlow, Airflow, Sklearn, S3, PostgreSQL
GitHub ETL Airflow
GitHub DBMS PostgreSQL
GitHub Проектирование DWH Dimension modeling, Data Vault, Anchor modeling
GitHub Визуализация Tableau

Books

Title Author Status
Apache Airflow и конвейеры обработки данных Бас Харенслак, Джулиан де Руйтер In Progress

Data Science

Courses

URL Title Status
SkillFactory Полный курс по Data Science Completed
karpov.courses Симулятор SQL Completed
karpov.courses Математика для Data Science In Progress
stepik.org "Поколение Python": курс для начинающих Completed
stepik.org "Поколение Python": курс для продвинутых Completed
stepik.org "Поколение Python": курс для профессионалов In Progress
stepik.org "Поколение Python": ООП In Progress

Projects

URL Title Tools
GitHub Определение уязвимых групп населения PCA, TSNE, Umap, KMeans, DBSCAN, GaussianMixture, AgglomerativeClustering, SpectralClustering, Folium
GitHub Сборка проекта и оркестрация приложений Sklearn, Pika, Docker-compose
GitHub Примеры реализации рекомендательных систем Pandas, Numpy, Scipy, Lightfm
GitHub Исследование временного ряда и построение модели Statsmodels, ARIMA, auto_arima
GitHub RFM - сегментация клиентов интернет-магазина KMeans, GaussianMixture, AgglomerativeClustering, GridSearchCV, RandomForestClassifier, GradientBoostingClassifier
GitHub Классификация спам-сообщений (Naive Bayes) CountVectorizer, ComplementNB
GitHub Прогнозирование длительности поездки на такси KMeans, SelectKBest, LinearRegression (Ridge), DecisionTreeRegressor, RandomForestRegressor, GradientBoostingRegressor, XGBoost
GitHub Классификация клиентов банка для повышения результативности маркетинговой кампании LogisticRegression, DecisionTreeClassifier, GridSearchCV, RandomForestClassifier, GradientBoostingClassifier, StackingClassifier, Optuna
GitHub Предсказание биологического ответа молекул по их химическому составу LogisticRegression, RandomForestClassifier, GridSearchCV, RandomizedSearchCV, Hyperopt, Optuna
GitHub Предсказание рейтинга отелей для выявления возможной накрутки Pandas, Sklearn, nltk
GoogleDocs Анализ рынка труда SQL
GitHub Выявление признаков, оказывающих влияние на уровень желаемой заработной платы Pandas, Matplotlib, Seaborn, Plotly
GitHub Выявление признаков, оказывающих влияние на отток клиентов Pandas, Matplotlib, Seaborn, Plotly

Books

Title Author Status
Грокаем глубокое обучение Эндрю Траск Completed

Deep Learning and Neural Networks

Courses

URL Title Status
SkillFactory Нейронные сети и Deep Learning Completed
SkillFactory NLP-инженер Completed

Projects

URL Title Tools
GitHub Задача классификации текстов (LSTM & Bert) Torch
GitHub Задача нахождения похожих товаров в интернет-магазинах (TF-IDF & Word2Vec) TfidfVectorizer
GitHub Задача по сегментации людей на фотографии Keras maskrcnn, keras_retinanet
GitHub Идентификация ядер клеток (задача сегментации - U-Net) Tensorflow, ImageDataAugmentor, Albumentations
GitHub Предсказание жанра фильма по его описанию (NLP, Bert) Tensorflow
GitHub Классификация автомобиля по фото (Fine Tuning, Augmentation, TTA) Tensorflow, ImageDataAugmentor, Albumentations
GitHub Классификация одежды по датасету Fashion MNIST Tensorflow
GitHub Распознавание изображения из датасета CIFAR-10 (CNN) Tensorflow
GitHub Распознавание буквы английского алфавита (CNN) Tensorflow

Data Analysis

Courses

URL Title Status
SkillFactory Полный курс по анализу данных Completed
karpov.courses Симулятор SQL Completed
stepik.org "Поколение Python": курс для начинающих Completed
stepik.org "Поколение Python": курс для продвинутых Completed
stepik.org "Поколение Python": курс для профессионалов In Progress
stepik.org "Поколение Python": ООП In Progress

Projects

URL Title Tools
GitHub Подготовка основы для рекомендательной системы SQL, Pandas, NumPy, IterTools, Collections, Pandas Profiling
GitHub A/B-тест посадочных страниц Pandas, NumPy, Matplotlib, Scipy.stats
GitHub Посчет показателей Retention Rate седьмого дня и ARPPU до и после внедрения фичи Pandas, NumPy, psycopg2
GitHub Анализ посещяемости сайта ботами Pandas, Requests, json
GitHub Валидация гипотез Pandas
GitHub Выявление зависимостей и различий Pandas
GoogleDocs Анализ эффективности работы компании SQL
GitHub Power BI Power BI
GoogleSheets Определение маркетинговых и продуктовых показателей бизнеса Google Sheets

Books

Title Author Status
Pandas. Работа с данными Абдрахманов М.И. Completed

Web-development

Courses

URL Title Status
SkillFactory Fullstack-разработчик на Python Completed
SkillFactory Тестировщик-автоматизатор на Python Completed

Projects

URL Title Tools
QA
GitHub Тестировние основных страниц интернет-магазина PyTest, Selenium, PageObject
GitHub Тестировние основных страниц сайта Selenium
GitHub Тестировние API сайта PyTest
Fullstack
GitHub Сервер на aiohttp requests, aiohttp
GitHub Приложение с рецептами Django, React
GitHub Сервис просмотра информации о погоде React
GitHub Фан-клуб компьютерной игры Django
GitHub Новостной портал Django
GitHub Установка и настройка webpack-dev-server
GitHub Cтраница-резюме с использованием адаптивной верстки
GitHub Базовый мессенджер на JS и Django RF
JavaScript tasks
GitHub База
GitHub Функции
GitHub ООП
Other
GitHub Telegram-бот курсов валют
GitHub Консольные игры "Крестики-нолики" и "Морской бой"
GitHub Бинарный поиск
GitHub Пользователи и права в Linux

Books

Title Author Status
Python. unittest Абдрахманов М.И. Completed

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published