Skip to content

Irina-Smol/Data_Engineer

Repository files navigation

Data_Engineer

Professional retraining course (Financial University)

Модуль 1. Инструменты и методы бизнес-аналитики

  • Тема 1.1 Примеры аналитических задач. Сбор данных для анализа данных
  • Тема 1.2 Инструмент работы с таблицами в режиме онлайн на примере Google-таблицы
  • Тема 1.3 Статистика и тестирование гипотез
  • Тема 1.4 Бизнес-показатели и точки роста. Анализ продуктовых метрик
  • Тема 1.5 Финансовые метрики и Маркетинговые метрики
  • Тема 1.6 Иерархия метрик и разработка отчетности. Дизайн тестов, проведение и анализ. Построение простых моделей

Модуль 2. Python и анализ данных

  • Тема 2.1 Python: Jupiter Notebook, комментарии в коде, арифметические операции. Управляющие конструкции и коллекции
  • Тема 2.2 Функции и работа с данными, основы парсинга. Работа с файловой системой и модули
  • Тема 2.3 Регулярные выражения и основы синтаксического разбора. Исключения и обработка ошибок
  • Тема 2.4 Функции и понятие класса. Библиотека NumPy: вычислительные задачи
  • Тема 2.5 Библиотека Pandas: возможности и оптимизация. Методы оптимизации Pandas
  • Тема 2.6 Статистическая проверка гипотез и A/B-тесты

Модуль 3. SQL и получение данных

  • Тема 3.1. Введение в SQL. Установка и знакомство. Основы и работа с базами данных
  • Тема 3.2. Основы SQL. Базовые запросы SQL. Фильтрация данных
  • Тема 3.3. Углубление в SQL. Агрегация данных. Группировка данных. Join. Оконные функции
  • Тема 3.4. Работа с PostgreSQL
  • Тема 3.5. "NoSql & MongoDB"
  • Тема 3.6. Примеры создания дашбордов и анализ продуктовых метрик с применением SQL

Модуль 4. Визуализация данных

  • Тема 4.1 Аналитика данных в Excel
  • Тема 4.2. BI-инструменты и визуализация данных
  • Тема 4.3. DataLens: быстрый анализ данных с визуализацией
  • Тема 4.4. Power BI. Построение моделей данных из разных неструктурированных источников: таблиц, сайтов и баз данных
  • Тема 4.5. Tableau. Основы работы с расчётными полями, фильтрами, множествами и группировками. Основные виды визуализаций. Лучшие практики визуализации
  • Тема 4.6. Создание интерактивных дашбордов

Модуль 5. Основные методы машинного обучения

  • Тема 5.1. Понятие машинного обучения. Регрессионный анализ. Линейная, полиномиальная и логарифмическая регрессия
  • Тема 5.2. Классификация. Логистическая регрессия и SVM
  • Тема 5.3. Функции потерь и оптимизация Оценка точности модели, переобучение, регуляризация
  • Тема 5.4. Проблема качества данных. Работа с пропусками Работа с переменными
  • Тема 5.5. Деревья решений Ансамблирование Поиск выбросов и генерация новых признаков
  • Тема 5.6. Алгоритмы кластеризации Улучшение качества модели

Модуль 6. Глубокое машинное обучение и обработка больших данных

  • Тема 6.1. Машинное обучение и Data Science. Основные инструменты обработки больших данных. HADOOP & SPARK
  • Тема 6.2. Введение и классификация рекомендательных систем. Коллаборативная фильтрация
  • Тема 6.3. Знакомство с временными рядами Элементарные методы анализа временных рядов Модели ARIMA, GARCH
  • Тема 6.4. Обработка естественного языка. Введение в автоматическую обработку текста Структура слова. Морфология Тематическое моделирование
  • Тема 6.5. Компьютерное зрение Выделение признаков и поиск похожих изображений Сегментация и детекция объектов
  • Тема 6.6. Подготовка модели Машинное обучения по практическому кейсу

Итоговая аттестация

About

Professional retraining course (Financial University)

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors