Skip to content

rtriangle/Netology-python-for-data-analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

66 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Netology: Python for Data Science

Лекция 1: Векторы и матрицы (Vectors and matrices)

  1. Вектор и операции над ним (Vector and vector operations)
  2. Матрицы и матричные операции (Matix and matrix operations)
  3. Типы матриц (Types of matrices)
  4. Собственные векторы и собственные значения (Eigenvectors and eigenvalues)
  5. Приближение матрицей меньшего ранга (Lower rank matrix approximation)
  6. Сингулярное разложение и низкоранговое приближение (Singular decomposition and lower rank matrix approximation)

Лекция 2: Производная и градиентный спуск (Derivative and gradient descent)

  1. Функции (Functions)
  2. Предел и производная (Limit and derivative)
  3. Экстремумы функции (Funcion extremum)
  4. Выпуклость функции (Convex function)
  5. Правила дифференцирования (Derivation rules)
  6. Правила дифференцирования сложной функции (Derivation rules for complex functions)
  7. Многомерные функции (Multinomial function)
  8. Градиент (Gradient)
  9. Градиентный спуск как метод оптимизации (Gradient descent as optimization method)

Лекция 3: Введение в статистику (Intro to statistics)

  1. Основные понятия о статистике: медиана, мода, стандартное отклонение, дисперсия (General statistics terms: median, mode, standard deviation, variance)
  2. Виды распределений: нормальное, равномерное (Examples of probability distributions: normal, uniform)
  3. Корреляционный анализ данных (Correlation data analysis)
  4. Коэффициенты корреляции Пирсона, Спирмена, Кендалла (Pearson correlation coefficient, Spearman's rank correlation, Kendall tau rank correlation coefficient)
  5. Матрица корреляции (Correlation matrix)

Лекция 4: Продвинутая статистика (Advanced statistics)

  1. Корреляционный анализ данных: продолжение (Correlation data analysis: continuation)
  2. Линейная регрессия (Linear regression)
  3. Функция потерь (Loss function)
  4. Ковариационная матрица (Covariance matrix)
  5. Правило трех сигм (68–95–99.7 rule)
  6. Центральная предельная теорема (Central limit theorem)
  7. Виды распределений: дискретные и непрерывные распределения (Examples of probability distributions: discrete, continuous)
  8. Дискретное равномерное распределение (Discrete uniform distribution)
  9. Логнормальное распределение (Log-normal distribution)
  10. Экспоненциальное распределение (Exponential distribution)
  11. Геометрическое распределение (Geometric distribution)
  12. Распределение Бернулли (Bernoulli distribution)
  13. Биноминальное распределение (Binomial distribution)
  14. t-критерий Стьюдента (Student's t-test)

Лекция 5: Статистическая проверка гипотез (Statistical hypothesis testing)

  1. Логистическая регрессия (Logistic regression)
  2. Сигмоида (sigmoid function)
  3. Функция ошибки в модели логистической регрессии (Loss function in logistic regression)
  4. Кросс-валидация (Cross-validation)
  5. Квантиль и квартиль (Quantile and quartile)
  6. Ошибки 1-го и 2-го рода (Type I and Type II Errors)
  7. Статистическая значимость p-value (Statistical significance, p-value)
  8. A/B тестирование (A/B testing)
  9. Тесты на нормальность (Normality test)
  10. Корреляционные тесты (Correlation tests)
  11. Проверка гипотезы t-критерия Стьюдента (Student's t-test hypothesis)
  12. Одновыборочный t-критерий (One-sample t-test)
  13. Двухвыборочный t-критерий для независимых выборок (Two-sample t-test for independent samples)
  14. Множественный тест: ANOVA (Multiple comparison analysis testing in ANOVA)

Лекция 6: Кейс стади 1 (Case study 1)

  1. Задача классификации (Classification task)
  2. Поиск причины дефекта в металле (Metal defects search)
  3. Тесты на согласие: поиск распределения (Fitting criterion: distribution detection)
  4. Проблема мультиколлинеарности (Multicollinearity)
  5. Проблема несбалансированности классов (Imbalanced classes)
  6. Пример решения задачи классификации с помощью RandomForest ()
  7. Метрики классификации (Classification metrics)
  8. Принцип минимальных компонент (PCA)
  9. ROC-кривая (ROC curve)

Лекция 7: Кейс стади 2

  1. Обработка текста (Natural language processing)
  2. Теорема Байеса и наивный байесовский классификатор (Bayes' theorem and Naive Bayes classifier)
  3. Анализ временного ряда (Time series analysis)
  4. Кластеризация: k-means, EM-алгоритм (Clusterisation: k-means, Expectation-maximization algorithm)
  5. Определение тональности текста (Sentiment analysis)
  6. Определение спама в тексте (Spam detection in text)
  7. Тестирование гипотез (Statistical hypothesis testing)

About

Linear algebra, Calculus and Statistics course for netology.ru

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published