- Вектор и операции над ним (Vector and vector operations)
- Матрицы и матричные операции (Matix and matrix operations)
- Типы матриц (Types of matrices)
- Собственные векторы и собственные значения (Eigenvectors and eigenvalues)
- Приближение матрицей меньшего ранга (Lower rank matrix approximation)
- Сингулярное разложение и низкоранговое приближение (Singular decomposition and lower rank matrix approximation)
- Функции (Functions)
- Предел и производная (Limit and derivative)
- Экстремумы функции (Funcion extremum)
- Выпуклость функции (Convex function)
- Правила дифференцирования (Derivation rules)
- Правила дифференцирования сложной функции (Derivation rules for complex functions)
- Многомерные функции (Multinomial function)
- Градиент (Gradient)
- Градиентный спуск как метод оптимизации (Gradient descent as optimization method)
- Основные понятия о статистике: медиана, мода, стандартное отклонение, дисперсия (General statistics terms: median, mode, standard deviation, variance)
- Виды распределений: нормальное, равномерное (Examples of probability distributions: normal, uniform)
- Корреляционный анализ данных (Correlation data analysis)
- Коэффициенты корреляции Пирсона, Спирмена, Кендалла (Pearson correlation coefficient, Spearman's rank correlation, Kendall tau rank correlation coefficient)
- Матрица корреляции (Correlation matrix)
- Корреляционный анализ данных: продолжение (Correlation data analysis: continuation)
- Линейная регрессия (Linear regression)
- Функция потерь (Loss function)
- Ковариационная матрица (Covariance matrix)
- Правило трех сигм (68–95–99.7 rule)
- Центральная предельная теорема (Central limit theorem)
- Виды распределений: дискретные и непрерывные распределения (Examples of probability distributions: discrete, continuous)
- Дискретное равномерное распределение (Discrete uniform distribution)
- Логнормальное распределение (Log-normal distribution)
- Экспоненциальное распределение (Exponential distribution)
- Геометрическое распределение (Geometric distribution)
- Распределение Бернулли (Bernoulli distribution)
- Биноминальное распределение (Binomial distribution)
- t-критерий Стьюдента (Student's t-test)
- Логистическая регрессия (Logistic regression)
- Сигмоида (sigmoid function)
- Функция ошибки в модели логистической регрессии (Loss function in logistic regression)
- Кросс-валидация (Cross-validation)
- Квантиль и квартиль (Quantile and quartile)
- Ошибки 1-го и 2-го рода (Type I and Type II Errors)
- Статистическая значимость p-value (Statistical significance, p-value)
- A/B тестирование (A/B testing)
- Тесты на нормальность (Normality test)
- Корреляционные тесты (Correlation tests)
- Проверка гипотезы t-критерия Стьюдента (Student's t-test hypothesis)
- Одновыборочный t-критерий (One-sample t-test)
- Двухвыборочный t-критерий для независимых выборок (Two-sample t-test for independent samples)
- Множественный тест: ANOVA (Multiple comparison analysis testing in ANOVA)
- Задача классификации (Classification task)
- Поиск причины дефекта в металле (Metal defects search)
- Тесты на согласие: поиск распределения (Fitting criterion: distribution detection)
- Проблема мультиколлинеарности (Multicollinearity)
- Проблема несбалансированности классов (Imbalanced classes)
- Пример решения задачи классификации с помощью RandomForest ()
- Метрики классификации (Classification metrics)
- Принцип минимальных компонент (PCA)
- ROC-кривая (ROC curve)
- Обработка текста (Natural language processing)
- Теорема Байеса и наивный байесовский классификатор (Bayes' theorem and Naive Bayes classifier)
- Анализ временного ряда (Time series analysis)
- Кластеризация: k-means, EM-алгоритм (Clusterisation: k-means, Expectation-maximization algorithm)
- Определение тональности текста (Sentiment analysis)
- Определение спама в тексте (Spam detection in text)
- Тестирование гипотез (Statistical hypothesis testing)