# Билеты к экзамену

## 1. Основные принципы ООП в Python
- **Инкапсуляция**: объединение данных и методов в одном объекте, использование модификаторов доступа (`public`, `_protected`, `__private`).
- **Наследование**: возможность создания новых классов на основе существующих.
- **Полиморфизм**: использование методов и операций одинаковым образом для разных типов объектов.
- **Абстракция**: выделение значимой информации, использование абстрактных классов и интерфейсов через модуль `abc`.

## 2. Создание и использование методов класса. Атрибуты класса и экземпляра
- **Методы класса** создаются с декоратором `@classmethod` и имеют доступ к атрибутам класса через аргумент `cls`.
- **Методы экземпляра** создаются без дополнительных декораторов, используют `self` для работы с атрибутами экземпляра.
- **Атрибуты класса**: общие для всех экземпляров, определяются внутри класса.
- **Атрибуты экземпляра**: уникальны для каждого экземпляра, создаются через `self`.

## 3. Способы наследования и переопределение методов
- **Простое наследование**: один родительский класс.
- **Множественное наследование**: наследование от нескольких классов.
- **Полиморфизм и переопределение**: изменение методов базового класса в подклассе, используя ту же сигнатуру.

## 4. Машинное обучение
Что такое машинное обучение?
Машинное обучение (Machine Learning, ML) — это область искусственного интеллекта, которая занимается разработкой алгоритмов, способных автоматически выявлять закономерности в данных и принимать решения на их основе без явного программирования. Машинное обучение позволяет компьютерам учиться и улучшать свою работу с опытом.

Применение машинного обучения в Python
Python — один из самых популярных языков программирования для машинного обучения благодаря обширной экосистеме библиотек и инструментов:

Библиотеки для работы с данными: pandas, numpy.
Библиотеки для обучения моделей: scikit-learn, TensorFlow, PyTorch, XGBoost.
Библиотеки для визуализации данных: matplotlib, seaborn.
Примеры применения:

Классификация: распознавание изображений, спам-фильтры.
Регрессия: прогнозирование цен, анализ временных рядов.
Кластеризация: сегментация пользователей, поиск закономерностей в данных.
Рекомендательные системы: рекомендации товаров или фильмов.
Основные типы машинного обучения
Обучение с учителем (Supervised Learning)

Описание: Модель обучается на размеченных данных, где каждому входному набору соответствует правильный выход.
Примеры задач:
Классификация (предсказание категорий).
Регрессия (предсказание числовых значений).
Пример: Использование данных о прошлых продажах для прогнозирования дохода.
Обучение без учителя (Unsupervised Learning)

Описание: Модель работает с неразмеченными данными, цель — выявить структуру данных.
Примеры задач:
Кластеризация (группировка данных).
Снижение размерности (уменьшение количества признаков).
Пример: Сегментация клиентов по поведению.
Обучение с подкреплением (Reinforcement Learning)

Описание: Модель учится через взаимодействие с окружающей средой, получая вознаграждение за правильные действия.
Примеры задач:
Управление роботами.
Игра в шахматы или го.
Пример: Разработка алгоритма для автономного автомобиля.
Отличия между типами
Тип обучения	Данные	Основная цель	Примеры задач
С учителем	Размеченные	Предсказание на основе опыта	Классификация, регрессия
Без учителя	Неразмеченные	Поиск структуры в данных	Кластеризация, PCA
С подкреплением	Действия и награды	Максимизация вознаграждения	Управление, игры







## 5. Библиотеки для машинного обучения
- **Основные библиотеки**:
  - `scikit-learn`: алгоритмы и инструменты для обучения.
  - `pandas`, `numpy`: работа с данными.
- **Обучающая и тестовая выборки**:
  - Обучающая: данные для построения модели.
  - Тестовая: данные для проверки качества.

## 6. Линейная регрессия и кросс-валидация
- **Линейная регрессия**: предсказание на основе линейной зависимости.
- **Кросс-валидация**: разбиение данных на множество подвыборок для оценки модели (`cross_val_score` из `scikit-learn`).

## 7. Переобучение и гиперпараметры
- **Переобучение**: модель слишком хорошо обучается на обучающей выборке и плохо работает на новых данных.
  - Методы борьбы: регуляризация, увеличение данных, ранняя остановка.
- **Гиперпараметры**: параметры, которые настраиваются вручную.

## 8. Алгоритм KNN
- **K-Nearest Neighbors**: классификация/регрессия на основе ближайших соседей. Использует расстояния (не обязательно евклидово).

## 9. Метрики оценки качества моделей
- **Классификация**:
  - Accuracy, Precision, Recall, F1-score.
- **Регрессия**:
  - MSE, RMSE, R².

## 10. Логистическая регрессия
- Моделирование вероятностей бинарного события с помощью сигмоидной функции.

## 11. Алгоритм SVM
- Поиск гиперплоскости, разделяющей классы с максимальным зазором (margin).

## 12. Дерево решений
- Алгоритм, разделяющий данные по значениям признаков, создавая дерево решений с условиями на каждом узле.