# Лекция: Введение в AutoML для классификации текстов и изображений

### Цель лекции:
Познакомить студентов с основами автоматизированного машинного обучения (AutoML) на примере классификации текстов и изображений.

### Структура лекции:
1. Введение в AutoML.
2. Классификация текстов с помощью AutoML.
3. Классификация изображений с помощью AutoML.
4. Практический пример с Azure Machine Learning [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2).
5. Задачи для самостоятельного изучения.


## 1. Введение в AutoML
- **Что такое AutoML?**
  - Автоматическое машинное обучение (AutoML) — технология, автоматизирующая этапы создания моделей: выбор алгоритмов, настройку параметров и оценку качества [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2), [5](https://itexpert.work/ru/data-science-trends/).
- **Почему AutoML полезен?**
  - Упрощает процесс для новичков, экономит время[1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2).
  - Автоматически подбирает лучшие гиперпараметры и архитектуры [2](https://cyberleninka.ru/article/n/sistemy-automl-kak-sovremennyy-instrument-dlya-postroeniya-modeley-mashinnogo-obucheniya), [3](https://cyberleninka.ru/article/n/avtomaticheskoe-mashinnoe-obuchenie-automl-algoritmy-i-instrumenty-dlya-snizheniya-poroga-vhoda).
- **Примеры платформ:**
  - **Azure Machine Learning** (Microsoft) [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2).
  - **AWS SageMaker** (Amazon) [7](https://infostart.ru/1c/articles/1482928/).
  - **Google AutoML** (Google Cloud).


## 2. Классификация текстов в AutoML
- **Пример задачи:**
  - Классификация отзывов на фильмы (положительный/отрицательный) [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2).
- **Как AutoML это решает?**
  1. **Подготовка данных:**
     - Автоматическая токенизация текста.
     - Устранение шума (например, стоп-слова).
  2. **Обучение модели:**
     - Автоматический выбор алгоритма (например, случайный лес, нейронные сети).
     - Оптимизация параметров без ручного вмешательства [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2), [5](https://itexpert.work/ru/data-science-trends/).
- **Преимущества:**
  - Начинающие могут фокусироваться на данных, а не на настройках [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2).


## 3. Классификация изображений в AutoML
- **Пример задачи:**
  - Распознавание изображений (например, кошки/собаки).
- **Как AutoML это решает?**
  1. **Подготовка данных:**
     - Автоматическая аугментация данных (например, вращение, зеркало) [8]().
     - Разделение на обучающую и тестовую выборки.
  2. **Обучение модели:**
     - Выбор архитектуры (например, ResNet, CNN).
     - Автоматическая настройка слоев и параметров [7](https://infostart.ru/1c/articles/1482928/).
- **Пример платформы:**
  - Azure Machine Learning поддерживает работу с изображениями через встроенные инструменты [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2).


## 4. Практический пример: Классификация текстов в Azure Machine Learning [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2)
### Шаги:
1. **Загрузка данных:**
   - Загрузите датасет (например, отзывы на фильмы).
2. **Настройка эксперимента:**
   - Выберите задачу: классификация.
   - Укажите целевой столбец (например, 'sentiment').
3. **Обучение модели:**
   - Автоматический поиск оптимальной модели (например, Logistic Regression, SVM).
   - Визуализация процесса обучения.
4. **Оценка результата:**
   - Точность, F1-мера, матрица ошибок.
5. **Использование модели:**
   - Интеграция в приложения или веб-сервисы.

### Пример кода в Azure:
```python
# Создание эксперимента
from azureml.core.workspace import Workspace
workspace = Workspace.from_config()

# Загрузка данных
dataset = Dataset.get_by_name(workspace, 'movie_reviews')

# Настройка AutoML
automl_config = AutoMLConfig(
    task='classification',
    primary_metric='accuracy',
    training_data=dataset
)

# Запуск эксперимента
experiment = Experiment(workspace, 'text_classification')
run = experiment.submit(automl_config)
run.wait_for_completion()
```

### Пояснение:
- **AutoMLConfig**: Указываем задачу (классификация) и метрику (точность) [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2).
- **experiment.submit()**: Автоматический запуск обучения и сравнение моделей.


## 5. Задачи для самостоятельного изучения
### Задача 1: Классификация изображений
1. **Цель:** Классифицировать изображения цветов на виды (роза, тюльпан, гвоздика).
2. **Инструменты:**
   - Используйте Azure Machine Learning [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2) .
   - Датасет: https://www.kaggle.com/datasets/alxmamaev/flowers-recognition.
3. **Подсказки:**
   - Настройте аугментацию данных (например, изменение яркости).
   - Сравните точность моделей: CNN vs. AutoML.

### Задача 2: Анализ тональности текста
1. **Цель:** Определить положительный/отрицательный тон отзывов о продуктах.
2. **Инструменты:**
   - Используйте Azure Machine Learning или Azure Notebooks.
3. **Датасет:**
   - IMDb movie reviews (25,000 примеров) [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2).
4. **Этапы:**
   - Загрузите данные через AutoML.
   - Автоматически обучите модель и проанализируйте результаты.


## Вопросы для самоконтроля
1. Как AutoML упрощает процесс создания моделей для новичков? [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2), [5](https://itexpert.work/ru/data-science-trends/)
2. Чем отличается классификация текста от классификации изображений в AutoML? [7](https://infostart.ru/1c/articles/1482928/), [8]()
3. Какие метрики качества обычно используются в AutoML? [1](https://learn.microsoft.com/ru-ru/azure/machine-learning/component-reference-v2/text-classification?view=azureml-api-2)
4. Что такое аугментация данных, и зачем она нужна? [8](https://habr.com/ru/articles/680514/)

## Дополнительные ресурсы
- **Azure Machine Learning Documentation**: [11](https://docs.microsoft.com/azure/machine-learning).
- **Хакатон для практики**: Примеры задач на платформе Microsoft Azure [4](https://habr.com/ru/articles/696056/).
- **Основы Data Science**: Подробнее о процессе анализа данных [5](https://itexpert.work/ru/data-science-trends/).
