# Что такое машинное обучение

Машинное обучение (Machine Learning) — обширный подраздел искусственного интеллекта, изучающий методы построения алгоритмов, способных обучаться. 
Машинное обучение находится на стыке математической статистики, методов оптимизации и классических математических дисциплин, но имеет также и собственную специфику, связанную с проблемами вычислительной эффективности и переобучения. Многие методы  обучения разрабатывались как альтернатива классическим статистическим подходам. Многие методы тесно связаны с извлечением информации и интеллектуальным анализом данных (Data Mining).

Машинное обучение — не только математическая, но и практическая, инженерная дисциплина. Чистая теория, как правило, не приводит сразу к методам и алгоритмам, применимым на практике. Чтобы заставить их хорошо работать, приходится изобретать дополнительные эвристики, компенсирующие несоответствие сделанных в теории предположений условиям реальных задач. Практически ни одно исследование в машинном обучении не обходится без эксперимента на модельных или реальных данных, подтверждающего практическую работоспособность метода.

# Виды машинного обучения 

Давайте попробуем определить какие задачи может решить машинное обучение.

## По типу задач

### Классификация

У нас есть некоторые данные. Например, картинка. Эти данные следует отнести к заранее определенным классам. 

Простой пример:
У нас есть фотографии. Мы хотим определить есть ли на фотографии котики. То есть, у нас есть два класса: есть кот, нет кота. Это называется бинарная классификация. 

Кот | Не кот
- | - 
![alt](img\cat.jpg) | ![alt](img\not cat.jpg)

Другой пример - это по собранным данным во время запуска компьютера определить есть ли бракованные детали или нет. И самый классический пример - это определение того, болен ли человек или нет.

Другие примеры - это многовариантная классификация. Когда у нас есть несколько классов. Например, у нас есть измерения нескольких ирисов. Допустим - это длина чашелистика, ширина чашелистика, длина лепестка и ширина лепестка. По этим измерениям надо отнести цветок к одному из видов:  Ирис щетинистый (Iris setosa), Ирис виргинский (Iris virginica) и Ирис разноцветный (Iris versicolor). Это пример носит названия ирисы Фишера. 

Ирис щетинистый  | Ирис виргинский | Ирис разноцветный
- | - | - 
![alt](img\Irissetosa1.jpg) | ![alt](img\736px-Iris_virginica.jpg) | ![alt](img\800px-Iris_versicolor_3.jpg)

### Кластеризация

Это задача нахождения структуры данных. 

У нас есть данные. Нужно найти внутреннюю информацию по данным. 

Например, у нас есть школьники. Мы хотим их поделить на 3 группы по оценкам, но мы не знаем как. Для этого мы применяем кластеризацию. 

Например, в биоинформатике с помощью неё анализируются сложные сети взаимодействующих генов, состоящие порой из сотен или даже тысяч элементов. Кластерный анализ позволяет выделить подсети, узкие места, концентраторы и другие скрытые свойства изучаемой системы, что позволяет в конечном счете узнать вклад каждого гена в формирование изучаемого феномена.

![alt](img\clustering.jpg)


### Регресия

Это построение функции $f(x_1, x_2, \cdots  , x_n) = y$, где y - это число.  

Например, по состоянию рынка (который мы характеризуем числами), определить сколько будут стоить акции фирмы Apple через неделю.

Другой пример, по влажности, количеству осадков и текущей температуре предсказать температуру на завтра.

![alt](img\regression.svg)


## По данным для обучения 

### Обучение с учителем (размеченные данные)

В данном случае мы для обучения на вход алгоритма подаем пару **[*входные данные*; выходные данные]**.

Чаще всего это классификация и регрессия. Если говорить про наши примеры, то это будет так:

Задача про котиков - данные будут в виде **[*фотография*; есть ли кот или нет его]**.

Задача про ирисы Фишера - данные будут в виде **[*размеры соцветия*; вид ириса]**.

Задача про акции - **[*состояние рынка*; цена акции Apple через неделю]**. 

Задача про погода - **[*влажность, количество осадков, текущая температура*; температура через день]**. 



### Обучение без учителя 

Это когда у нас просто есть данные. Чаще всего это кластеризация и Data mining.

Пример про школьников. У нас нет примеров того, как ученики были поделены до этого. 

### Обучение с подкреплением

Редкий вид и наиболее естественный для человека. Может применятся для всех видов. 

Это процесс обучения, в котором алгоритм (он называется агент) совершает какое-то действие и смотрит на реакцию системы. Система может как вознаградить агента или же оштрафовать. 

Простой пример - это дрессировка животного. Когда собака дает нам лапу, когда мы ее просим мы даем ей лакомство(вознаграждаем). А когда песик грызет мебель мы его ругаем, что ему не нравится (штрафуем агента).


## По типу алгоритмов 

### Статистические

Это методы, которые используют методы статистики и теории вероятности. Или различные методы оптимизации. Вся математика происходит обычно выходит из здравого смысла.

### Логико-дедуктивные
Это алгоритмы, которые базируются на логических цепочках. Классическим примером этого является категорический силлогизм:

Всякий человек смертен $\rightarrow$ Сократ человек $\rightarrow$ Сократ смертен. 

Довольно редкий случай, который используется в рекомендательных системах.


### Нейросетевые

Данные алгоритмы были вдохновлены идеями повторения/моделирования мозга человека. В данный момент снова набирают популярность. 

# Прикольные примеры

1. Восстановление отсутствующего 
 куска изображения с помощью нейронной сети:
![жми меня](img\completion.gif)
2. Управление Марио с помощью эволюционного алгоритма (взято отсюда: https://www.youtube.com/watch?v=qv6UVOQ0F44): ![жми меня, я Марио](img\giphy.gif)
3. Применение стиля одной картинки к другой: 
![alt](img\combine_images2.jpg)
4. Управления машиной: 
![alt](img\car_driving.png)

# Что от вас требуется знать и уметь:
* **Знать основы программирования или быть очень сообразительными**

# Что вы узнаете:
* Узнаете, что такое производная и где она применяется
* Научитесь работать с матрицами
* Получите информацию по основным концеям машинного обучения
* научитесь применять Python для машинного обучения

# План лекции:

1. **Матрицы и основы Python (сегодня)**

2. **Линейная регрессия**

3. **Классификация**

4. **Нейронные сети**

5. **Итоги**


# Пример работы с Jupyter:

Это называется Jupyter. В данной среде есть два вида ячеек: ячейки с кодом и ячейки с разметкой. У ячеек с кодом слева расположена надпись **In [ ]**.

Ячейки с кодом можно запускать выделив ее и нажав комбинации *Shift + Enter* или *Сtrl + Enter*. Для примера выполните код, который находится в следующей ячейке.


In [None]:
from introduction_helper import *

create_example()    

In [None]:
# Здесь будет находится задание для выполнения. Нужно писать код только внутри звёздочек.
# Например, приравняйте к переменой A значение 5.

A = 0

#***********************************************************************
# Ответ следует писать ниже

#***********************************************************************

first_task(A)