#### Пример 1. Иллюстрация возможностей iPython Notebook — идентификация галактик
Среда iPython Notebook может использовать мощные библиотеки Python, которые охватывают все: от статистики и машинного обучения до обработки сигналов и изображений. В этом примере используется библиотека изображений изображения scikit-image для идентификации галактик в изображении неба, предоставленного космическим телескопом Хаббл, с использованием алгоритма обнаружения, известного как определитель Гессе.

Импортируйте библиотеки matplotlib для построение графиков и иллюстраций, skimage для анализа изображений и interact для создания графического интерфейса:

In [11]:
from matplotlib import pyplot as plt
from skimage import data
from skimage.feature import blob_doh
from skimage.color import rgb2gray
from ipywidgets import interact, fixed

Выгружаем первый участок неба размером 500x500px из изображения, полученного телескопом Хабл:

In [12]:
image = data.hubble_deep_field()[0:500, 0:500]
image_gray = rgb2gray(image)

Создаем функцию — изображение с размеченными галактиками:

In [13]:
def plot_blobs(max_sigma=30, threshold=0.1, gray=False):
    blobs = blob_doh(image_gray, max_sigma=max_sigma, threshold=threshold)
    fig, ax = plt.subplots(figsize=(8,8))
    ax.set_title('Галактики в созвездии Большой Медведицы')
    if gray:
        ax.imshow(image_gray, interpolation='nearest', cmap='gray_r')
        circle_color = 'red'
    else:
        ax.imshow(image, interpolation='nearest')
        circle_color = 'yellow'
    for blob in blobs:
        y, x, r = blob
        c = plt.Circle((x, y), r, color=circle_color, linewidth=2, fill=False)
        ax.add_patch(c)

Создаем пользовательский интерфейс для регулировки настроек:

In [14]:
interact(plot_blobs, max_sigma=(10, 40, 2), threshold=(0.005, 0.02, 0.001));

interactive(children=(IntSlider(value=30, description='max_sigma', max=40, min=10, step=2), FloatSlider(value=…

Попробуйте посмотреть, как изменение настроек влияет на результат

# Станьте практиком машинного обучения на Python за 14 дней
## § 0. Введение
Этот мини-курс позволит вам за 14 дней узнать, с чего начать изучение машинного обучения, как строить модели прогнозирования, используя машинное обучение и Python, как улучшать точность моделей.

#### Целевая аудитория
Прежде чем мы начнем, давайте условимся о некоторых вводных. В списке ниже вы найдёте описание целевой аудитории данного курса. Не паникуйте, если вы точно не соответствуете следующим пунктам, вам просто нужно будет освежить свои знания в той или иной области, чтобы не отставать.

1. Разработчики, которые знают, как писать небольшой код. Это означает, что вам не сложно будет использовать новый язык программирования, например, Python, после освоения базового синтаксиса. Для этого не обязательно быть мастером кода, но легче освоить этот курс будет тем, кто знаком с С-подобными языками программирования.
2. Разработчики, которые предварительно знакомы с машинным обучением. Это означает, что вы знаете основы машинного обучения, разбираетесь в кросс-валидации, некоторых алгоритмах и компромиссе между смещением и дисперсией. Не факт, что вы пишете докторскую по теме машинного обучения, но желательно, чтобы вы знали ключевые термины, или понимали, где найти необходимые объяснения.

Этот мини-курс не является учебником программирования на Python или  учебником по компьютерному обучению. Он призван помочь разработчикам, которые поверхностно знакомы с машинным обучением, стать разработчиками, которые способны получать результаты на Python, одной из самых мощных и популярных платформ для машинного обучения.
#### Обзор мини-курса 
Этот мини-курс состоит из 14 уроков. Вы можете выполнять один урок в день (рекомендуется) или выполнить все уроки за один день (хард-кор!). Это зависит только от времени, которым вы располагаете, и от вашего энтузиазма. Итак,  представляем вам 14 уроков, которые помогут начать работу с машинным обучением на Python:
1. Загрузка и установка экосистем Python и SciPy
2. Знакомство с Python, NumPy, Matplotlib и Pandas
3. Загрузка данных из CSV
4. Анализ данных методами описательной статистики
5. Визуализация данных
6. Предварительная обработка данных для моделирования
7. Определение качества модели с помощью ресемплинга
8. Показатели качества модели
9. Выбор алгоритма машинного обучения
10. Сравнение и выбор модели
11. Повышение точности с помощью настройки алгоритма
12. Объединение моделей для улучшения точности прогнозов
13. Завершение и сохранение вашей модели
14. Решение задачи «Ирисы Фишера»

Каждый урок может занять как 60 секунд, так и 30 минут. Не торопитесь и занимайтесь в удобном для вас темпе. Уроки предполагают вашу готовность к самостоятельному поиску информации. Мы включили в текст подсказки, но часть обучения заключается в том, чтобы вы нашли, куда можно обратиться за помощью и где узнать о платформе Python. Наибольшее количество подсказок вы найдёте в первых уроках, что поможет вам приобрести уверенность в себе и инерцию. Не сдавайтесь!

In [1]:
print('Hello')

Hello


Попробуйте запустить сами, поставив курсор на ячейку и зажав shift + Enter

In [2]:
print('hello')

hello


А теперь сами напишите какой-нибудь код и запустите:

Можно ловко импортировать библиотеки и глянуть их версии:

In [4]:
# scipy  
import scipy  
print(scipy.__version__)

1.1.0


Проверьте версии библиотек, необходимых для машинного обучения (запустите код):

In [None]:
# Импортируйте библиотеку Sys и узнайте версию Python
import sys  
print('Python: {}'.format(sys.version))
# Импортируйте scipy и узнайте ее версию
import scipy  
print('scipy: {}'.format(scipy.__version__))  
# Импортируйте numpy и узнайте ее версию
import numpy  
print('numpy: {}'.format(numpy.__version__))  
# matplotlib  
import matplotlib  
print('matplotlib: {}'.format(matplotlib.__version__))   
# pandas  
import pandas  
print('pandas: {}'.format(pandas.__version__))  
# scikit-learn  
import sklearn  
print('sklearn: {}'.format(sklearn.__version__))

In [2]:
# Python version
import sys
print('Python: {}'.format(sys.version))
# scipy
import scipy
print('scipy: {}'.format(scipy.__version__))
# numpy
import numpy
print('numpy: {}'.format(numpy.__version__))
# matplotlib
import matplotlib
print('matplotlib: {}'.format(matplotlib.__version__))
# pandas
import pandas
print('pandas: {}'.format(pandas.__version__))
# scikit-learn
import sklearn
print('sklearn: {}'.format(sklearn.__version__))

Python: 3.6.5 |Anaconda, Inc.| (default, Apr 26 2018, 08:42:37) 
[GCC 4.2.1 Compatible Clang 4.0.1 (tags/RELEASE_401/final)]
scipy: 1.1.0
numpy: 1.14.3
matplotlib: 2.2.2
pandas: 0.23.0
sklearn: 0.19.1
