### Изображения, графики, карты

#### Изображения в Python

На прошлом семинаре мы с вами познакомились с библиотекой для построения графиков matplotlib. Это очень обширная библиотека, и на самом деле она умеет работать не только с графиками, но и с картинками вообще. Для того, чтобы отобразить в питоне любую картинку с использованием matplotlib, достаточно использовать такой код:

In [None]:
import matplotlib.pyplot as plt
import matplotlib.image as img

# загружаем картинку по ее адресу
testImage = img.imread('files/cat.jpg')

# показываем в аутпуте
plt.imshow(testImage)

На самом деле любая картинка с точки зрения компьютера - это всего лишь табличка с числами (если картинка монохромная, то это одинокая табличка, в которой в каждой ячейке указана интенсивность цвета в соответствующем пикселе, а если картинка в RGB, то таких табличек будет три). matplotlib умеет показывать и собственно чиселки, стоящие за картинкой:

In [None]:
import matplotlib.pyplot as plt
import matplotlib.image as img

# загружаем картинку по ее адресу
testImage = img.imread('files/cat.jpg')

# выведем массив чиселок
print(testImage)

В повседневной жизни это, пожалуй, не особо пригождается, но для работы с картинками алгоритмы машинного обучения и нейронные сети нуждаются именно в таком представлении. 

Но это сакральное знание позволяет смотреть картинку по каналам (только оттенки красного, синего или зеленого) или показывать только ее кусочек. 

In [None]:
import matplotlib.pyplot as plt
import matplotlib.image as img

# загружаем картинку по ее адресу
testImage = img.imread('files/cat.jpg')

# посмотрим размер картинки: первые два числа - это высота и ширина, а третье число - количество каналов
print(testImage.shape)

# покажем только первый канал из трех (они нумеруются с нуля!)
modifiedImage = testImage[:, :, 0]

# посмотрим
plt.imshow(modifiedImage)


А теперь посмотрим второй канал из трех и еще и обрежем картинку. 

In [None]:
import matplotlib.pyplot as plt
import matplotlib.image as img

# загружаем картинку по ее адресу
testImage = img.imread('files/cat.jpg')

# посмотрим размер картинки
print(testImage.shape)

# оставим только часть
modifiedImage = testImage[500:1000, 100:1000, 1]

# посмотрим
plt.imshow(modifiedImage)

Мы можем также настраивать отображение картинки:

In [None]:
import matplotlib.pyplot as plt
import matplotlib.image as img

# загружаем картинку по ее адресу
testImage = img.imread('files/cat.jpg')
modifiedImage = testImage[:, :, 0]

# чтобы можно было настраивать, сохраним в переменную
fig = plt.imshow(modifiedImage)
fig.set_cmap('Greys') # выставим цветовую схему: ведь для matplotlib наша картинка - только набор чиселок, обозначающих яркость цвета
# спрячем оси координат
fig.axes.get_xaxis().set_visible(False)
fig.axes.get_yaxis().set_visible(False)

Измененную картинку можно и сохранить, и вообще написать функцию для обработки картинки:

In [None]:
def make_image(inputname,outputname):
    '''функция для обработки и сохранения картинки'''
    data = img.imread(inputname)[:,:,0] # считываем и сразу оставляем только первый канал из трех
    fig = plt.imshow(data) # показываем как картинку
    fig.set_cmap('hot') # выбираем цветовую схему
    fig.axes.get_xaxis().set_visible(False)
    fig.axes.get_yaxis().set_visible(False)
    plt.savefig(outputname) # сохраняем по адресу результат

Но для работы с картинками в питоне есть и специализированная библиотека Pillow, которая может частично даже заменить вам фотошоп (ну ладно, в простых задачах). 
Она может быть предустановлена, но устанавливается, если что, как 

    pip install Pillow
    
Если у вас макбук, возможно, понадобится сделать такое (brew - это программа homebrew, если не установлена, нужно скачать и установить):

    brew install libtiff libjpeg webp littlecms
    sudo pip install Pillow

Pillow поддерживает следующие форматы файлов: BMP, EPS, GIF, IM, JPEG, MSP, PCX PNG, PPM, TIFF, WebP, ICO, PSD, PDF. Некоторые она умеет только читать, а некоторые и записывать тоже. 

Импортируем обычно так:

In [None]:
from PIL import Image

Загружается картинка тоже очень просто:

In [None]:
myimage = Image.open('files/cat.jpg')  
myimage.load() # после того, как выполним эту функцию, можно будет работать с картинкой в переменной myimage

Часто еще используется конструкция с try-except, чтобы в случае не найденного файла программа сообщила об этом:

In [None]:
try:  
    original = Image.open('files/cat.jpg')  
except FileNotFoundError:  
    print("Файл не найден")

Когда мы считываем файлы с диска с помощью функции open(), нам не нужно знать формат файла. Библиотека автоматически определяет формат, основанный на содержании файла.

Теперь, когда у вас есть объект Image, вы можете использовать доступные атрибуты для проверки файла. Например, если вы хотите увидеть размер изображения, вы можете использовать атрибут format.

In [None]:
print("Размер изображения:")  
print(original.format, original.size, original.mode)

Атрибут size — это tuple, содержащий ширину и высоту (в пикселях). Обычные mode: L для изображений с оттенками серого, RGB для изображений с истинным цветным изображением и CMYK для печати изображений. 

Картинки в Pillow можно обрабатывать и сохранять. Например, чтобы размыть нашего котика, сделаем такое:

In [None]:
from PIL import Image, ImageFilter

try:
    original = Image.open('files/cat.jpg')
except FileNotFoundError:
    print("Файл не найден")

# размываем изображение
blurred = original.filter(ImageFilter.BLUR)
# открываем оригинал и размытое изображение
original.show() # покажет картинку-оригинал
blurred.show() # покажет, что получилось
# сохраняем изображение
blurred.save("files/blurred.png")

Помимо этого, можно использовать еще такие фильтры:

- BLUR
- CONTOUR
- DETAIL
- EDGE_ENHANCE
- EDGE_ENHANCE_MORE
- EMBOSS
- FIND_EDGES
- SMOOTH
- SMOOTH_MORE
- SHARPEN

Можно еще делать thumbnails (иконки). Это часто бывает нужно для того, чтобы делать какие-нибудь favicons для сайтов и прочие штуки. 

In [15]:
size = (128, 128) # размер иконки
saved = 'files/cat_thumbnail.jpg' # путь, куда будем сохранять
img = Image.open('files/cat.jpg')
img.thumbnail(size)
img.save(saved)
img.show()

Pillow умеет делать и другие вещи: изменять размер изображения, поворачивать его, сжимать, растягивать, обрезать. Но эти вещи подробно рассматривать не будем, их легко нагуглить самостоятельно.

#### Карты в Python

Иногда бывает нужно создавать интерактивные карты, например, такие карты есть на известном вам сайте WALS Online. Основная библиотека, которая умеет это делать в питоне, называется folium. Эта библиотека умеет создавать не только сами карты, которые можно масштабировать и всячески перетаскивать мышкой (как в Google Maps), но и размещает маркеры, показывает широту и долготу по наведению мышки и прочее подобное. 

Устанавливается так:

    pip install folium==0.14 
    
(Мы эксплицитно указываем версию, потому что иначе могут не работать некоторые вещи).

Далее нужно импортировать:

In [17]:
import folium
from folium import plugins
from folium.plugins import MarkerCluster
from folium.plugins import MousePosition 
from folium.features import DivIcon

# можно не все, а только то, что будете использовать

Итак, основной объект folium - это собственно карта. Создать карту очень легко:

In [18]:
world_map = folium.Map() # инициализируем объект "карта" - по умолчанию это карта всего мира
world_map # если просто написать переменную в конце, юпитер автоматически ее покажет

Также можно использовать такую штуку:

In [19]:
from IPython.display import display

display(world_map)

Уже с этой картой можно играться: масштабировать ее и рассматривать. Но обычно мы хотим заранее настроить карту, чтобы она открывалась не колбасой по всему миру, а, например, на конкретной стране. 

У Map() есть ряд настраиваемых параметров:

- location (tuple or list, default:None) : ширина и долгота карты (например, для России можно указать \[64.6863136, 97.7453061\]
- width & heigth (int, string, default :'100%') : int в пикселях, str в процентах ('100' или '100%')
- min_zoom (int, default:0) : минимальный разрешенный зум-уровень
- max_zoom (int, default:18): максимальный разрешенный зум-уровень
- zoom_start(int, default:10) : стартовое увеличение
- tiles : стиль карты (default=OpenStreetMap, Stamen Terrain, Stamen Toner, Mapbox Bright, Mapbox Control Room, etc)

Про стили (красивенькое!) можно посмотреть подробнее в [документации](https://python-visualization.github.io/folium/latest/user_guide/raster_layers/tiles.html). 

Вот, например, как можно отобразить карту Кореи:

In [22]:
korea_black = folium.Map(location=[37, 126], # нужно знать координаты 
                   zoom_start=7,
                   tiles='Stamen Toner' # внешний вид карты
                  )
korea_black

folium на самом деле работает на основе библиотеки JavaScript leaflet.js, поэтому он хорошо вписывается в html. Карту можно сохранить как html-страницу:

In [None]:
korea.save('korea_map.html')

На карте, разумеется, можно размещать маркеры. Можно размещать одиночные маркеры с помощью объекта folium.Marker, у которого тоже есть ряд настроек:

- tooltip : str, подсказка, которая будет появляться, когда мышка наводится на маркер
- popup : html-код (str) подсказка (форматированная), которая будет появляться при щелчке на маркер
- icon : внешний вид иконки. В библиотеке есть свой набор иконок, а можно и кастомную задать. 

Добавим в нашу Корею пару маркеров (имейте в виду, что карта korea_black у нас в ячейке выше задана):

In [23]:
folium.Marker([37.56, 126.97], # приходится знать широту и долготу
              popup='<i>The capital of Korea</i>', 
              tooltip='Seoul'
             ).add_to(korea_black) # добавляем на карту

folium.Marker([37.45, 126.70], 
              popup='<i>International Airport</i>', 
              tooltip='Incheon',
              icon=folium.Icon(icon='plane', color='red')
             ).add_to(korea_black)


korea_black

Получается, чтобы уметь писать popup, нужно хотя бы чуточку знать про html-код. На самом деле, если написать просто текст, он отобразится, а можно использовать разные простые коды, например, как в ячейке выше: `<i> </i>` сделает все, что внутри него, курсивом. Как правило, большинство html-команд устроено именно таким образом (что-то в треугольных скобках, потом то, к чему применяется команда, потом закрывающий тег в треугольных скобках со слешом). 

Плагин MousePosition позволяет нам посмотреть и широту с долготой прямо на самой карте (чтобы потом использовать):

In [24]:
# сделаем карту России
russia_map = folium.Map(
    location = [64.6863136, 97.7453061],    
    zoom_start = 4
)

formatter = "function(num) {return L.Util.formatNum(num, 5);};" # это проще копировать
mouse_position = MousePosition(
    position='topright', # где будет находиться окошко с координатами
    separator=' Long: ', # долгота
    empty_string='NaN', # что будет показываться, когда координат нет
    lng_first=False,
    num_digits=20, # сколько цифр влезет
    prefix='Lat:', # широта
    lat_formatter=formatter,
    lng_formatter=formatter,
)

russia_map.add_child(mouse_position)
russia_map

Карта в folium - это что-то вроде подложки, любые вещи кладутся на нее как слои. Так, в коде выше мы добавляем к карте "ребенка" - окошечко с координатами. Также мы добавляем на карту маркеры, а можем добавлять прямо целые слои маркеров, если нам нужно их много сразу показать. 

Собственно, давайте посмотрим, как можно загружать в питоне карты с WALS. Если открыть любую карту на сайте, WALS позволяет скачать ее в формате geojson: это слово написано в правом верхнем углу карты. Как правило, на нашей WALS-карте присутствует на самом деле несколько слоев с маркерами: для разных характеристик. Чтобы перенести карту WALS, нужно сперва сохранить все слои по отдельности как файлы .geojson (можно просто .json), я для примера сохранила три таких слоя в папку files. 

Дальше нужно загрузить информацию с geojson (можно на самом деле просто вставлять в код, но это неудобно) и добавить в виде слоев на карту. 

In [34]:
import json 

simple = json.load(open('files/12Asimple.geojson'))
mcomplex = json.load(open('files/12Amcomplex.geojson'))
compl = json.load(open('files/12Acomplex.geojson'))
m = folium.Map(location=[50, 90], zoom_start=2)

folium.GeoJson(
    simple,
    zoom_on_click=True,
    marker=folium.Marker(icon=folium.Icon(color="green",icon="circle", prefix='fa')),
).add_to(m)

folium.GeoJson(
    mcomplex,
    zoom_on_click=True,
    marker=folium.Marker(icon=folium.Icon(color="pink",icon="heart", prefix='fa')),
).add_to(m)
    
folium.GeoJson(
    compl,
    zoom_on_click=True,
    marker=folium.Marker(icon=folium.Icon(color="red",icon="cog", prefix='fa')),
).add_to(m)

m

Вопрос: откуда брать иконочки?

Можно смотреть их на двух ресурсах:

- [FontAwesome](https://fontawesome.com/v4/icons/)
- [glyphicons](https://getbootstrap.com/docs/3.3/components/)

Для первых нужно указывать prefix='fa' (просто выбираете любое название), а для вторых не нужно указывать префикс. 

Можно даже свою кастомную картинку загрузить:

    folium.CustomIcon('путь к картинке', icon_size=(24, 24))