# Использование Google Colaboratory

**Google Colab** — это бесплатный облачный сервис на основе Jupyter Notebook, который предоставляет всё необходимое для машинного обучения прямо в браузере, даёт бесплатный доступ к невероятно быстрым GPU и TPU. 

Для того, чтоб использовать предоставляемые Google ресурсы выберите в меню `Runtime -> Change runtime type`. Далее можно выбрать 3 варианта:
- **None** - не использовать ускорение
- **GPU** - использовать графическую карту
- **TPU** - использовать Tensor Processor Unit

В случае если вы запускаете скрипты, не требующие аппаратного ускорения, проверьте, что выбран вариант None - т.к. ресурсы шарятся между всеми пользователями платформы, лучше без нужды не занимать их.

Так же в Google Colab существует ограничение -- ноутбук "сбрасывается" каждые 12 часов, то есть если оставить сетку обучаться больше, чем на 12 часов, то может произойти неприятное -- ноутбук просто перестанет выполнятся сам по себе.

# Интерфейс

В Google Colab есть два типа ячеек - текстовые (с `markdown` форматированием) и ячейки для запуска кода

Добавлять ячейки можно с помощью кнопок **+Code** и **+Text**
Перемещать с помощью стрелок вверх и вниз в правом верхнем углу ячейки. Там же есть и други настройки ячеек

## Ячейки кода
Ниже ячейка кода. Его можно запустить несколькими способами:

* Нажать иконку **Play** слева от ячейки (появляется, если навести на квадратные скобки);
* Нажать **Cmd/Ctrl+Enter** чтоб запустить выбранную ячейку;
* Нажать **Shift+Enter** чтоб запустить ячейку и перейти к следующей (или создать новую, если следующей нет);
* Нажать **Alt+Enter** чтоб запустить ячейку и создать новую сразу следом за текущей.

Также в меню **Runtime** есть еще разные опции запуска ячеек.
Медленно работающие или зависшие ячейки можно останавливать в меню **Runtime -> Interrupt execution** *(hotkey: Cmd/Ctrl-M I)*

Начиная с этого момента и далее, запускайте ячейки с кодом, чтобы лучше понять происходящее

In [None]:
# ячейка с кодом
print("Hello world")

## Магия
В Colab поддерживаются мэджиксы из Jupyter -- короткие команды, меняющие поведение ячейки (можно почитать [тут](https://nbviewer.jupyter.org/github/ipython/ipython/blob/1.x/examples/notebooks/Cell%20Magics.ipynb))
Например, вставлять html

In [None]:
%%html
<marquee style='width: 30%; color: red;'><b>Магия!</b></marquee>

## Форматирование ошибок
Добавлено удобное форматирование ошибок. В том числе есть ссылка на поиск подобных ошибок на stackoverflow, так что вы быстро сможете разобраться в чем дело

In [None]:
x = 1/0

## Интерактивный вывод
Можно не только печатать текст с помощью команды print, но и выводить изображения, прогрессбары и прочие интерактивные элементы

In [None]:
import numpy as np
from matplotlib import pyplot as plt

ys = 200 + np.random.randn(100)
x = [x for x in range(len(ys))]

plt.plot(x, ys, '-')
plt.fill_between(x, ys, 195, where=(ys > 195), facecolor='g', alpha=0.6)

plt.title("Fills and Alpha Example")
plt.show()

# Системные команды

Поскольку Google Colab работает на Linux, в ноутбуках можно обращаться к некоторым системным командам. Список можно посмотреть так `!ls /bin`

В основном при работе с Colab требуются следующие команды:
* `pip` - установка библиотек Python. Пример: `!pip install numpy`
* `ls` - просмотр файлов в папке. Пример: `!ls .` - содержимое текущей папки; `!ls another_folder` - содержимое папки `another_folder`
* `cd` - перейти в другую папку. Пример: `!cd another_folder`
* `pwd` - проверить, в какой папке мы сейчас находимся. Пример: `!pwd`
* `mkdir` - создать папку. Пример: `!mkdir new_folder`
* `cat` - вывести содержимое файла. Пример: `!cat text.txt`
* `wget` - скачать файл из интернета. Пример: `!wget https://files.strelka-ai.team/dataset/files/cities.csv`

Команда всегда должна начинаться с ! или %, иначе она будет воспринята как код Python

In [None]:
!ls /bin

# Работа с файлами

Выполнив команду !ls в ячейке с кодом можно увидеть, какие файлы лежат в данной папке (вместе с запущенным ноутбуком).

**Загрузка файлов**

Чтобы загрузить свой файл/несколько файлов, можно выполнить этот следующий код. Он добавит виджет с предложением выбрать файлы на компьютере (файлы закачиваются в ту же папку, где запущен ноутбук)

In [None]:
from google.colab import files

uploaded = files.upload()

for fn in uploaded.keys():
  print('Пользователь загрузил файл "{name}" длиной {length} байт'.format(
      name=fn, length=len(uploaded[fn])))

**Скачивание файлов**

`files.download` заставит браузер скачать файл на ваш компьютер

In [None]:
from google.colab import files

with open('example.txt', 'w') as f:
  f.write('some content')

files.download('example.txt')

Подключить Google Drive

In [None]:
from google.colab import drive
drive.mount('/content/gdrive')

In [None]:
!ls "/content/gdrive/My Drive/"

Следующая функция позволяет загрузить файлы в заданную вами папку (в этом блоке мы объявляем функцию, а используется уже в следующем)

In [None]:
def upload_files(path='./', verbose=False):
  '''
    Загружает выбранные файлы в папку path
  '''
  from google.colab import files
  import os
  # загрузка файлов в Colab
  uploaded = files.upload()
  # если указанная папка не существует, то создаем ее
  if not os.path.exists(path):
    os.makedirs(path)
  # перемещаем загруженные файлы в нашу папку
  for name, bytes_ in uploaded.items():
    open(os.path.join(path, name), 'wb').write(bytes_)
    os.remove(name)
    
  if verbose:
    print('Uploaded files: ' + '\n'.join(list(uploaded.keys())))

In [None]:
upload_files(path='./data/train/')  