## `Практикум по программированию на языке Python`
<br>

## `Занятие 9: Базовые инструменты разработчика`
<br><br>

### `Роман Ищенко (roman.ischenko@gmail.com)`

##### с использованием материалов `Находнова Максима (nakhodnov17@gmail.com)`

#### `Москва, 2024`

О чём можно узнать из этого ноутбука:

* Использование `ssh`, `tmux`
* Запуск виртуальных машин
* Хаки для Google Colab
* Система контроля версий `Git`

# `Облачные сервисы`

Доступные варианты сервисов:
   
* Yandex Cloud — стартовый грант на `4000₱`, но на виртуальные машины только четверть от всей суммы
* Google Cloud — стартовый грант `300$` + free tier для самых слабых VM (достаточно, например, для VPN сервера)
* Amazon Web Services
* Microsoft Azure
* ...

Большинство платформ предоставляют помимо вычислительных ресурсов ещё и другие сервисы:
* Хранение данных (S3, базы данных)
* Сетевые сервисы (публичные IP, прокси, балансировщики нагрузки)
* Контейнеризация (Docker, Kubernetes)
* Машинное обучение (Инференс моделей (распознавание речи, перевод, ...), Hadoop, Spark)

# `Создание и подключение к виртуальной машине`

Рассмотрим пример создания виртуальный машины в сервисе Yandex Cloud

Перейдём в консоль: https://console.cloud.yandex.ru

## `Создание SSH ключа`

* Нужно для подключения и работы с удалённым сервером
* Обеспечивает защиту соединения

Создаём пару публичный-приватный ключ с шифрованием `rsa` длинной ключа $2048$ бит и комментарием `"new key"`:
```bash
ssh-keygen -t rsa -b 2048 -C "new key"

ssh-keygen -t ed25519 -b 4096 -C "My ed"
```

* `-t` тип шифрования
* `-b` длина ключа (желательно $\geq 2^{11}$)
* `-C`  комментарий (для удобства)

При создании нужно указать путь к создаваемому файлу и секретную фразу

In [1]:
! ls ~/.ssh

aithea_rsa     config         jobtaker_rsa   rois_ed
aithea_rsa.pub id_rsa         karma_rsa      rois_ed.pub
certcopy       id_rsa.pub     known_hosts    rois_rsa
certcopy.pub   ilya_key       rega_rsa       rois_rsa.pub


In [3]:
cat ~/_test/test_key

-----BEGIN OPENSSH PRIVATE KEY-----
b3BlbnNzaC1rZXktdjEAAAAABG5vbmUAAAAEbm9uZQAAAAAAAAABAAAAMwAAAAtzc2gtZW
QyNTUxOQAAACAelV/h8Eh8UscCJX1HiaCzKql5jMbTXoGAM+494mB4kAAAAJinRhK5p0YS
uQAAAAtzc2gtZWQyNTUxOQAAACAelV/h8Eh8UscCJX1HiaCzKql5jMbTXoGAM+494mB4kA
AAAEBuDm/oNblSuNX3szOHXV2PPfe0oyxm8vO2kBlQl4bljh6VX+HwSHxSxwIlfUeJoLMq
qXmMxtNegYAz7j3iYHiQAAAAE3JvaXNAcm9pcy1kZXYubG9jYWwBAg==
-----END OPENSSH PRIVATE KEY-----


При создании VM можно указать SSH ключ, который будет автоматически добавлет в файл `~/.ssh/authorized_keys`, который используется при аутентификации.

## `Подключение к удалённому хосту`

IP-адрес нашей машины `51.250.101.81`. Подключимся к ней через SSH, указав приватный ключ:
```bash
ssh ubuntu@51.250.101.81 -i ~/.ssh/id_rsa_vmtest
```

Может быть возникнет ошибка из-за неправильных прав доступа. Это легко исправить:
```bash
chmod 0600 ./id_rsa_vmtest
```

## `Проброс портов`

Иногда полезно иметь возможность подключаться к портам виктуальной машины, доступным только из её локальной сети. Для этого можно использовать аргумент `-L` в команде `ssh`:

Подключаемся к удалённому хосту `51.250.101.81` логинясь под пользователем `ubuntu`, используя в качестве аутентификации  приватный ключ `id_rsa_vmtest`, и пробрасываем порт "удалённый" порт `5000` в "локальный" порт `1234` для всех доступных с удалённого хоста адресов (т.к. указана маска `0.0.0.0`)
```bash
ssh ubuntu@51.250.101.81 -L 1234:0.0.0.0:5000 -i "~/.ssh/id_rsa_vmtest" -N
```

Теперь можно на виртуальной машине запустить Jupyter Notebook и работать с ним локально.

Запускаем Jupyter Notebook с отключённой аутентификацией на порту `1234`
```bash
jupyter notebook --no-browser --port 1234 --ip='*' --NotebookApp.token='' --NotebookApp.password=''
```

## `Фоновая работа на удалённом хосте`

Часто требуется на удалённом сервере запустить задачи, которые будут выполняться в фоне и не будут прерываться при закрытии соединения с сервером. Типичный пример — обучение ML/DL модели. Для этого можно использовать или фоновый запуск:

```bash
python train.py &> output.log &
```

Или же, виртуальные терминалы, такие как `screen`, `tmux`

### `tmux`

Для создания новой сессии используется команда `new`:

Создаём сессию с именем `name`:
```bash
tmux new -s name
```

Работа с сессиями происходит через управляющие последовательности:
* Чтобы отключиться от сессии нужно нажать `Ctrl+b d`. При этом сессия продолжает работать в фоне
* Чтобы завершить сессию можно или нажать `Ctrl+b x`, или `Ctrl+d`
* Для прокрутки вывода используется `Ctrl+b [`. Выход из режима прокрутки: `Ctrl+c`

Вывод всех сессий:
```bash
tmux ls
```

Переподключиться к сессии (нет необходимости набирать полное имя сессии. Достаточно уникального префикса):
```bash
tmux a -t name
```

Убить сессию:
```bash
tmux kill-session -t name
```

[Шпаргалка по `tmux`](https://tmuxcheatsheet.com/).

## `Несколько замечаний про SSH`

Обычно требуется подключаться к одному и тому же серверу многократно. При этом запоминать IP или домен, а также другие параметры настройки соединения достаточно неудобно. Для хранения конфигураций можно использовать файл `~/.ssh/config`:

```ssh-config
Host hse2
    AddKeysToAgent yes
    IdentitiesOnly yes
    Hostname cluster.hpc.hse.ru
    User aalanov
    Port 2222
    ForwardAgent yes
    IdentityFile ~/.ssh/hse
    LocalForward 4000 localhost:4000
Host hse2_db
    AddKeysToAgent yes
    IdentitiesOnly yes
    Hostname cn-007
    User aalanov
    RequestTTY yes
    RemoteCommand '/home/aalanov/mnakhodnov/connect.sh'
    ForwardAgent yes
    IdentityFile ~/.ssh/hse
    ProxyCommand ssh -q hse2 nc cn-007 22
Host bigartm_docker
  User root
  Port 2202
  HostName localhost
  StrictHostKeyChecking no
  UserKnownHostsFile=/dev/null
```

Описание опций:
* `AddKeysToAgent`: добавлять ли ключ в `ssh-agent` — менеджер ключей для SSH, который хранит в памяти расшифрованные ключи
* `IdentitiesOnly`: аутентификация только по ключу
* `Hostname`, `User`, `Port`: домен, пользователь и порт для подключения
* `IDentityFile`: путь к приватному SSH ключу
* `ForwardAgent`: позволяет ssh-клиенту «пробрасывать» ваш ключ на сервер, на который вы зашли по ключу. Цепочка будет продолжаться до тех пор, пока на очередном сервере включена эта опция
* `LocalForward`: проброс портов, аналогично ключу `-L`
* `RequestTTY`: принудительное создание псевдо-консоли при подключении
* `RemoteCommand`: автоматическое выполнение команды после подключения на сервер. Удобно, например, для активации нужного окружения Anaconda/Python/venv.
* `ProxyCommand`: позволяет подключаться к серверу, который доступен только из локальной сети другого сервера. Указывается команда, которая выполняет подключение, например, `nc` для прямого роутинга пакетов с хоста на хост

[Список всех доступных опций](https://man.openbsd.org/ssh_config)

# `Подключение к интерактивным средам выполнения`

Иногда есть желание работать с интерактивной средой по типу `Google Colab`, `Kaggle` не в Jupyter Notebook, а из консоли. 

Так как под капотом эти среды всё-равно содержат виртуальную машину, то к ней можно также подключиться по SSH, используя сторонний прокси-сервис.

**Обратите внимание, такое использование `Google Colab` прямо запрещено правилами. Используйте на свой страх и риск!**

Инструкция:

1. Необходимо зарегистрироваться на сайте https://dashboard.ngrok.com/signup 
2. Скопировать токен на странице https://dashboard.ngrok.com/auth
3. Выполнить код ниже и ввести токен из п.2 (возможно придётся запустить ячейку пару раз):
    ```python
     import random, string, urllib.request, json, getpass
 
     # Generate root password
     password = ''.join(random.choice(string.ascii_letters + string.digits) for i in range(20))
 
     # Download ngrok
     ! wget -q -c -nc https://bin.equinox.io/c/4VmDzA7iaHb/ngrok-stable-linux-amd64.zip
     ! unzip -qq -n ngrok-stable-linux-amd64.zip
 
     # Setup sshd
     ! apt-get install -qq -o=Dpkg::Use-Pty=0 openssh-server pwgen > /dev/null
 
     # Set root password
     ! echo root:$password | chpasswd
     ! mkdir -p /var/run/sshd
     ! echo "PermitRootLogin yes" >> /etc/ssh/sshd_config
     ! echo "PasswordAuthentication yes" >> /etc/ssh/sshd_config
     ! echo "LD_LIBRARY_PATH=/usr/lib64-nvidia" >> /root/.bashrc
     ! echo "export LD_LIBRARY_PATH" >> /root/.bashrc
 
     #Run sshd
     get_ipython().system_raw('/usr/sbin/sshd -D &')
 
     #Ask token
     print("Copy authtoken from https://dashboard.ngrok.com/auth")
     authtoken = getpass.getpass()
 
     #Create tunnel
     get_ipython().system_raw('./ngrok authtoken $authtoken && ./ngrok tcp 22 &')
 
     # Get public address and print connect command
     with urllib.request.urlopen('http://localhost:4040/api/tunnels') as response:
         data = json.loads(response.read().decode())
         (host, port) = data['tunnels'][0]['public_url'][6:].split(':')
         print(f'SSH command: ssh -p{port} root@{host}')
 
     # Print root password
     print(f'Root password: {password}')
    ```
4. Подключиться с помощью полученной команды
5. При необходимости примонтировать Google Drive:
    ```python
     ! mkdir ~/content/gdrive -p

     from google.colab import drive

     drive.mount('~/content/gdrive')

     ! ls ~/content/gdrive/
    ```
6. Опционально можно использовать эвристику, которая будет предотвращать завершение сессии:
    ```bash
     ! sudo apt update && unminimizes
    ```

# `Введение в GIT`

Одна из самых популярных **систем контроля версий**. Альтернативы — `Mercurial`, `SVN`.

Обычно такие системы позволяют вести распределённую разработку.

Зачем нужно:
* Хранение истории измений
* Командной разработка одного проекта
* Синхронизация между устройствами одного разработчика

## `Рабочие зоны`

* `Рабочая директория` (Working tree)
    - Находится вне системы контроля версии
    - Локальная "песочница"
* `Индекс` (Staging area)
    - Изменения, которые отслеживаются системой конторя версии
    - Будут включены в следующий коммит
* `История` (.git directory)
    - История изменений, сохранённая в локальной базе данных
    
Все файлы проходят последовательно через эти три зоны. В частности:
1. Изменённый файл в рабочей директории (`Modified`)
2. Помеченный файл, для отправки в следующем снепшоте (`Staged`)
3. Сохранённый в истории файл (`Commited`)

## `Создание репозитория`

Два основных способа создать репозиторий:
1. Создать его локально. Затем, опционально, его можно "подключить" к удалённой версии репозитория
2. Создать удалённый репозиторий с помощью онлайн-сервисов. Затем, "склонировать" его локально на компьютер

Важно не путать такие онлайн-сервисы (`Github`, `Bitbucket`, ...) с системами контроля версий

Создадим репозиторий с помощью сервиса [https://github.com](Github) и скопируем его себе на компьютер.

Для работы с приватными репозиториями нам необходимо [добавить SSH ключ](https://github.com/settings/keys), с помощью которого будет происходить аутентификация. 

```bash
git clone https://github.com/nakhodnov17/TestRepo.git
```

## `Визуализация состояния репозитория`

Часто, удобно отслеживать состояние трёх рабочих зон и истории коммитов не из консоли, а в визуальном интерфейсе.

Например:
* `git-gui`: отображает файлы в рабочих зонах
* `gitk`: дерево коммитов и история изменений
* `git log`: текстовая история коммитов

## `Внутреннее представление истории`

История представляет из себя помеченное направленное дерево:
* Корень — первый коммит
* Пометки — вершины, соответствующие разным меткам
* Рёбра — связь между родительским и дочерним коммитами
* Особый указатель на текущую вершину `HEAD`

![Working spaces](https://marklodato.github.io/visual-git-guide/conventions.svg)

## `Базовые команды GIT`

Перенос файла в Stage:
```bash
git add test.txt
```

Перенос Stage в историю:
```bash
git commit -m "The first commit"
```

![Commit](https://marklodato.github.io/visual-git-guide/commit-main.svg)

Перемещение указателя `HEAD` по дереву и создание новых веток: 

```bash
git checkout <commit_id>
```

![checkout](https://marklodato.github.io/visual-git-guide/checkout-branch.svg)

Объединение веток:

```bash
git merge <commit_left> <commit_right>
```

![Merge](https://marklodato.github.io/visual-git-guide/merge.svg)

Загрузка содержимого из удаленного репозитория и обновление локального репозитория этим содержимым:
```bash
git pull
```

Выгрузка содержимого локального репозитория в удаленный репозиторий:
```bash
git push
```

![Push/pull](https://s3.ap-south-1.amazonaws.com/s3.studytonight.com/tutorials/uploads/pictures/1622187008-103268.png)

## `Git-Flow`

![image.png](attachment:895a74ea-9ea9-49eb-a644-dc35a826f35c.png)

`git flow init`

По сути создаём структуру и фиксируем префиксы будущих веток

### `Разработка функциональности`
![image.png](attachment:7de75bf8-57e3-4961-adea-221924a1786d.png)

Начало работы
```
git flow feature start MYFEATURE

git checkout develop
git checkout -b feature/MYFEATURE
```

Завершение
```
git flow feature finish MYFEATURE

git checkout develop
git merge feature/MYFEATURE
```

### `Выпуск релиза`
![image.png](attachment:75888d5b-b41a-44d7-a90f-1b048b52bcf9.png)

Аналогично feature, только вливается и в master, и в develop

### `Hotfixes`
![image.png](attachment:e759a8d2-b422-4005-9a5f-d58af14986dc.png)

Стартует из master, вливается в master и develop

### `Общая схема`
![image.png](attachment:8ffe3eb7-7621-4e9f-a183-28b4b78af6f2.png)