![zebrains_logo](../../images/logo-zebrains-dark.svg)
## Кафедра «Интеллектуальных технологий в информационных системах»

# Лабораторная работа 1: Git, Git LFS

In [36]:
#imports
!pip install ipywidgets==7.6.4 --quiet
from ipywidgets import FileUpload, Image, HBox
from IPython.display import display

In [37]:
def display_uploaded_screenshots(screenshots):

    images = [Image(value=i) for i in screenshots]
    ## Side by side thanks to HBox widgets
    sidebyside = HBox(images)
    ## Finally, show.
    display(sidebyside)

В данной лабораторной работе вы научитесь пользоваться:
* Системой контроля версий (VCS - version control system) **Git**
* Расширением **Git LFS** (Large File Storage), позволяющее версионировать большие файлы вместе с кодом

# Git
![git_logo](../../images/Git_icon.svg)

**Git** – это распределенная система контроля версий (version control system – VCS).

**Контроль версий** означает что вы храните все версии редактируемых документов и можете вернуться к любой сохраненной версии в любой момент времени. Кажется, будто такой подход популярен только среди программистов, но на деле им пользуются, например, дизайнеры и другие люди, несколько более подкованные технически, чтобы контролировать изменения в работе.

**Распределенность** git’а отличает его от прочих vcs. Под распределенностью следует понимать, буквально, возможность использования одной системы контроля на проекте множеством разработчиков.

*В папке с лабой вы найдете .pdf с основными командами.*

*Можно было бы в удобном виде оставить список команд в этом ноутбуке, а потом просто копировать их в консоль. Но в целях лучшего запоминания лучше вводить эти команды самим.*

## Задание:
**Пройти уроки с сайта https://learngitbranching.js.org/?locale=ru_RU**

Если застряли на каком-то уроке - можете воспользоваться pdf шпаргалкой.

Не оставляйте выполнение это лабораторной на потом. Почти все остальные лабораторные потребуют от вас знаний Git'а. 

У вас будут совместные проекты, где потребуется версионировать изменения. Если вы будете вести историю репозитория не аккуратно, писать сообщения к комитам от балды и т.п. - это усложнит работу как вам, так и остальным членам команды. 

Старайтесь вести историю в Гите так, будто завтра же уходите в отпуск, оставляя свою работу коллегам.

**Отчет**

Прикрепите следующие скриншоты прямо внутри ноутбука.

1. Результат команды
``` bash
conda list
```
2. Результат команды
``` bash
git branch -a
```
3. Результат команды
``` bash
git remote show origin
```
4. Скриншоты двух страниц с сайта *learngitbranching.js.org*. (Когда вы проходите урок - ячейка окрашивается)

In [45]:
# Прикрепите файлы с изображениями
uploader = FileUpload(accept = 'image/*', multiple = True)
display(uploader)

FileUpload(value={}, accept='image/*', description='Upload', multiple=True)

In [46]:
# Отобразит скриншоты. Вверху скрытая под тремя точками ячейка с функцией для отображения. Можете что-нибудь там поменять, если вам не нравится вывод. 
display_uploaded_screenshots(uploader.data)

HBox(children=(Image(value=b'\x89PNG\r\n\x1a\n\x00\x00\x00\rIHDR\x00\x00\x02/\x00\x00\x01\x02\x08\x02\x00\x00\…

## Полезные ссылки
* https://githowto.com/ru Еще один интерактивный курс. Проходить не обязательно. Но для закрепления желательно.
* https://git-scm.com/book/ru/v2 Git Book на русском

# Git LFS
![git_logo](https://avatars.githubusercontent.com/u/20246716?s=200&v=4)

**Git LFS** - это расширение для Git'а, позволяющее версионировать большие данные. Данные хранятся и версионируются вместе с кодом.

Подробнее можете прочитать здесь:
* https://git-lfs.github.com/
* https://www.atlassian.com/git/tutorials/git-lfs

<a id='git_lfs_cell'></a>
<img src="../../images/git_lfs.gif" alt="drawing" width="600"/>

Не все хостинги поддерживают Git LFS. 
Для удобства мы пока будем использовать Github. Возможно, следующие лабы будут на Gitlab'е. Там больше квота для хранения данных.

## Задание
**Залейте на удаленнный репозиторий изменения, используя Git LFS для индексации больших данных**
1. Установите git-lfs. Например, используя менеджер пакетов в Ubuntu\Deb: 
```bash
sudo apt-get install git-lfs
```
2. Запустите следующую команду. Ее потребуется запустить лишь однажды, для каждого юзера в системе. 
```bashlearngitbranching.js.org
git lfs install
```
3. Создайте репозиторий или перейдите в уже готовый.
Если у вас нет "большого" файла для теста - можете создать файл(ы) фиксированного размера с помощью команды:
```bash
truncate -s 10M ten_megabyte_file.txt
```
4. Теперь нужно создать правило для слежения за большими файлами. Например, мы тренируем нейронку и храним картинки\звук\таблички и т.п. в папке Data. Тогда пропишем
```bash
git lfs track Data
```
Или мы знаем, что все наши таблички с данными будут в формате CSV. В таком случае можно использовать такую команду:
```bash
git lfs track "*.csv"
```
5. Убедитесь, что ваши большие данные не были предварительно исключены из индексации Гитом в файле .gitignore
```bash
git check-ignore -v *
```
Если вы видите правило, которое заставляет Гит игнорировать ваши большие данные - отредактируйте файл.

6. Убедимся, что файл с правилами для Git LFS индексируется. Добавим его.
```bash
git add .gitattributes
```
7. Теперь всё готово. Просто работайте с файлами так, как это делали раньше. Например:
```bash
git add Data
git commit -m "added Data"
git push
```

**Отчет**

Прикрепите следующие скриншоты прямо внутри ноутбука.

1. Результат команды
``` bash
git lfs status
```
2. Результат команды
``` bash
git lfs ls-files --all
```
3. Самостоятельно удалить большой файл и запушить изменения
4. Удалить правила для ЛФС, которые мы создавали (P.S. команда untrack)
5. Результат команды
``` bash
git lfs status
```
6. Результат команды
``` bash
git lfs ls-files --all
```


И запушьте изменения.


In [40]:
uploader = FileUpload(accept = 'image/*', multiple = True)
display(uploader)

FileUpload(value={}, accept='image/*', description='Upload', multiple=True)

In [42]:
display_uploaded_screenshots(uploader.data)

HBox(children=(Image(value=b'\x89PNG\r\n\x1a\n\x00\x00\x00\rIHDR\x00\x00\x02/\x00\x00\x01\x02\x08\x02\x00\x00\…