# 1/11  1. Введение

Добро пожаловать в модуль, посвящённый созданию проектов на `GitHub`!

✍ Ранее мы уже познакомились с таким инструментом версионирования кода, как `Git`, и веб-сервисом, основанном на нём, — `GitHub`. В этом модуле мы продолжим изучать эту тему: научимся работать с языком разметки `Markdown`, поговорим о том, как оформлять свои проекты с его помощью, об основных командах системы `Git` и о том, как производить версионирование своего кода.

Внимание! Для полноценной работы нам понадобятся все инструменты, с которыми мы знакомились в модуле 7.1 [«Инструменты для Data Science»](https://lms.skillfactory.ru/courses/course-v1:SkillFactory+MFTIDSLIGHT+2022_DEC/jump_to_id/280b11e9f4934a459660eeeb0c3763ea), поэтому если вы не прошли данный модуль, настоятельно рекомендуем это сделать и установить все необходимые инструменты.

#### СКВОЗНОЙ ПРИМЕР ПРОЕКТА

На протяжении всего модуля мы будем работать над небольшим учебным проектом — задачей очистки данных о квартирах в Москве из модуля «PY-14. Очистка данных».

Наш проект продемонстрирует применение различных методов очистки данных на каждом из её этапов:

работа с пропусками,  
работа с выбросами,  
работа с дубликатами.

Начальная структура проекта будет следующей (в дальнейшем она немного изменится):

Где:

* `data` — папка с исходными данными (у нас это данные о квартирах в Москве);

* `images` — папка с изображениями, необходимыми для проекта;

* `outliers_lib` — папка со вспомогательными модулями для поиска выбросов (`find_outliers.py`) и описание этих модулей (файл `README.md`);

* `data_cleaning_example.ipynb` — `Jupyter-ноутбук`, содержащий основной код проекта, в котором демонстрируются методы и подходы решения задач очистки данных.


Важное замечание. Весь код, который используется в проекте, мы изучали ранее, поэтому останавливаться на нём подробно мы не будем. Цель этого модуля — не решить новую задачу, а превратить уже решённую в пример проекта. Однако рекомендуем просмотреть ноутбук, чтобы освежить знания.

# 2/11  2. Язык разметки Markdown

#### ЧТО ТАКОЕ ЯЗЫК РАЗМЕТКИ?

**Язык разметки** — это специальный компьютерный язык для описания оформления и строения документа.

Markdown — простой язык разметки.

<strong> Markdown </strong> — простой язык разметки.

Такие управляющие конструкции, указывающие на определённое оформление текста, называются `тегами`.

На самом деле практически все пользователи создают документы на каком-то из языков разметки, но не знают об этом — создание тегов берёт на себя графический интерфейс.

`WYSIWYG` (“`What You See Is What You Get`”) — свойство прикладных программ или веб-интерфейсов, в которых содержание отображается в процессе редактирования и выглядит максимально похожим на конечный результат.

![MDN_GIT_2_2.png](attachment:MDN_GIT_2_2.png)
![MDN_GIT_2_2.png](attachment:MDN_GIT_2_2.png)

Пример разметки с помощью `WYSIWYG`-расширения. В режиме редактирования кода видно, что оформление создаётся с помощью языка разметки `Markdown`.



Самый простой и повседневный пример `WYSIWYG`-сервиса — программа `MS Word`, которая позволяет создавать текстовые документы в графическом интерфейсе: можно задавать шрифт текста, его размер, наклон и ширину, добавлять в документы списковые конструкции, изображения, формулы и многое другое. Ещё один пример `WYSIWYG`-сервиса — любые конструкторы сайтов. Они позволяют создавать структуру сайтов, даже если вы не владеете `HTML`.

Однако практически все разработчики сталкиваются с необходимостью описания представления данных с помощью языков разметки.

Процесс создания страниц из составных элементов называется `компьютерной вёрсткой`. При этом могут использоваться как WYSIWYG-редакторы, так и редакторы, требующие знания языков разметки.

**Обратите внимание!** Язык разметки — это не то же самое, что язык программирования. Языки программирования служат для обработки данных, а языки разметки — для их представления.

**Примечание**. Для любознательных мы собрали [список](https://lms-cdn.skillfactory.ru/assets/courseware/v1/3552ebbc5060f20c587be321b9dc762a/asset-v1:SkillFactory+MFTIDSLIGHT+2022_DEC+type@asset+block/MFTIDSLIGHT_Модуль_4_Markdown_и_GIT_для_создания_портфолио.pdf) самых используемых на сегодняшний день языков разметки.

#### ЯЗЫК РАЗМЕТКИ `MARKDOWN`

`Markdown` — простой и понятный язык разметки для оформления документации, который является `упрощённой версией HTML`. Благодаря своей простоте он используется во множестве сервисов — как специальных (для разработчиков), так и направленных на пользователей.

`Markdown-разметка` (`md-разметка`) используется для написания документов, блогов, комментариев. Большинство IDE преобразуют md-разметку, с помощью которой разработчик оформляет текст.

![MDN_GIT_2_3.png](attachment:MDN_GIT_2_3.png)

Язык Markdown поддерживается многими мессенджерами, например `Telegram` и `Slack`:

#### РЕДАКТОРЫ `MARKDOWN`

Файлы с разметкой `Markdown` имеют расширение `.md`.

Существует огромное количество редакторов, расширений и сервисов, поддерживающих `Markdown`.


Давайте создадим в редакторе `VS Code` файл example.md и напишем в нём какой-нибудь текст (см. ниже). Для того чтобы открыть файл в режиме просмотра, достаточно нажать кнопку «Открыть область предварительного просмотра» в верхнем правом углу.

Сервис `GitHub`, с которым мы будем работать, и другие хостинги веб-проектов в режиме просмотра отображают не содержимое файлов `README.md`, а обработанную разметку. Эти файлы — лицо вашего проекта. В них разработчики описывают, о чём их проект, как работает код, какие действия необходимо произвести, чтобы запустить приложение/программу, и т. д.

Ниже представлен пример отображения разметки на языке `Markdown`, написанной в файле README.md в [репозитории](https://github.com/laravel/laravel). Вы можете самостоятельно посмотреть на содержимое файла и увидеть, как представленная свёрстанная стартовая страница выглядит в виде текста.

Существуют различные сервисы для создания документов именно с помощью md-разметки, например [hackmd.io](https://hackmd.io/).

# 3/11  3. Синтаксис `Markdown`

Начнём с основ построения текста. В Markdown разделителем абзацев служит пустая строка. Посмотрим на пример:
![MDN_GIT_3_1.png](attachment:MDN_GIT_3_1.png)

Если вы знакомы с языком HTML, то при использовании Markdown можно воспользоваться HTML-тегами. Например, тег `<strong>` позволяет выделять текст полужирным:

Примечание. Список всех HTML-тегов вы можете найти [здесь](https://html5book.ru/html-tags/ 'https://html5book.ru/html-tags/').

#### ШРИФТ

Очень часто требуется сделать акценты на каких-то элементах текста. Самый простой способ — использовать наклонный (курсивный) и полужирный шрифт.

Наклонное и полужирное начертание в Markdown задаются при помощи символов * и _:

- один символ — для наклонного текста (`*italic*`);
- два символа — для жирного текста (`**strong**`);
- три — для наклонного и жирного одновременно (`***жирный и наклонный***`).

#### ЗАГОЛОВКИ

Любая хорошая статья (а описание проекта можно считать статьёй) должна иметь логические разделы и подразделы. Как правило, начало разделов выделяют заголовками.

В синтаксисе Markdown заголовки отмечаются символом # (от одного до шести штук) в начале строки. Размер шрифта каждого следующего уровня меньше предыдущего:

Примечание. Часто при написании текста мы стремимся отцентрировать заголовки разделов. Для этого в Markdown можно воспользоваться тегом `<center>`:

# <center> Заголовок h1 </center>

Пример использования заголовков с центрированием для оформления статьи:
![MDN_GIT_3_5.png](attachment:MDN_GIT_3_5.png)

Полезно выделять структуру текста с помощью горизонтальных линий. VS Code автоматически рисует горизонтальную линию после заголовка первого уровня, но можно добавить эту линию вручную с помощью символа `---`:

## Заголовок h2

---

## Заголовок h2

#### СПИСКИ

`Списки` — способ представить упорядоченную информацию. Например, это может быть список зависимостей программы (библиотек), которые необходимо установить перед её запуском, или некоторый разработанный нами алгоритм, который мы хотим описать в виде шагов.

Для разметки ненумерованных списков можно использовать символы `*`, `-` или `+` — результат будет один:

+ элемент 1

- элемент 2

* элемент ...

Вложенные пункты создаются `двумя или более` пробелами перед маркером пункта:

* элемент

  * вложенный элемент 2.1

  * вложенный элемент 2.2

Для разметки нумерованных списков ставится положительное число с точкой:

1. элемент 1

2. элемент 2

   2.1. элемент 3

   2.2. элемент 3
  
      2.2.3. sdf

         2.2.3.1

3. элемент 4

Нумерация списка начинается с того числа, которое стоит первым на уровне.

В отличие от ненумерованных списков, в нумерованных перед элементами вложенного списка ставится `три пробела`.

#### ССЫЛКИ И ИЗОБРАЖЕНИЯ

При описании своего проекта нередко хочется добавить ссылки на дополнительные источники — статьи, книги, файлы или изображения.

Ссылки создаются комбинацией квадратных и круглых скобок: в квадратных скобках указывается отображаемый текст ссылки, а в круглых — URL-адрес или путь до файла, на который вы ссылаетесь. Ссылки могут быть обычными (без подсказок) или с подсказками, которые всплывают при наведении курсором на ссылку:

* без подсказки — [текст ссылки](http://example.com/link);  
* c подсказкой — [текст ссылки](http://example.com/link "Подсказка").

Для отображения изображений перед квадратными скобками ставится восклицательный знак:

![](https://i.imgur.com/3uj9teq.png)

В квадратные скобки при этом записывается текст, который отображается, если картинка по каким-то причинам недоступна.

Другой вариант вставки изображений — использовать тег `<img>` со специальными атрибутами. Например, атрибут `src` устанавливает источник изображения (путь до файла или URL-ссылка), по которому будет происходит чтение изображения, а атрибуты `width` и `height` позволяют установить ширину и высоту изображения в пикселях или процентах от исходного изображения:

<img src=https://i.imgur.com/3uj9teq.png width=500px height=30%>

#### ПРОГРАММНЫЙ КОД И ЦИТИРОВАНИЕ

Для выделения программного кода используется обратный апостроф:

* одинарный парный — для вставки строки кода в текст;
* двойной парный — для вставки небольшого участка кода, содержащего одинарный апостроф, в текст;
* тройной парный — для вставки блока программного кода.

`print('Hello world!')`

При использовании тройного апострофа можно указать `язык программирования`, чтобы автоматически подсветить участки кода, как в редакторе.

```python

lst = [10, 34, 21, 21, 3]

summa = sum(lst)

```

Для оформления цитат используется знак «больше» (>):

> Цитируемый текст

#### ФОРМУЛЫ

Когда в проекте есть математическая составляющая, важно отразить её в описании.

Вставка математических формул в Markdown осуществляется с помощью специальной библиотеки [KaTeX](http://sepetov.ru/2016/04/20/katex-библиотека-для-математических-форм/). Давайте разберём синтаксис.

Чтобы начать использовать `KaTeX` в Markdown, необходимо воспользоваться символом `$`. Если обрамить формулу с обеих сторон одним символом `$`, то её можно встроить в текст, а если двумя — формула автоматически центрируется.


Например, следующий синтаксис

Пусть задано выражение:

$$a = b +c,$$

где $a=0$

В формулах встречаются символы разных типов: переменные, операции, функции и др. Иногда переменные могут быть набраны латинскими или греческими буквами. Латинские буквы набираются с клавиатуры, а для греческих есть специальные команды, которые выражаются через символ `\`. Например:

* `$\alpha$` — $\alpha$
* `$\gamma$` — $\gamma$
* `$\sigma$` — $\sigma$

Степени и индексы набираются с помощью символов `^` и `_` соответственно. Если символов, которые нужно поместить в степень или индекс, несколько, то они выделяются фигурными скобками. Например:

* `$a^2$` — $a^2$
* `$b_{ij}$` — $b_{ij}$
* `$w^{ij}_n$` — $w^{ij}_n$

Для того чтобы создать «двухэтажную» дробь, можно воспользоваться оператором `\frac` с двумя параметрами, которые передаются в фигурных скобках (числитель и знаменатель). Например:

`* $\frac{1+x}{n}$` — $\frac{1+x}{n}$

Больше в документации [документации по LaTeX](https://en.wikibooks.org/wiki/LaTeX/Mathematics).

#### ЗАДАНИЕ 3.5 (ДЛЯ САМОПРОВЕРКИ)

На скриншоте ниже представлен свёрстанный `md`-файл.

##### <center>Face Mask Detection</center>

<center> <img src=https://raw.githubusercontent.com/Vrushti24/Face-Mask-Detection/logo/Logo/facemaskdetection.ai%20%40%2051.06%25%20(CMYK_GPU%20Preview)%20%2018-02-2021%2018_33_18%20(2).png width=200px height=200>

Здесь написано что-то про распознание лиц.

<center> <img src=https://raw.githubusercontent.com/chandrikadeb7/Face-Mask-Detection/master/Readme_images/Screen%20Shot%202020-05-14%20at%208.49.06%20PM.png width=300px height=200>

# 4/11  4. Системы контроля версий. `Git` и `GitHub`.

**Система управления версиями (англ. Version Control System)** — это программное обеспечение, которое позволяет управлять состояниями изменяющейся информации. Благодаря таким системам несколько людей могут работать с файлами, сохранять их версии, перемещаться между версиями и откатывать изменения.

**Репозиторий** — это хранилище каких-либо данных. В случае с системой контроля версий, репозиторий — это хранилище, содержащее программный код и другие атрибуты (например, данные) IT-проекта.

Основная задача системы управления версиями — фиксация различных изменений, произведённых с файлами в репозитории, и возможность отслеживать эти изменения и управлять ими. Например, если произошло обновление программного кода, которое губительно повлияло на работу программы, можно отследить, кто, где и когда произвёл эти изменения, а при необходимости — отменить их. Кроме того, при использовании системы контроля версий есть возможность создавать различные резервные копии программного кода.

На скриншоте ниже представлено два варианта файла с кодом на языке `JavaScript`. В режиме сравнения версий редактор `VS` Code обращает наше внимание на строку 13 — именно она была изменена:
![MDN_GIT_4_1.png](attachment:MDN_GIT_4_1.png)

#### СИСТЕМА КОНТРОЛЯ ВЕРСИЙ `GIT`

![MDN_GIT_4_5.png](attachment:MDN_GIT_4_5.png)

[Логотип Git. Автор: Jason Long](http://git-scm.com/downloads/logos)

`Git` — это проект, созданный Линусом Торвальдсом и изначально предназначенный для конкретной цели — управления разработкой ядра операционной системы Linux. Первая версия Git была выпущена 7 апреля 2005 года.

Как мы отмечали ранее, `Git` — распределённая система управления версиями. Кроме того, в `Git` предусмотрен механизм ветвления, о котором мы поговорим далее. Если не вдаваться в подробности, то разработчики могут создавать отдельные ветки проекта и обмениваться изменениями до их объединения в официальную ветвь.

В Git практически все операции совершаются локально, то есть на вашем компьютере, сеть используется только для операций обмена с удалёнными репозиториями.

Со временем Git развился в простую, быструю, эффективную систему контроля версий. Для него были разработаны:

* Графические интерфейсы (для удобства пользователей).

Однако максимально эффективной работы можно добиться, комбинируя текстовые команды и использование возможностей GUI, поэтому знание текстовых команд тоже важно для разработчика.

* `Git`-хостинги, реализующие механизм облачного удалённого репозитория. Наиболее популярны на сегодня:

  * [GitHub](https://github.com/),
  * [Bitbucket](https://bitbucket.org/),
  * [GitLab](https://about.gitlab.com/).

#### `GITHUB` — ХОСТИНГ IT-ПРОЕКТОВ

![MDN_GIT_4_6.png](attachment:MDN_GIT_4_6.png)

`GitHub` — наиболее популярный хостинг для IT-проектов. На нём хранятся миллионы удалённых репозиториев как небольших команд, так и крупных корпораций.

Отличительная особенность `GitHub` — лёгкое создание форков.

Среди возможностей этого IT-хостинга, кроме возможностей системы контроля версий, есть ведение документации (`wiki`) проекта, трекинг задач (`issues`), приём пожертвований.

Небольшие проекты и проекты с открытым исходным кодом имеют те же возможности на GitHub, что и крупные коммерческие проекты, но для них использование хостинга бесплатно.

#### СОЗДАНИЕ УДАЛЁННОГО РЕПОЗИТОРИЯ

Для создания репозитория на GitHub используйте кнопку `New` на главной странице или на странице со списком репозиториев.

После создания удалённого репозитория необходимо связать проект с ним.

Мы можем связать наш локальный проект с этим репозиторием.

# 5/11  5. `Git`. Основные операции

✍ Мы подготовили свой удалённый репозиторий, однако для начала нам нужно разобраться с локальным. Для этого необходимо подробнее изучить основные операции Git. После этого мы свяжем локальный репозиторий с удалённым и синхронизируем их.

Перед тем как мы перейдём к рассмотрению основных команд, важно зафиксировать терминологию, которой мы будем оперировать. Ключ к пониманию концепции Git — знание о «трёх деревьях»:

**Рабочая директория** — файловая система проекта (те файлы, с которыми вы работаете).

**Индекс** — список отслеживаемых Git-файлов и директорий, промежуточное хранилище изменений (редактирование, удаление отслеживаемых файлов).

**Директория `.git/`** — в этой локальной директории хранятся все данные контроля версий проекта (вся история разработки — коммиты, ветки, теги и пр.).

Перейдём к рассмотрению основных команд. Все они выполняются в `терминале VS Code`.

**Примечание.** Сначала мы познакомимся с синтаксисом команд, обсудим, для чего они предназначены и как устроены, а затем в скринкасте рассмотрим их применение на практике.

Чтобы использовать функционал системы контроля версий Git, в командной строке используется `команда git`. Общий синтаксис выглядит следующим образом:

`git config`

Команда `config` предназначена для настройки параметров Git на вашем компьютере.

Например, первое, что вам следует сделать после установки Git — указать ваше имя и адрес электронной почты. Это важно, потому что каждый коммит в Git содержит эту информацию и она не может быть далее изменена. Без указания этой информации многие другие команды будут выполняться с ошибкой.

Если вы не сделали этого ранее, когда устанавливали Git, или захотели поменять настройки, рекомендуем сделать это сейчас. Для этого необходимо указать ключ `--global` (глобальные изменения) и передать в команду аргументы `user.name` и `user.email`:

Примечание. Следующая команда выведет список всех ваших настроек, включая имя и почту:

`git init`

Данная команда инициализирует локальный репозиторий. По сути, она создаёт пустой репозиторий на вашем компьютере.

Если смотреть «под капот» и разбираться в деталях, то инициализация репозитория — это создание в текущей директории новой поддиректории с именем `.git`, содержащей все необходимые файлы репозитория — структуру Git-репозитория.

**Обратите внимание**, что репозиторий инициализируется именно в той директории, в которой вы вызываете команду init! Следите за текущей директорией в командной строке.

Пример (создаём репозиторий из текущей директории):

`git init`

**Примечание.** Чтобы посмотреть на содержимое папки .git в Windows, в проводнике нужно отобразить скрытые папки. Для этого в разделе «Вид» нужно поставить галочку напротив пункта «Скрытые элементы»:
![MDN_GIT_5_1.png](attachment:MDN_GIT_5_1.png)

**Примечание.** Если удалить папку .git, вы удалите репозиторий и всю историю изменений вашего проекта.


`git clone`

Команда `clone` — другой вариант инициализации репозитория из уже существующего с помощью копирования. Её общий синтаксис:

Данная операция пригодится вам, если все файлы вашего проекта уже где-то существуют.

Клонировать можно как локальный (находящийся на вашем компьютере), так и удалённый (находящийся на GitHub) репозиторий.

Пример:

`git add`

Команда `add` добавляет файл (папку с файлами) в индекс (иногда говорят «индексирует»), то есть добавляет его в список отслеживаемых для системы контроля версий. Нужно указать в аргументах, какой файл или папку мы хотим добавить.

Примеры:

`git add README.md` — добавляет файл README.md в индекс.

`git add data/` — добавляет папку data и всё её содержимое в индекс.

Чаще всего нам нужно добавить все файлы в текущем каталоге в индекс (кроме игнорируемых, о которых мы поговорим ниже). Для этого используется команда

Символ точки здесь означает текущую директорию, то есть мы добавляем в индекс все папки и файлы из текущей директории.

`git reset`

Как вы уже наверное догадались, что данная команда противоположна предыдущей — она позволяет убрать файлы (папки с файлами) из списка отслеживаемых.

Примеры:

`git reset README.md` — удаляет файл README.md из индекса.

`git reset data/` — удаляет папку data из индекса.

Чтобы убрать из индекса все файлы из текущей директории, используйте точку:

`git commit`

Пожалуй, самая главная операция системы Git — это commit (коммит).

**Коммит** — это операция сохранения набора изменений, сделанного в рабочей директории с момента предыдущего коммита. Коммит неизменен, его нельзя отредактировать — можно только отменить.

При выполнении команды `commit` изменения всех файлов, внесённые в индекс, фиксируются в репозитории.

У всех коммитов (кроме самого первого) есть один или более родительских коммитов, поскольку коммиты хранят изменения от предыдущих состояний. Важно понимать, что Git не сохраняет файлы полностью при каждом коммите — он сохраняет только изменения, которые произошли в новом коммите. То есть если вы изменили одну строку кода в файле example.py, то при фиксации изменений на вашем компьютере появится не ещё один такой же файл, а только информация о том, что в этом файле было изменено.

Команда `commit` откроет текстовый редактор для ввода сообщения коммита. Также эта команда принимает несколько аргументов:

* `-m` позволяет написать сообщение вместе с командой, не открывая текстовый редактор.
Обычно в сообщении указывается задача, которая решается этим обновлением, например «инициализация», «добавление счетов» или «исправление ошибки создания счёта».  
Пример:  
`git commit -m "fixed bag in function clean_data"`

* `-a` переносит все отслеживаемые файлы в область подготовленных файлов и включает их в коммит.  
Пример:  
`git commit -a -m "fixed bag in function clean_data"`

* `--amend` заменяет последний коммит новым изменённым коммитом, что бывает полезно, если вы неправильно набрали сообщение последнего коммита или забыли включить в него какие-то файлы.

Каждый коммит содержит уникальную контрольную сумму (хеш) — идентификатор, который Git использует, чтобы ссылаться на коммит. Для отслеживания истории в папке `.git` есть `файл HEAD`.

**HEAD** — это **указатель** (то есть ссылка на один из коммитов), главное назначение которого — определять, в каком состоянии находится рабочая директория. На какой коммит указывает HEAD, в таком состоянии файлы и находятся в рабочей области.

Зная *HEAD* (текущий действующий коммит), мы можем перемещаться по истории коммитов.
![MDN_GIT_5_2.png](attachment:MDN_GIT_5_2.png)

Чтобы посмотреть, на какой из коммитов указывает HEAD в данный момент, можно открыть файл HEAD в текстовом редакторе или использовать команду `cat-file` с ключом `-p` (от слова `print`). Пример:

#### ПОЛУЧЕНИЕ ДАННЫХ О СОСТОЯНИИ РЕПОЗИТОРИЯ

`git status`

Данная команда позволяет отследить состояние файлов в репозитории и узнать, какие изменения необходимо зарегистрировать Git (при необходимости — отменить).

Файл в репозитории может находиться в нескольких состояниях:

1. **Отслеживаемый.** Это те файлы, о которых Git знает и отслеживает изменения в них. Отслеживаемые файлы в свою очередь могут находится в следующих состояниях:

   1.1.  **Неизменённый.** То есть с момента последнего коммита в файле не было никаких изменений.

   1.2.  **Изменённый.** То есть с последнего коммита в файле были произведены какие-то изменения.  
   
   1.3.  **Подготовленный к коммиту.** Это значит, что вы внесли изменения в этот файл и затем проиндексировали файлы с внесёнными изменениями. Полученные изменения будут добавлены в следующий коммит.
2.  **Неотслеживаемый.** О неотслеживаемых файлах Git не знает, поэтому изменения в них не будут добавлены в коммит. Это любые файлы в вашем рабочем каталоге, которые не входили в последний коммит и не подготовлены к текущему коммиту.

На скриншоте ниже представлен пример информации, полученной после применения команды `git status`. Предварительно в список отслеживаемых файлов была добавлена папка data (и её содержимое).
![MDN_GIT_5_3.png](attachment:MDN_GIT_5_3.png)

Здесь Git указывает, что мы находимся в ветке master, коммитов ранее не совершалось, и приводит список файлов, которые отслеживаются и подготовлены к коммиту, а также список файлов, которые не отслеживаются.

Можно вывести более сжатую версию этой информации, воспользовавшись командой   
`git status -s`:
![MDN_GIT_5_4.png](attachment:MDN_GIT_5_4.png)

**Примечание.** Здесь префикс `A` — отслеживаемый файл, `??` — неотслеживаемый файл. Существует также префикс `AM` — отслеживаемый и модифицированный файл.

`git log`

Эта команда показывает список последних коммитов и их хеши. Список выводится, начиная с последнего коммита.

На скриншоте ниже представлен пример использования команды `git log`. Предварительно было совершено два коммита.
![MDN_GIT_5_5.png](attachment:MDN_GIT_5_5.png)

Обратите внимание, что хеши являются уникальными и ваши, скорее всего, будут отличаться от представленных.

**Примечание.** Чтобы выйти из режима логирования, необходимо нажать "`q`".

`git show`

Выполнив эту команду, вы увидите на экране информацию по определённому коммиту: кто сделал этот коммит, когда это произошло, сообщение коммита, а также сами изменения. Общий синтаксис команды:

На скриншоте ниже приведён пример использования команды `git show a2815b`. Как вы видите, при обращении к идентификатору достаточно указать несколько первых символов хеша:
![MDN_GIT_5_6.png](attachment:MDN_GIT_5_6.png)

В выводе команды `show` содержится информация об авторе коммита, дате коммита, а также обо всех изменениях в каждом из файлов. Просмотр изменений осуществляется в режиме текстового редактора.

Примечание. Свернуть окно просмотра после команды `show` можно с помощью символа "`q`".

#### ПЕРЕМЕЩЕНИЕ МЕЖДУ КОММИТАМИ И ОТКАТ ИЗМЕНЕНИЙ

`git checkout`

Зная хеши коммитов и их историю, мы можем перемещаться между ними, то есть возвращаться к состоянию файлов в нашем проекте, зафиксированному тем или иным коммитом. В этом нам поможет команда `checkout`. Её общий синтаксис:

С точки зрения системы `Git` перемещение между коммитами (без дополнительных ключей) — это не что иное, как передвижение указателя `HEAD`.

Чтобы подробнее разобраться, что происходит при передвижении указателя, давайте рассмотрим пример. Пусть изначально у нас есть вот такой репозиторий:

![MDN_GIT_5_7.png](attachment:MDN_GIT_5_7.png)


Серыми овалами обозначены коммиты (их четыре), текст на них — часть хеша соответствующего коммита. Коричневым прямоугольником обозначен указатель ветки: на приведённом примере она одна и называется `master`. Белым прямоугольником обозначен указатель `HEAD` — его-то мы и будем двигать.

Чтобы перейти к определённому коммиту, вам нужно лишь передать его хеш в качестве параметра команды `checkout`. Например:

Примечание. Для перемещения по коммитам можно использовать относительный путь. Для этого используются операторы `~` (назад по истории коммитов) и `^` (вперёд по истории коммитов), то есть предыдущую команду можно записать как:

```python
git checkout HEAD~2
```

Эта запись будет означать перемещение указателя `HEAD` из текущего состояния на два коммита назад.

В результате выполнения первой или второй команды все файлы в директории перейдут в то состояние, которое было зафиксировано в коммите с хешем `90ab`, и на экране появится примерно следующее сообщение:

```python

You are in 'detached HEAD' state. You can look around, make experimental changes and commit them, and you can discard any commits you make in this state without impacting any branches by switching back to a branch.

…

HEAD is now at 90abf7e L-04: fixing gradient bug
```

То есть `Git` выдаёт предупреждение, что мы находимся в некотором состоянии, именуемом “`detached head`” (дословно — «отрубленная голова»). Схематично его можно изобразить так:

![MDN_GIT_5_8.png](attachment:MDN_GIT_5_8.png)

Как видно из рисунка, указатель `HEAD` действительно передвинут на два коммита назад. Однако указатель ветки master остался на месте и всё ещё указывает на последний коммит. Такое состояние, когда HEAD указывает не на указатель ветки, а непосредственно на сам коммит, как раз и называется `detached head`.

`git revert`

Ваш проект может перестать работать после внесения изменений в код. В таком случае важно уметь быстро вернуть всё к рабочему состоянию и только потом заниматься поиском ошибки. Для этого как раз и нужна команда `revert`.

Данная команда создаёт новый коммит, который отменяет изменения, внесённые в переданном коммите (последовательности коммитов). То есть для отмены изменений создаётся новый коммит, который «стирает» тот, который мы укажем в аргументах.

Например, команда `git revert 62aa` создаст новый коммит, который отменяет изменения, сделанные в коммите `62aa`. Если мы просто выполним данную команду, будет открыт консольный редактор, чтобы вы могли отредактировать сообщение нового коммита. Можно что-то дописать, можно сразу закрыть редактор (комбинация клавиш "`:`" и "`q`"), а можно воспользоваться ключом `--no-edit` и оставить сообщение нового коммита по умолчанию (рекомендуется).

Аналогично команде `checkout` можно воспользоваться относительным путём. Например:

```python
git revert HEAD --no-edit #отмена изменений в текущем коммите
git revert HEAD~1 --no-edit #отмена изменений в предыдущем коммите
```

# 6/11  6. Git. Игнорирование и работа с удалённым репозиторием

## ФAЙЛ `.GITIGNORE`

ЗАЧЕМ ИГНОРИРОВАТЬ?

Команда `git add .` производит добавление всех файлов в проекте в отслеживаемые. Это удобно, если требуется отслеживать несколько файлов.

Однако бывают файлы, которые нельзя добавлять в репозиторий.

Это могут быть локальные настройки проекта, учётные данные, сведения об ошибках, библиотеки, промежуточные результаты компиляции и т. д.

Такие файлы требуется добавлять в игнорируемые для Git.

**Примечание**. Также стоит учитывать файлы, объём которых слишком велик — GitHub не позволяет хранить в удалённых репозиториях файлы объёмом более 500 Мб. Поэтому если в вашем проекте возникают такие файлы, их также стоит игнорировать. В дальнейшем вы столкнётесь с такой ситуацией при выполнении своего первого проекта по Python на этом курсе.

ОПИСАНИЕ ФАЙЛА

Файл с описанием файлов, для которых не должно вестись отслеживание версий, имеет расширение `.gitignore`.

Файл `.gitignor`e представляет собой простой текстовый файл с перечнем шаблонов файловых имён, которые не должны отслеживаться.

Основные правила синтаксиса этого файла:

* одна строка — один шаблон;
* пустые строки игнорируются;
* чтобы написать комментарий, в начале строки укажите знак `#`, закомментированные строки не рассматриваются.

Для сопоставления с именами файлов в `.gitignore` используются специальные шаблоны. Давайте познакомимся с основными:

<table>
<tbody>
<tr style="background-color: #88cdb2; vertical-align: middle; text-transform: uppercase; color: #062425; font-weight: bold;">
<td style="width: 20%;">Пример шаблона</td>
<td style="width: 50%;">Комментарий</td>
<td style="width: 30%;">Примеры файлов, которые попадают под этот шаблон и не попадут в коммит</td>
</tr>
<tr>
<td><em><code>debug.log</code></em></td>
<td>Это самый простой случай. В результате применения такого шаблона будут игнорироваться все файлы с указанным названием во всех каталогах репозитория.</td>
<td>
<p><em><code>debug.log</code></em></p>
<p><em><code>logs/debug.log</code></em></p>
<p><em><code>model/debug.log</code></em></p>
</td>
</tr>
<tr>
<td><em><code>/debug.log</code></em></td>
<td>Символ / в начале строки указывает, что правило применяется только к файлам и каталогам, которые располагаются в том же каталоге, что и сам файл <em>.gitignore</em>.</td>
<td>
<p><em><code>debug.log</code></em></p>
<p><strong><code>!но не</code></strong></p>
<p><em><code>logs/debug.log</code></em></p>
<p><em><code>model/debug.log</code></em></p>
</td>
</tr>
<tr>
<td><em><code>*.log</code></em></td>
<td>Звёздочка (*) заменяет любое количество символов (в том числе и ноль). <br>В данном примере игнорируются все файлы с расширением <em>.log</em> независимо от того, где они находятся.</td>
<td>
<p><em><code>debug.log</code></em></p>
<p><em><code>foo.log</code></em></p>
<p><em><code>logs/debug.log</code></em></p>
<p><strong><code>!но не</code></strong></p>
<p><em><code>foo.logger</code></em></p>
</td>
</tr>
<tr>
<td><em><code>**/logs/</code></em></td>
<td>Две звёздочки (**) используются для указания любого количества подкаталогов.
<p>В данном примере игнорироваться будут все каталоги <em>logs</em> и их содержимое</p>
</td>
<td>
<p><em><code>logs/debug.log</code></em></p>
<p><em><code>logs/monday/foo.txt</code></em></p>
<p><em><code>builds/logs/debug.log</code></em></p>
</td>
</tr>
<tr>
<td>
<p><em><code>debug?.log</code></em></p>
</td>
<td>Знак вопроса соответствует строго одному символу.</td>
<td>
<p><em><code>debug0.log</code></em></p>
<p><em><code>debugg.log</code></em></p>
<p><strong><code>!но не </code></strong></p>
<p><em><code>debug10.log</code></em></p>
</td>
</tr>
<tr>
<td><em><code>*.log</code></em>
<p><em><code>!important.log</code></em></p>
</td>
<td>Восклицательный знак в начале шаблона отменяет действие шаблона (инвертирует правило).
<p>Если файл соответствует некоему шаблону, но при этом <em>также</em> соответствует отменяющему шаблону, указанному после, такой файл не будет игнорироваться.</p>
</td>
<td>
<p><em><code>debug.log</code></em></p>
<p><em><code>foo.log</code></em></p>
<p><strong><code>!но не</code></strong></p>
<p><em><code>important.log</code></em></p>
<p><em><code>logs/important.log</code></em></p>
</td>
</tr>
</tbody>
</table>

**Примечание.** На деле шаблонов гораздо больше. Но запоминать их все не нужно — вы всегда можете найти их в интернете, например [здесь](https://routerus.com/gitignore-ignoring-files-in-git/  'https://routerus.com/gitignore-ignoring-files-in-git/').

Давайте разберём пример содержимого файла `.gitignore`. Пусть у нас есть следующая директория:


Перед нами стоят задачи игнорировать:

* директорию .DS_Store, так как в ней не содержится ничего важного — это системные файлы;
* папку config и всё её содержимое, так как в ней содержатся все настройки (явки и пароли);
* все папки с кэшем, которые возникают в проекте;
* все файлы с расширением .log за исключением файла model.log.

Согласно нашим задачам, файл `.gitignore` будет содержать следующие строки:
![MDN_GIT_5_9.png](attachment:MDN_GIT_5_9.png)

В проекте может быть любое количество файлов `.gitignore`, однако обычно достаточно одного в корневой папке проекта.

Примечание. Иногда возможна ситуация, что вы уже закоммитили файлы, которые стоило добавить в `.gitignore`. Чтобы игнорировать файл, для которого ранее был сделан коммит, необходимо удалить этот файл из репозитория, а затем добавить для него правило в `.gitignore`.

Можно использовать команду `git rm` с параметром `--cached`, чтобы удалить этот файл из репозитория, но оставить его в рабочем каталоге как игнорируемый.

Например, следующая команда удаляет файл `debug.log` из коммита:

```python
git rm --cached debug.log
```

После этого вы можете внести этот файл в `.gitignore` и сделать новый коммит.

## РАБОТА С УДАЛЁННЫМ РЕПОЗИТОРИЕМ

Важно понимать, что удалённый репозиторий — это полноценный репозиторий, и у него все те же функции, что и у локального: собственные ветки, указатель HEAD, история коммитов и т. д.

`git remote add`

Данная команда используется для добавления связанных удалённых репозиториев. Общий синтаксис этой команды выглядит следующим образом:


`git remote add [имя удалённого репозитория] [ссылка]`


Имя удалённого репозитория в команде `remote add` вы можете придумать самостоятельно. Заданное имя вы будете использовать впоследствии при работе с репозиторием. Традиционно удалённый репозиторий носит имя `origin`, однако никаких ограничений здесь нет.

Со ссылкой на удалённый репозиторий тоже всё просто: мы работаем с `GitHub`, поэтому эту ссылку можно получить, нажав на большую зелёную кнопку Code на странице репозитория на `GitHub`.

Существует несколько вариантов подключения к удалённому репозиторию:

* `HTTPS`-ссылка,
* `SSH`-ссылка,
* `GitHub CLI`-ссылка.  

Мы будем использовать вариант с `HTTPS`.

Раньше можно было подключаться по HTTPS, используя имя пользователя и пароль от аккаунта GitHub. Потом эту возможность отключили из соображений безопасности. Сейчас вместо пароля нужно использовать **персональный токен.**

Примечание. Напомним, что мы создавали персональный токен в модуле [PY-8](https://lms.skillfactory.ru/courses/course-v1:SkillFactory+MFTIDSLIGHT+2022_DEC/jump_to_id/3091cda791254a738bcce75892b876a5#token 'skillfactory.ru') при нашем первом знакомстве с GitHub.

При первой загрузке/скачивании изменений из удалённого репозитория вас попросят ввести имя пользователя на GitHub и пароль. Нужно будет ввести своё имя пользователя, а вместо пароля вставить токен.  
Пример:


`git remote add origin 
https://github.com/SkillfactoryDS/DataCleaningProject.git`


`git remote remove`

Раз есть возможность подключить удалённый репозиторий и добавить его в список связанных, значит, должна быть возможность и `отключить` его. Для этого предназначена команда `remote remove`. Её синтаксис:

`git remote remove [имя удалённого репозитория]`

Пример:

`git remote remove origin`

`git push`

Операция `push` производит отправку локальных изменений из текущей ветки в удалённый репозиторий. Общий синтаксис команды:

`git push [имя удалённого репозитория][имя ветки]`

Пример:

`git push origin master`

`git fetch`

Данная команда используется для `получения изменений` с удалённого репозитория. Важно отметить, что при этом приходит список изменений, но они не вносятся в код, используемый в локальном репозитории.

Общий синтаксис:

`git fetch [имя удалённого репозитория]`

Пример:

`git fetch origin`

В результате выполнения данной команды на вашем компьютере будет создана новая удалённая ветка `origin/master`. Чтобы посмотреть, какие изменения были совершены в удалённом репозитории, можно воспользоваться уже знакомой вам командой checkout. Она позволит переключиться на новую ветку:

`git checkout origin/master`

Примечание. Так как ветка `origin/master` не является веткой локального репозитория, а считается удалённой, то при выполнении команды checkout мы попадём в состояние “`detached head`”, о котором говорили ранее.

`git merge`

Операция `merge` используется `для слияния` полученных с помощью команды `fetch` изменений и текущей ветки локального репозитория. О слиянии веток мы поговорим отдельно в следующем юните.

Пример `получения и слияния` изменений из удалённого репозитория:

`git fetch origin`  
`git merge origin/master`

После выполнения этих команд все изменения, которые зафиксированы в удалённом репозитории, вступят в силу в локальном.

`git pull`

На самом деле, если вы уверены в изменениях в удалённом репозитории, то можете сразу `получить эти изменения и объединить` их с локальным репозиторием. Для этого предназначена операция pull. Она является объединением двух последовательных команд `git fetch` и `git merge`.

Общий синтаксис команды:

`git pull [имя удаленного репозитория] [имя ветки]`

Пример:

`git pull origin master`

На практике, конечно же, команда `pull` используется намного чаще, чем связка `fetch` и `merge`.

Интересный факт. Представьте, что вы и другой разработчик одновременно клонируете репозиторий. Затем ваш коллега выполняет команду `push`. Если вы попытаетесь выполнить такую же команду после него, ваш `push` точно будет отклонён. Для внесения ваших изменений вам требуется получить изменения с удалённого репозитория и слить их с вашим программным кодом с помощью команды `pull`.

# 7/11  7. Git. Ветвление и конфликты

**Ветка (branch)** — это последовательность коммитов.

Для простоты восприятия ветку лучше всего рассматривать как временную шкалу, а коммиты в ней — версии программы, идущие друг за другом в хронологической последовательности. Посмотрим на схематичное представление веток:
![MDN_GIT_6_1.png](attachment:MDN_GIT_6_1.png)

На рисунке изображены три ветки с именами `master`, `dev` и `feature`. Каждая представляет из себя последовательность коммитов (они обозначены овалами, и текст в них — первые символы хеша). Важно заметить, что ветки не пересекаются, то есть работа в ветках идёт параллельно.

Однако если смотреть на то, как механизм веток реализован с точки зрения системы `Git`, то ветка — это ссылка на последний коммит в ней. Следующая картинка похожа на предыдущую, но есть принципиальное отличие — ветка ссылается не на всю историю коммитов в ней, а только на последний. Например, под названием ветки "`master`" на самом деле будет скрываться ссылка на коммит `c24d`, а под именем "`develop`" — ссылка на коммит `h41a`. Это очень похоже на механизм работы переменных в Python.
![MDN_GIT_6_2.png](attachment:MDN_GIT_6_2.png)

На самом деле в начальный момент времени в любом репозитории всегда есть как минимум одна ветка. По умолчанию в Git ветка создаётся под именем `master` (в ней мы и работали ранее). Каждый раз когда мы создаём новый коммит в этой ветке, Git автоматически перемещает указатель ветки `master` на последний коммит.

## ЧТО ТАКОЕ ВЕТВЛЕНИЕ?

Создание различных версий репозиториев, отличных друг от друга, и называется **ветвлением**.

![MDN_GIT_6_3.png](attachment:MDN_GIT_6_3.png)

<center>*Кругами изображены точки-фиксации изменений в репозитории (коммиты)*

**Зелёная ветка** — ветка программы, которая доступна пользователям.

Все разработчики начинают работу с одной и той же версией репозитория, однако впоследствии каждый вносит и фиксирует свои изменения, что приводит к появлению версии программы, отличной от других. При этом в дальнейшем все изменения, созданные разработчиками, вносятся в общую ветку.

## СОЗДАНИЕ ВЕТКИ И ПЕРЕКЛЮЧЕНИЕ НА ВЕТКУ

Рассмотрим `команды git`, которые нам понадобятся для работы с ветками проекта.

`git branch`

Как мы уже говорили ранее, как только вы создаёте свой первый коммит, Git `создаёт` основную `ветку master`. Тем не менее, мы можем создавать собственные ветки и переключаться между ними.

Для создания ветки можно использовать команду `branch`. Её полный синтаксис:

`git branch [наименование ветки]`

Например, следующая команда создаст ветку с именем `develop`:

`git branch develop`

`Для удаления` ветки используется та же самая команда `branch`, но с ключом `-D`. Например, следующая команда удалит ветку с именем develop:

`git branch -D develop`

`git checkout`

Это уже знакомая нам команда. Ранее мы использовали её для переключения между коммитами: с её помощью мы перемещаем указатель текущего состояния HEAD на заданный коммит. Однако точно так же можно перемещать указатель на определённую ветку, ведь выше мы отметили, что указатель на ветку — это указатель на последний коммит в ней.

Например, следующее сочетание команд `создаёт ветку dev и переключает нас на неё`:

`git branch develop`  
`git checkout develop`

На самом деле эту запись можно сократить до одной команды. Оказывается, команда `checkout` может самостоятельно создавать ветку и сразу переключаться на неё. Для этого достаточно указать ключ `-b`. Это намного удобнее, чем выполнять два этих действия по отдельности. Поэтому данный способ является более предпочтительным.  

 **Пример:**

`git checkout -b develop`

**Важное замечание**: как только вы создали новую ветку с помощью команды branch, она указывает на тот же коммит, что и основная ветка, из которой вы работали ранее, и HEAD.

Графически ситуация выглядит так:

![MDN_GIT_6_4.png](attachment:MDN_GIT_6_4.png)

Если же вы `переключитесь` на новую ветку (используя команду `checkout`), поработаете в ней, внесёте какие-то изменения и сделаете несколько коммитов, то ситуация будет выглядеть вот так:

![MDN_GIT_6_5.png](attachment:MDN_GIT_6_5.png)


Видно, что указатель ветки `develop` и указатель текущего состояния HEAD передвинулись на последний коммит `9fab`. При этом важно отметить, что так как и ветка, и `HEAD` указывают на одно и то же, то состояния `“detached head” не возникает`.

## ПРОСМОТР СПИСКА ВЕТОК И ИХ СОСТОЯНИЙ

Когда в проекте много веток, существует вероятность, что вы забудете их имена, а без знания имени ветки работать с ней у вас не получится. Для просмотра списка веток используется всё та же команда `branch`.

Можно просто вызвать команду из терминала, и она выведет список всех локальных веток.
 
**Например:**



`git branch`

 *master*   
 *develop*  

Однако можно добавить ключи:

`-r` (от англ. remote). Добавив этот ключ в команду branch, вы сможете вывести список только удалённых веток (тех, которые находятся в удалённом репозитории).

 **Пример:**

`git branch -r`

 *origin/master*

-a. С этим ключом выводятся все ветки — как локальные, так и удаленные. Пример:

`git branch -a`

*master*   
*develop*  
*remotes/origin/master*

Для просмотра состояния файлов, информации по истории коммитов и изменений, которые в них были произведены в текущей ветке, используются те же самые команды `status`, `log` и `show`, которые мы изучали ранее.

## СЛИЯНИЕ ВЕТОК

**Слияние веток** — это процесс переноса изменений из одной ветки в другую. При этом слияние **не затрагивает сливаемую ветку**(ту, из которой мы берём изменения), то есть она остаётся в том же состоянии, что позволяет нам потом продолжить работу с ней. Ветка, `в которую сливаются` все изменения, называется `целевой`.

`git merge`

Данная команда вносит коммиты из другой ветки в текущую. Её синтаксис имеет вид:

`git merge [имя сливаемой ветки]`

В Git существует две стратегии слияния — `неявное` и `явное`. Давайте рассмотрим их различия.

В случае `неявного слияния` (используется по умолчанию) не создаётся никаких новых коммитов — используются только уже существующие. Идея такого слияния заключается в том, что из вливаемой ветки извлекается несколько коммитов, а затем они применяются к последнему коммиту целевой ветки. `Такое слияние называется fast-forward`.

Пример выполнения неявного `fast-forward-слияния` для случая нашего репозитория из примера выше:

`git checkout master`  
`git merge develop`

Что происходит в результате выполнения этих команд?

1. Проверяется, что в ветке master отсутствуют коммиты, сделанные после ответвления develop.
2. Проверяется, что не возникает конфликтов слияния (о них мы поговорим ниже).
3. Переносится указатель master на коммит 9fab.
Теперь ветка develop как бы стала веткой master.

![MDN_GIT_6_6.png](attachment:MDN_GIT_6_6.png)

В случае `явного слияния` (оно задаётся с помощью ключа `no-ff`) всегда создаётся новый так называемый merge-коммит, который «объединяет» изменения двух веток. У этого коммита есть особенность — два родительских коммита: первый родитель — последний коммит сливаемой ветки, второй — последний коммит целевой ветки.

Пример выполнения явного `no-fast-forward-слияния` для случая нашего репозитория из примера выше:

`git checkout master`  
`git merge –-no-ff develop`

Что происходит в результате выполнения этих команд?

1. Проверяется, нет ли конфликтов слияния. Если возникает конфликт, выполнение команды `git merge` останавливается, чтобы получить инструкции от пользователя (об этом мы поговорим ниже).
2. Все изменения из коммитов `81na` и `9fab` добавляются в индекс ветки `master`.
3. Выполняется коммит.

Режим `fast-forward` используется по умолчанию (без дополнительных ключей) и считается более удобным, поскольку он не подразумевает создания лишних merge-коммитов, засоряющих историю репозитория. С другой стороны, если мы захотим продолжить пользоваться веткой `develop` после `fast-forward-слияния`, потом будет довольно трудно разобраться в её истории. Поэтому, выполняя слияние, задумайтесь, хотите ли вы, чтобы оно прошло в режиме `fast-forward`, или лучше явно создать `merge-коммит`, собирающий всё воедино.

## КОНФЛИКТЫ

ЧТО ТАКОЕ КОНФЛИКТ?

При работе с исходным кодом часто возникают ситуации, когда несколько разработчиков одновременно редактируют один и тот же код. В этом случае при слиянии кода система контроля версий не может определить, какой код правильный.

Схематично это можно представить следующим образом:

![MDN_GIT_6_8.png](attachment:MDN_GIT_6_8.png)

РЕШЕНИЕ КОНФЛИКТОВ

Если подобные ветки слить с помощью команды `merge`, результат будет примерно следующим:

, а сам Git при выполнении команды сообщит вам о конфликте:

`CONFLICT (content): Merge conflict in main.md`

Что делать в этом случае?

Всё просто: требуется вручную написать результирующий код, а после этого зафиксировать (закоммитить) изменения. Многие IDE, интегрированные с Git, представляют удобный интерфейс для решения конфликтов.

Полностью избежать конфликтов нельзя, но можно сократить их количество, соблюдая некоторые правила. Эти правила должны вводиться руководителем, но их соблюдение требуется от всех членов команды.

<center>Рекомендации по решению конфликтов для руководителей проекта.</center>  


1. Решайте задачи таким образом, чтобы разработчики не производили изменения в одних и тех же участках кода одновременно.

   Если требуется сделать несколько правок на одном участке кода, поручите это одному разработчику. Ведь если разработчики вынуждены одновременно работать с одним и тем же функционалом, вероятность конфликта возрастает, а время решения конфликта может превышать продолжительность написания кода, приведшего к конфликту.

2. Работайте с актуальной версией кода. Если произошло изменение ветки, с которой предстоит слияние, вытяните эти изменения. 

   Всё просто: в потенциальном месте конфликта вы можете писать свой код уже после того, как другой разработчик напишет и опубликует свой, при этом конфликта не произойдёт.

3. Выработайте и соблюдайте требования к настройкам редактора кода, оформлению кода, используйте editorconfig.

   Частый случай: настройки редактора кода одного разработчика форматируют исходный код на отступ в четыре пробела, настройки редактора второго — на отступ в два пробела. У обоих установлено автоформатирование перед `push`. Получается, что в удалённый репозиторий почти каждый раз уходят практически все файлы проекта, а что ни слияние — то конфликт. В наше время существуют инструменты для конфигурирования форматирования проекта (editorconfig) — изучите их синтаксис и используйте.

![MDN_GIT_6_9.png](attachment:MDN_GIT_6_9.png)

<center>*Пример содержимого файла .editorconfig*</center>   

4. Внесите локальные настройки проекта и другие `локальные` файлы в `.gitignore`.

5. Соблюдайте рекомендации по разделению сущностей на разные файлы. Например, в нашем проекте по очистке данных мы вынесли функции для поиска выбросов в файл `find_outliers.py`.

   Если проект в тысячу строк написан в одном файле, конфликты будут очень частым явлением.

6. Соблюдайте рекомендации к наименованиям и иерархии.

   Например, если назвать файлы, размещённые в каталоге Article, «addArticle» и «addComment», а не «add» и «add», вероятность конфликта снизится до нуля.

*Часто (но не всегда) конфликты может решить одна сторона. Не забывайте, что работаете в команде и не пренебрегайте знаниями второй стороны о написанном коде в случае конфликта.*

# 8/11  8. Методологии ветвления. Культура коммитов. Форк

✍ В этом юните мы рассмотрим типичные схемы ветвления. Их знание поможет вам повысить эффективность своей работы и работы всей команды.

<div style="width: 100%;"><div style="position: relative; padding-bottom: 56.25%; padding-top: 0; height: 0;"><iframe title="DST-3.0. BONUS MDN&GIT_unit_8" frameborder="0" width="1200px" height="675px" style="position: absolute; top: 0; left: 0; width: 100%; height: 100%;" src="https://view.genial.ly/633ae76d9e26ed001866821c" type="text/html" allowscriptaccess="always" allowfullscreen="true" scrolling="yes" allownetworking="all"></iframe> </div> </div>

## КУЛЬТУРА КОММИТОВ

Теперь давайте обсудим, как правильно делать коммиты, ведь это тоже важное умение любого разработчика, использующего систему Git.

Основные причины написания «культурных» коммитов:

1. Если коммиты написаны грамотно, вам будет проще найти место, где всё сломалось.

2. Каждый разработчик, прочитав коммиты при слиянии, может увидеть историю, что повысит общую информированность по проекту.

3. Благодаря средствам автоматизации можно вести `changelog` (список изменений) или оповещать других участников проекта об изменениях.

4. Понятная история развития проекта.

Правильное написание коммитов приходит с опытом, но уже сейчас, соблюдая несколько простых правил, вы сможете писать сообщения коммитов на уровне профессионала:

* Текст коммита формируется из трёх частей:

  * действие (добавление, исправление, рефакторинг и т. д.);

  * сущность (документация, новая модель, главная страница и т. д.);

  * подробности (задача №23, несуществующий пользователь, зависимости и т. д.) — необязательное поле.

* Полнота — не многословие. Старайтесь давать достаточную информацию об изменениях, но стоит избегать излишних подробностей.

* Используйте в коммитах английский язык. В русскоязычных командах допускаются коммиты на русском языке, но это не лучшая практика, так как ограничивает аудиторию проекта.

* Найдите свой стиль. Необязательно изобретать велосипед. Ознакомьтесь с различными практиками, соблюдайте требования команды.

Есть слова, которые уже воспринимаются разработчиками как определённые действия:

`init` — инициализация;  
`add` — добавление;  
`delete` — удаление;  
`update` — изменение;  
`fix` — исправление;  
`refactor` — рефакторинг кода приложения;  
`style` — исправление опечаток, форматирования;  
`docs` — всё, что касается документации;  
`test` — всё, что связано с тестированием;  
`merged`, `fix conflict` — слияние, решение конфликта.

## ФОРК

ЧТО ТАКОЕ FORK?

Предположим, вы хотите использовали чей-то проект, содержащий уже обученную модель, например какую-нибудь нейронную сеть, которая детектирует кошек на изображениях и делает это довольно неплохо.

**Форк** — собственный проект, основанный на другом проекте, но при этом сохраняющий связь с ним.

**Важные возможности форка:**

* сохраняет связь с проектом-родителем, по которой он может **получить** изменения из проекта-родителя;

* сохраняет связь с проектом-родителем, по которой он может **передать** изменения в проект-родитель. Этот принцип используется в методологии ветвления Forking Workflow.

КАК СОЗДАТЬ FORK?

В Git создание форка изначально не предусмотрено, но есть возможность работать с удалёнными репозиториями, благодаря которой различные хостинги IT-проектов реализуют функционал создания форка.

На `GitHub` форк создаётся с помощью кнопки `fork`, которая появляется в интерфейсе при просмотре чужих проектов.

![MDN_GIT_7_8.png](attachment:MDN_GIT_7_8.png)

Далее, как только вы сделаете форк проекта, он появится в списке ваших репозиториев на GitHub, и вы сможете работать с этим репозиторием как угодно — для этого будет достаточно связать его с вашим локальным репозиторием, как мы делали это ранее.

# 9/11  9. Рекомендации к составлению портфолио на GitHub

*Иногда по итогам собеседований остаётся несколько равнозначных претендентов, и тогда каждый бит информации о кандидате и его профессиональных качествах, к которым относятся проекты на GitHub, может оказаться решающим.*

## ОФОРМЛЕНИЕ РЕПОЗИТОРИЕВ

### КРАТКОЕ ОПИСАНИЕ И ТЕМЫ ПРОЕКТА

В разделе `About` репозитория есть место для краткого описания, ссылки на работающую версию (если таковая имеется) и тем (`topics`) вашего проекта.

![MDN_GIT_8_1.png](attachment:MDN_GIT_8_1.png)

**Важно!** Указанные описание и темы проекта помогают ему чаще появиться в поисковых запросах.

**Что написать в описании?**

В разделе `Description` укажите одно или несколько предложений, характеризующих направленность вашего проекта.

**Какие ключевые слова вписывать в темы?**

В разделе `Topics` вы можете указать ключевые слова, по которым можно найти ваш проект. Начните с ключевых слов о самом проекте, например: *data cleaning, data analysis, machine learning, e-commerce, segmentation* и т. д.

Затем перечислите стек используемых в проекте технологий: *Python, JavaScript, Java, C#, Laravel, PHP, REST, MongoDB, PostgreSQL*, и т. д.

![MDN_GIT_8_2.png](attachment:MDN_GIT_8_2.png)

Пример. Со списком всех популярных GitHub Topics вы можете ознакомиться [здесь](https://github.com/topics/).

Теперь ваш проект можно найти по любой из указанных тем.

*Также помните: чем больше у проекта будет звёзд, тем выше он окажется в поисковой выдаче. Поделитесь своими проектами с вашими друзьями-разработчиками/коллегами по учебе и просите их поставить вам звезды. Здесь всё, как в соцсетях: чем больше лайков, тем лучше.*

### ДОКУМЕНТАЦИЯ ПО ПРОЕКТУ

После генерации краткого описания проекта можно переходить к документации по нему.

Чаще всего у разработчиков файл README.md содержит только одну строку: # `project-name`. Мы уже обсуждали, что лучше так не делать.



Что должен включать в себя идеальный файл `README.md` (этот список примерный, так как содержание проекта полностью зависит от самого проекта):

1. **Название проекта.** Не забудьте дать своему проекту имя. Вы удивитесь, но это довольно сложная часть. Название должно быть лаконичным и отражать суть вашего проекта.

2. **Введение или краткое описание.** Напишите несколько предложений, которые поясняют, о чём ваш проект и для кого он предназначен.

3. Если это возможно, **добавьте ссылку на демонстрацию работы** или **статью по проекту**.

4. **Описание данных**, если в вашем проекте используется датасет.

5. **Инструкции по сборке и запуску проекта.** Добавьте раздел, где будут перечислены все знания и инструменты, необходимые тому, кто пожелает воспользоваться вашим проектом — сюда входит язык программирования и библиотеки (желательно с версиями).

6. **Как установить ваш проект.**
Опишите, как можно воспользоваться вашим кодом. Если проект целиком описан в Jupyter-ноутбуке, то достаточно указать основные команды git, которые позволят пользователю импортировать ваш проект себе в локальный репозиторий. Если ваш проект — это библиотека или целое приложение, то необходимо указать весь поэтапный процесс его установки и запуска.

7. **Добавьте список контрибьюторов**, если таковые имеются. Перечислите людей, которые причастны к вашему проекту, со ссылками на их профили на GitHub. Это хороший способ демонстрации владения командной разработкой. К тому же, так вы сможете выразить благодарность людям, потратившим время на участие в вашем проекте.

8. **Укажите информацию о лицензии.** Этот пункт не относится к учебным проектам, которые мы будем решать в рамках нашего курса. Однако если вы столкнётесь с разработкой собственной библиотеки или приложения, то пункт с лицензией на ваш продукт обязательно стоит упомянуть. Стартапы и прочие компании, использующие стороннее ПО, не смогут использовать ваш продукт, если не будут знать, на каких условиях это можно делать. Посмотреть виды лицензий можно на [choosealicense.com](https://choosealicense.com/ 'choosealicense.com') или [opensource.org](https://opensource.org/licenses 'opensource.org').

9. **Дополнительная информация.** Например, вы можете дать ссылки на похожие работы или статьи, которые проясняет некоторые термины.

10. Хорошим тоном будет **указать раздел с выводами** по проекту.

Цель подготовки документации — не только дать читателю хорошее представление о проекте, но также показать отношение к документированию и базовые навыки подготовки документации.

**Примечание.** Для удобства читателя с помощью механизма ссылок Markdown можно добавить оглавление вашего проекта. Как мы делали это в модуле PY-8 при оформлении своего первого проекта.

Посмотрите, например, на учебный проект с использованием [The Movie Database API](https://github.com/Oodmincheg/movie-db).

**Скриншоты, скринкасты**

Если вы решаете не просто Data Science-задачу по анализу данных и построению модели, а реализуете целое приложение, в которое встроена ваша модель, и у приложения есть пользовательский интерфейс, [скриншоты в документации](https://www.youtube.com/watch?v=hHbWF1Bvgf4) добавят очков.

Скринкаст в виде гифки сделает демо ещё более наглядным. Гифку лучше захостить за пределами GitHub, допустим, на [imgur](https://imgur.com/), а затем вставить ссылку на неё в файл README.

Промежуточный итог

Если вы грамотно оформили свой репозиторий, дайте на него прямую ссылку в резюме. Рекомендуемые места для вставки такой ссылки — разделы *Skills* или *Education*. Желательно, чтобы ссылка была не такого вида [github.com/username/repo](http://github.com/username/repo), а аккуратная и лаконичная, например [react-patterns project](https://github.com/Vitaminvp/react-patterns).

Пример оформленного файла `README.md` для нашего проекта по очистке данных вы можете найти [здесь](https://lms-cdn.skillfactory.ru/assets/courseware/v1/a41eae048c53bfe9d9d0af773e673fdc/asset-v1:SkillFactory+MFTIDSLIGHT+2022_DEC+type@asset+block/README.zip). Добавьте в разделе «Авторы» себя и ссылку на свои социальные сети, а также напишите несколько предложений о проделанной работе в разделе «Выводы». Сделайте commit в вашем репозитории, добавив в него обновленную версию файла `README.md` и отправьте полученные изменения на удаленный репозиторий.

**Примечание.** Если ваш проект довольно большой и требует подробной документации по нему, то вам возможно понадобится создать целый сайт с документацией. Для такого случая в *GitHub* встроен сервис `Wiki`. Подробнее о нем вы можете узнать [здесь](https://starkovden.github.io/Manage-wiki-content.html).

## КАСТОМИЗАЦИЯ СТАРТОВОЙ СТРАНИЦЫ НА GITHUB

Конечно, первое, что увидит ревьюер, — титульная страница профиля. Тут всё должно быть информативно и удобно.

*GitHub* является лицом любого разработчика, в том числе дата-сайентиста, поэтому необходимо уделить время оформлению профиля. Например, очень выгодно смотрится красиво оформленная стартовая страница *GitHub*, где вы указываете информацию о себе.

[Пример](https://github.com/katiehuangx) хорошо оформленной стартовой страницы:

![MDN_GIT_8_3.png](attachment:MDN_GIT_8_3.png)

Хотите такую же страницу? Для этого необходимо создать отдельный репозиторий, имя которого полностью совпадает с вашим именем пользователя на *GitHub*. Затем в файле `README.md` вы можете указать всю необходимую информацию о себе (какую именно — расскажем далее в скринкасте).

*Цель оформления репозитория — «показать товар лицом». Чаще всего вы не единственный кандидат на ту или иную позицию, и выигрывает тот, кто упрощает работу специалисту со стороны потенциального работодателя.*


Сейчас у вас вряд ли есть множество своих проектов, однако они обязательно появятся — при прохождении нашего курса, участии в хакатонах или реализации собственных идей.

На титульной странице профиля пользователя *GitHub* есть возможность зафиксировать до шести проектов. Выберите (или создайте) те, которые лучше всего демонстрируют ваши навыки, и приступайте к их оформлению.

![MDN_GIT_8_4.png](attachment:MDN_GIT_8_4.png)

Шаблон с файлом `README.md` для оформления стартовой страницы *GitHub* вы можете найти [здесь](https://lms-cdn.skillfactory.ru/assets/courseware/v1/39029b057e3ed40a703ecd60e27ac4af/asset-v1:SkillFactory+MFTIDSLIGHT+2022_DEC+type@asset+block/pattern.zip). Эмодзи для оформления текста можно посмотреть [здесь](https://github.com/markdown-templates/markdown-emojis).

Ещё несколько примеров хорошо оформленных портфолио: [один](https://github.com/Pankaj-Baviskar), [два](https://github.com/davis7887), [три](https://github.com/AndreyRysistov).

## ЧТО ПОКАЗАТЬ, ЕСЛИ ПОКАЗАТЬ НЕЧЕГО

Возможно, заглядывая в чужие профессиональные репозитории, вы могли почувствовать некоторую неуверенность в себе.

Однако стоит понять, что никто не ожидает увидеть в вашем исполнении уникальный сервис на тысячи строк кода. Скорее всего, ревьюер будет оценивать уровень владения технологиями, способность писать документацию (хотя бы минимальную), стиль кода, навыки работы с Git.

Гораздо чаще именно стилистически грамотно оформленные проекты оказываются важнее, чем плохо реализованная уникальная идея. Помните главное правило: «код читается чаще, чем пишется».

На протяжении всего курса мы будем решать несколько интересных и приближенных к реальным задачам дата-сайентиста учебных проектов. Выберите несколько таких, которые наилучшим образом отражают ваши навыки и которые вы смогли выполнить лучше всего.

Для того чтобы показать свою разносторонность и владение навыками разработки, можно добавить одну-две простых игры типа «Крестики-нолики», [Frogger](https://classroom.udacity.com/courses/ud015/lessons/3072058665/concepts/31018886370923#) или [Memory Game](https://github.com/kottans/frontend/blob/master/tasks/memory-pair-game.md). Все новички делают что-то подобное, но не все завершают начатое и показывают результат. Не пытайтесь достичь оригинальности на первых этапах своей карьеры — всё ради демонстрации навыков и умений.

Будет идеально, если кто-то сделает [ревью](https://techrocks.ru/2019/02/14/code-review-ultimate-guide/) вашего кода и укажет на его «грязные» места. Попробуйте обратиться с этой просьбой к вашим продвинутым сокурсникам в Slack.

Ещё один источник проектов — хакатоны, которых сейчас проводится десятки ежемесячно. Здесь вновь важна не победа, а увлечённое участие и наработка профессиональных навыков.

**Примечание.** *SkillFactory* постоянно организует студенческие хакатоны по *Data Science* совместно с различными компаниями, которые предлагают реальные *DS-кейсы* и задачи. Следите за обновлениями в *Slack* и участвуйте в как можно большем количестве активностей.

**Ещё один важный совет:** хорошие учебные репозитории лучше, чем их полное отсутствие. При прочих равных работу получает кандидат даже с «примитивными» проектами, если у его оппонента таких проектов вовсе нет. Помните, что репозитории можно удалять, архивировать и скрывать (делать приватными) — так вы сможете менять свой профиль со временем, заменяя свои «примитивы» чем-то более сложным и профессиональным.

*GitHub*-профиль работает и помогает только тогда, когда он есть и вы подходите к нему «с душой». Оформить свой профиль аккуратно — это значит позаботиться о тех, кто будет его смотреть и изучать. Подойдя к этому вопросу со всей ответственностью, вы повышаете свою конкурентноспособность на рынке *IT*-специалистов.