## <center> 4. Системы контроля версий. Git и GitHub

Часто, когда разработчиков спрашивают, что такое *Git*, все сразу как по учебнику отвечают примерно следующее: «*Git* — это распределённая система контроля версий». И вроде бы всё правильно, но когда дотошные интервьюеры задают кандидатам уточняющие вопросы (Что значит «распределённая»? Какие ещё бывают системы контроля версий?), те в большинстве своём теряются.

*Представьте ситуацию: игрок доходит до финального босса в видеоигре и проигрывает в сражении. Для игрока будет чрезвычайно обидно вернуться к началу уровня. Поэтому разработчики предусмотрели, что игрок попадает в ближайшую контрольную точку игры, где ему было разрешено сохраниться.*

В программировании за сохранение кода в контрольных точках отвечает **система контроля версий** — специальная технология, которую можно подключить к любому проекту.

**Система управления версиями (англ. Version Control System)** — это программное обеспечение, которое позволяет управлять состояниями изменяющейся информации. Благодаря таким системам несколько людей могут работать с файлами, сохранять их версии, перемещаться между версиями и откатывать изменения.

##### <center> **ЗАЧЕМ УПРАВЛЯТЬ ВЕРСИЯМИ?**

Ситуация, в которой электронный документ (например, файл с кодом) за время своего существования претерпевает ряд изменений, достаточно типична и очевидна. При этом **часто бывает важно иметь не только последнюю версию, но и несколько предыдущих**.

В простейшем случае можно вручную создать несколько версий одного и того же файла, например *file.py*, *file-1.py*, *file-2.py* и т. д. Такой способ неэффективен: во-первых, из-за него необходимо хранить несколько практически идентичных копий, во-вторых, он требует повышенного внимания и часто приводит к ошибкам. Чтобы решить эти проблемы, были разработаны **средства автоматизации.**

**Репозиторий** — это хранилище каких-либо данных. В случае с системой контроля версий, репозиторий — это хранилище, содержащее программный код и другие атрибуты (например, данные) IT-проекта.



**Основная задача системы управления версиями** — фиксация различных изменений, произведённых с файлами в репозитории, и возможность отслеживать эти изменения и управлять ими. 

Например, если произошло обновление программного кода, которое губительно повлияло на работу программы, можно отследить, кто, где и когда произвёл эти изменения, а при необходимости — отменить их. Кроме того, при использовании системы контроля версий есть возможность создавать различные резервные копии программного кода.

На скриншоте ниже представлено два варианта файла с кодом на языке *JavaScript*. В режиме сравнения версий редактор *VS Code* обращает наше внимание на строку **13** — именно она была изменена:

![image.png](attachment:image.png)

##### <center> **ТИПЫ СИСТЕМ КОНТРОЛЯ ВЕРСИЙ**

1. **Локальные**
 
 Локальная система хранит **все файлы на одном конкретном устройстве** (например, на ПК) и контролирует их изменения на нём. В локальной системе удобно работать, если вы один, но проблематично, когда у вас команда из нескольких человек.

2. **Централизованные**

В централизованной системе весь проект существует в **единственном** экземпляре и **хранится на главном удалённом сервере**. Доступ к серверу осуществляется через специальное клиентское **приложение**, в котором разработчики напрямую обновляют состояние проекта.

Преимущество такой системы в том, что ей удобно управлять из-за наличия только одного центрального репозитория. Но из-за привязанности этого репозитория к одному серверу **любой сбой или взлом может безвозвратно уничтожить все файлы проекта**.

![image.png](attachment:image.png)


3. **Распределенные**

В распределённой системе контроля версий есть **один удалённый репозиторий (как правило, в облаке) и множество локальных**. Удалённый репозиторий можно считать центральным, но только условно.

При этом локальные и удалённые репозитории **синхронизированы**, то есть разработчики работают с локальной копией общего репозитория, причём все копии проекта, включая удалённую, являются **равнозначными**. После внесения изменений в локальную копию проекта они отправляются на удалённый репозиторий.

Преимущество такого подхода заключается в **автономии разработчика** при работе над проектом, **общей гибкости системы и повышении надёжности** благодаря тому, что каждый разработчик имеет локальную копию центрального репозитория.

**Недостаток** — сложность управления проектом из-за возможности возникновения конфликтов, о которых мы поговорим далее в модуле.

![image-2.png](attachment:image-2.png)

Часто понятие «система контроля версий» ассоциируется только с Git. Однако Git — не первая и не единственная такая система. Для расширения кругозора предлагаем вам познакомимся со знаковыми представителями в этой [статье](https://habr.com/ru/post/478752/).

##### <center> **СИСТЕМА КОНТРОЛЯ ВЕРСИЙ GIT**

[Git](https://git-scm.com/) — это проект, созданный Линусом Торвальдсом и изначально предназначенный для конкретной цели — управления разработкой ядра операционной системы *Linux*. Первая версия Git была выпущена 7 апреля 2005 года

Как мы отмечали ранее, Git — распределённая система управления версиями. Кроме того, в Git предусмотрен механизм ветвления, то есть разработчики могут создавать отдельные ветки проекта и обмениваться изменениями до их объединения в официальную ветвь.

*Для него были разработаны:*

* **Графические интерфейсы** (для удобства пользователей).
Однако максимально эффективной работы можно добиться, комбинируя текстовые команды и использование возможностей [GUI]('Графического интерфейса'), поэтому знание текстовых команд тоже важно для разработчика.

* **Git-хостинги**, реализующие механизм облачного удалённого репозитория. Наиболее популярны на сегодня:
  * [GitHub](https://github.com/),
  * [Bitbucket](https://bitbucket.org/),
  * [GitLab](https://about.gitlab.com/).

##### <center> **GITHUB - ХОСТИНГ IT-ПРОЕКТОВ**

[GitHub](https://github.com/) — наиболее популярный хостинг для *IT*-проектов. На нём хранятся миллионы удалённых репозиториев как небольших команд, так и крупных корпораций.

Отличительная особенность *GitHub* — лёгкое создание [форков]('Форки - это собственные проекты, созданные на основе сторонних проектов. Создание форков на GitHub осуществляется нажатием всего одной кнопки').

Среди возможностей этого *IT*-хостинга, кроме возможностей системы контроля версий, есть ведение документации (*wiki*) проекта, трекинг задач (*issues*), приём пожертвований.

Небольшие проекты и проекты с открытым исходным кодом имеют те же возможности на *GitHub*, что и крупные коммерческие проекты, но для них использование хостинга бесплатно.

##### <center> **СОЗДАНИЕ УДАЛЕННОГО РЕПОЗИТОРИЯ**

Для создания репозитория на *GitHub* используйте кнопку *New* на главной странице или на странице со списком репозиториев.

После создания удалённого репозитория необходимо связать проект с ним.

Мы можем связать наш локальный проект с этим репозиторием.

**Примечание**. По умолчанию в удалённом репозитории главная ветка называется *main*. Однако в *Git* репозитории именуются как *master*. Из-за этого могут возникать трудности и необходимость объединять эти ветки при работе над проектами. Чтобы избежать этого, мы рекомендуем сменить название веток в *GitHub*-репозиториях на *master*. Для этого в настройках *GitHub* зайдите в раздел *Repositories* и смените имя ветки в разделе *Repository default branch*.

![image.png](attachment:image.png)

##### <center> **СОЗДАЕМ УДАЛЕННЫЙ РЕПОЗИТОРИЙ ПРОЕКТА**

## <center> 5. Git. Основные операции

Перед тем как мы перейдём к рассмотрению основных команд, важно зафиксировать **терминологию**, которой мы будем оперировать. Ключ к пониманию концепции *Git* — **знание о «трёх деревьях»**:

>**Рабочая директория** — файловая система проекта (те файлы, с которыми вы работаете).

>**Индекс** — список отслеживаемых *Git*-файлов и директорий, промежуточное хранилище изменений (редактирование, удаление отслеживаемых файлов).

>**Директория** `.git/` — в этой локальной директории хранятся все данные контроля версий проекта (вся история разработки — коммиты, ветки, теги и пр.).

Перейдём к рассмотрению основных команд. Все они выполняются в *терминале VS Code*.

Чтобы **использовать функционал** системы контроля версий *Git*, в командной строке используется команда `git`. Общий синтаксис выглядит следующим образом:

>git <**команда**> <**аргументы** команды>

* `git config`
  
Команда `config` предназначена для настройки параметров *Git* на вашем компьютере.

Например, первое, что вам следует сделать после установки *Git* — **указать ваше имя и адрес электронной почты**. Это важно, потому что каждый коммит в *Git* содержит эту информацию и она не может быть далее изменена. Без указания этой информации основные команды *Git* будут работать, но коммиты будут создаваться без информации об авторе, что может вызвать трудности при совместной работе.

Если вы не сделали этого ранее, когда устанавливали *Git*, или захотели поменять настройки, рекомендуем сделать это сейчас. Для этого необходимо указать ключ `--global` (глобальные изменения) и передать в команду аргументы `user.name` и `user.email`:

```python
    git config --global user.name "Your Name"
    git config --global user.email "your_email@whatever.com"
```

**Примечание**. Следующая команда выведет список всех ваших настроек, включая имя и почту:

```python
git config –-list
```

* `git init`

Данная команда инициализирует локальный репозиторий. По сути, она создаёт пустой репозиторий на вашем компьютере.

Если смотреть «под капот» и разбираться в деталях, то инициализация репозитория — это создание в текущей директории новой поддиректории с именем `.git`, содержащей все необходимые файлы репозитория — структуру *Git*-репозитория.

>**Обратите внимание**, что репозиторий инициализируется именно в той директории, в которой вы вызываете команду `init`! Следите за текущей директорией в командной строке.

**Пример** (создаём репозиторий из текущей директории):

>`git init`

```python
Initialized empty Git repository in A:/Курс DS-3.0/GIT-1. Markdown и Git для создания портфолио/DataCleaningProject/.git/
```

>**Примечание.** Чтобы посмотреть на содержимое папки *.git* в *Windows*, в проводнике нужно отобразить скрытые папки. Для этого в разделе «Вид» нужно поставить галочку напротив пункта «Скрытые элементы»:

![image.png](attachment:image.png)

>**Примечание.** Если удалить папку *.git*, вы удалите репозиторий и всю историю изменений вашего проекта.

* `git clone`
  
Команда `clone` — другой вариант инициализации репозитория из уже существующего с помощью копирования. Её общий синтаксис:

>git clone [**ссылка на репозиторий**]

  Данная операция пригодится вам, если все файлы вашего проекта уже где-то существуют.

  Клонировать можно как локальный (находящийся на вашем компьютере), так и удалённый (находящийся на *GitHub*) репозиторий.

  Пример:

`git clone https://github.com/SkillfactoryDS/example`

* `git add`

Команда add добавляет файл (папку с файлами) в индекс (иногда говорят «индексирует»), то есть добавляет его в список отслеживаемых для системы контроля версий. Нужно указать в аргументах, какой файл или папку мы хотим добавить.

  Примеры:

`git add README.md` — добавляет файл README.md в индекс.

`git add data/` — добавляет папку data и всё её содержимое в индекс.

Чаще всего нам нужно добавить все файлы в текущем каталоге в индекс (кроме игнорируемых, о которых мы поговорим ниже). Для этого используется команда

`git add .`

  Символ точки здесь означает текущую директорию, то есть мы добавляем в индекс все папки и файлы из текущей директории.



* `git reset`

Как вы уже наверное догадались, что данная команда противоположна предыдущей — она позволяет убрать файлы (папки с файлами) из списка отслеживаемых.

Примеры:

`git reset README.md` — удаляет файл README.md из индекса.

`git reset data/` — удаляет папку data из индекса.

  Чтобы убрать из индекса все файлы из текущей директории, используйте точку:

`git reset .`