# 1/11  1. Введение

Добро пожаловать в модуль, посвящённый созданию проектов на `GitHub`!

✍ Ранее мы уже познакомились с таким инструментом версионирования кода, как `Git`, и веб-сервисом, основанном на нём, — `GitHub`. В этом модуле мы продолжим изучать эту тему: научимся работать с языком разметки `Markdown`, поговорим о том, как оформлять свои проекты с его помощью, об основных командах системы `Git` и о том, как производить версионирование своего кода.

Внимание! Для полноценной работы нам понадобятся все инструменты, с которыми мы знакомились в модуле 7.1 [«Инструменты для Data Science»](https://lms.skillfactory.ru/courses/course-v1:SkillFactory+MFTIDSLIGHT+2022_DEC/jump_to_id/280b11e9f4934a459660eeeb0c3763ea), поэтому если вы не прошли данный модуль, настоятельно рекомендуем это сделать и установить все необходимые инструменты.

#### СКВОЗНОЙ ПРИМЕР ПРОЕКТА

На протяжении всего модуля мы будем работать над небольшим учебным проектом — задачей очистки данных о квартирах в Москве из модуля «PY-14. Очистка данных».

Наш проект продемонстрирует применение различных методов очистки данных на каждом из её этапов:

работа с пропусками,  
работа с выбросами,  
работа с дубликатами.

Начальная структура проекта будет следующей (в дальнейшем она немного изменится):

Где:

* `data` — папка с исходными данными (у нас это данные о квартирах в Москве);

* `images` — папка с изображениями, необходимыми для проекта;

* `outliers_lib` — папка со вспомогательными модулями для поиска выбросов (`find_outliers.py`) и описание этих модулей (файл `README.md`);

* `data_cleaning_example.ipynb` — `Jupyter-ноутбук`, содержащий основной код проекта, в котором демонстрируются методы и подходы решения задач очистки данных.


Важное замечание. Весь код, который используется в проекте, мы изучали ранее, поэтому останавливаться на нём подробно мы не будем. Цель этого модуля — не решить новую задачу, а превратить уже решённую в пример проекта. Однако рекомендуем просмотреть ноутбук, чтобы освежить знания.

# 2/11  2. Язык разметки Markdown

#### ЧТО ТАКОЕ ЯЗЫК РАЗМЕТКИ?

**Язык разметки** — это специальный компьютерный язык для описания оформления и строения документа.

Markdown — простой язык разметки.

<strong> Markdown </strong> — простой язык разметки.

Такие управляющие конструкции, указывающие на определённое оформление текста, называются `тегами`.

На самом деле практически все пользователи создают документы на каком-то из языков разметки, но не знают об этом — создание тегов берёт на себя графический интерфейс.

`WYSIWYG` (“`What You See Is What You Get`”) — свойство прикладных программ или веб-интерфейсов, в которых содержание отображается в процессе редактирования и выглядит максимально похожим на конечный результат.

![MDN_GIT_2_2.png](attachment:MDN_GIT_2_2.png)
![MDN_GIT_2_2.png](attachment:MDN_GIT_2_2.png)

Пример разметки с помощью `WYSIWYG`-расширения. В режиме редактирования кода видно, что оформление создаётся с помощью языка разметки `Markdown`.



Самый простой и повседневный пример `WYSIWYG`-сервиса — программа `MS Word`, которая позволяет создавать текстовые документы в графическом интерфейсе: можно задавать шрифт текста, его размер, наклон и ширину, добавлять в документы списковые конструкции, изображения, формулы и многое другое. Ещё один пример `WYSIWYG`-сервиса — любые конструкторы сайтов. Они позволяют создавать структуру сайтов, даже если вы не владеете `HTML`.

Однако практически все разработчики сталкиваются с необходимостью описания представления данных с помощью языков разметки.

Процесс создания страниц из составных элементов называется `компьютерной вёрсткой`. При этом могут использоваться как WYSIWYG-редакторы, так и редакторы, требующие знания языков разметки.

**Обратите внимание!** Язык разметки — это не то же самое, что язык программирования. Языки программирования служат для обработки данных, а языки разметки — для их представления.

**Примечание**. Для любознательных мы собрали [список](https://lms-cdn.skillfactory.ru/assets/courseware/v1/3552ebbc5060f20c587be321b9dc762a/asset-v1:SkillFactory+MFTIDSLIGHT+2022_DEC+type@asset+block/MFTIDSLIGHT_Модуль_4_Markdown_и_GIT_для_создания_портфолио.pdf) самых используемых на сегодняшний день языков разметки.

#### ЯЗЫК РАЗМЕТКИ `MARKDOWN`

`Markdown` — простой и понятный язык разметки для оформления документации, который является `упрощённой версией HTML`. Благодаря своей простоте он используется во множестве сервисов — как специальных (для разработчиков), так и направленных на пользователей.

`Markdown-разметка` (`md-разметка`) используется для написания документов, блогов, комментариев. Большинство IDE преобразуют md-разметку, с помощью которой разработчик оформляет текст.

![MDN_GIT_2_3.png](attachment:MDN_GIT_2_3.png)

Язык Markdown поддерживается многими мессенджерами, например `Telegram` и `Slack`:

#### РЕДАКТОРЫ `MARKDOWN`

Файлы с разметкой `Markdown` имеют расширение `.md`.

Существует огромное количество редакторов, расширений и сервисов, поддерживающих `Markdown`.


Давайте создадим в редакторе `VS Code` файл example.md и напишем в нём какой-нибудь текст (см. ниже). Для того чтобы открыть файл в режиме просмотра, достаточно нажать кнопку «Открыть область предварительного просмотра» в верхнем правом углу.

Сервис `GitHub`, с которым мы будем работать, и другие хостинги веб-проектов в режиме просмотра отображают не содержимое файлов `README.md`, а обработанную разметку. Эти файлы — лицо вашего проекта. В них разработчики описывают, о чём их проект, как работает код, какие действия необходимо произвести, чтобы запустить приложение/программу, и т. д.

Ниже представлен пример отображения разметки на языке `Markdown`, написанной в файле README.md в [репозитории](https://github.com/laravel/laravel). Вы можете самостоятельно посмотреть на содержимое файла и увидеть, как представленная свёрстанная стартовая страница выглядит в виде текста.

Существуют различные сервисы для создания документов именно с помощью md-разметки, например [hackmd.io](https://hackmd.io/).

# 3/11  3. Синтаксис `Markdown`

Начнём с основ построения текста. В Markdown разделителем абзацев служит пустая строка. Посмотрим на пример:
![MDN_GIT_3_1.png](attachment:MDN_GIT_3_1.png)

Если вы знакомы с языком HTML, то при использовании Markdown можно воспользоваться HTML-тегами. Например, тег `<strong>` позволяет выделять текст полужирным:

Примечание. Список всех HTML-тегов вы можете найти [здесь](https://html5book.ru/html-tags/ 'https://html5book.ru/html-tags/').

#### ШРИФТ

Очень часто требуется сделать акценты на каких-то элементах текста. Самый простой способ — использовать наклонный (курсивный) и полужирный шрифт.

Наклонное и полужирное начертание в Markdown задаются при помощи символов * и _:

- один символ — для наклонного текста (`*italic*`);
- два символа — для жирного текста (`**strong**`);
- три — для наклонного и жирного одновременно (`***жирный и наклонный***`).

#### ЗАГОЛОВКИ

Любая хорошая статья (а описание проекта можно считать статьёй) должна иметь логические разделы и подразделы. Как правило, начало разделов выделяют заголовками.

В синтаксисе Markdown заголовки отмечаются символом # (от одного до шести штук) в начале строки. Размер шрифта каждого следующего уровня меньше предыдущего:

Примечание. Часто при написании текста мы стремимся отцентрировать заголовки разделов. Для этого в Markdown можно воспользоваться тегом `<center>`:

# <center> Заголовок h1 </center>

Пример использования заголовков с центрированием для оформления статьи:
![MDN_GIT_3_5.png](attachment:MDN_GIT_3_5.png)

Полезно выделять структуру текста с помощью горизонтальных линий. VS Code автоматически рисует горизонтальную линию после заголовка первого уровня, но можно добавить эту линию вручную с помощью символа `---`:

## Заголовок h2

---

## Заголовок h2

#### СПИСКИ

`Списки` — способ представить упорядоченную информацию. Например, это может быть список зависимостей программы (библиотек), которые необходимо установить перед её запуском, или некоторый разработанный нами алгоритм, который мы хотим описать в виде шагов.

Для разметки ненумерованных списков можно использовать символы `*`, `-` или `+` — результат будет один:

+ элемент 1

- элемент 2

* элемент ...

Вложенные пункты создаются `двумя или более` пробелами перед маркером пункта:

* элемент

  * вложенный элемент 2.1

  * вложенный элемент 2.2

Для разметки нумерованных списков ставится положительное число с точкой:

1. элемент 1

2. элемент 2

   2.1. элемент 3

   2.2. элемент 3
  
      2.2.3. sdf

         2.2.3.1

3. элемент 4

Нумерация списка начинается с того числа, которое стоит первым на уровне.

В отличие от ненумерованных списков, в нумерованных перед элементами вложенного списка ставится `три пробела`.

#### ССЫЛКИ И ИЗОБРАЖЕНИЯ

При описании своего проекта нередко хочется добавить ссылки на дополнительные источники — статьи, книги, файлы или изображения.

Ссылки создаются комбинацией квадратных и круглых скобок: в квадратных скобках указывается отображаемый текст ссылки, а в круглых — URL-адрес или путь до файла, на который вы ссылаетесь. Ссылки могут быть обычными (без подсказок) или с подсказками, которые всплывают при наведении курсором на ссылку:

* без подсказки — [текст ссылки](http://example.com/link);  
* c подсказкой — [текст ссылки](http://example.com/link "Подсказка").

Для отображения изображений перед квадратными скобками ставится восклицательный знак:

![](https://i.imgur.com/3uj9teq.png)

В квадратные скобки при этом записывается текст, который отображается, если картинка по каким-то причинам недоступна.

Другой вариант вставки изображений — использовать тег `<img>` со специальными атрибутами. Например, атрибут `src` устанавливает источник изображения (путь до файла или URL-ссылка), по которому будет происходит чтение изображения, а атрибуты `width` и `height` позволяют установить ширину и высоту изображения в пикселях или процентах от исходного изображения:

<img src=https://i.imgur.com/3uj9teq.png width=500px height=30%>

#### ПРОГРАММНЫЙ КОД И ЦИТИРОВАНИЕ