# Markdown и GIT для создания портфолио

✍ Ранее мы уже познакомились с таким инструментом версионирования кода, как Git, и веб-сервисом, основанном на нём, — GitHub. В этом модуле мы продолжим изучать эту тему: научимся работать с языком разметки Markdown, поговорим о том, как оформлять свои проекты с его помощью, об основных командах системы Git и о том, как производить версионирование своего кода.

Темы, которые раскрываются в этом модуле, важны для любого разработчика, желающего создать собственное портфолио и повысить свой профессионализм.

Инструменты, которые мы рассмотрим, могут встретиться вам в вашей профессиональной деятельности: например, с языком Markdown вы встретитесь при оформлении ноутбуков, а Git и GitHub — это негласный стандарт хранения и версионирования кода проектов.

Чаще всего от кандидата на позицию Data Scientist ожидают определённого уровня технических знаний. Специалистам уровня Junior особенно непросто: как правило, опыта разработки проектов и прохождения технических интервью у них не хватает или нет совсем. Код кандидата, написанный до интервью, может стать конкурентным преимуществом.

Во-первых, работодатель сразу сможет оценить уровень вашего кода и сложность выполненных проектов. То есть вы заранее демонстрируете свои так называемые hard skills.\
Во-вторых, хорошо оформленный аккаунт на GitHub с несколькими репозиториями позволит вам показать работодателю свой профессионализм, обучаемость, ответственность, а также владение навыком презентации своих проектов. Всё это лежит в области soft skills, которые сегодня не менее важны, чем hard skills.\
Правильное оформление профиля и двух-трёх наиболее показательных репозиториев на GitHub поможет обойти конкурентов. Когда по итогам цикла собеседований остаётся несколько равноценных кандидатов, каждый бит информации может оказаться решающим, в том числе и проекты на GitHub.

Модуль состоит из трёх частей:

Язык разметки Markdown.
В первой части вы познакомитесь с языками разметки и узнаете, зачем они нужны, а также изучите основы синтаксиса языка Markdown.

Система контроля версий Git.
Во второй части мы повторим системы управления версиями и подробнее разберёмся с их самым популярным представителем — Git. Мы обсудим основные концепции версионирования кода, поговорим об основных командах Git, которые должен знать каждый разработчик, изучим ветвление в Git и методологии управления ветвлением в проектах.

Оформление портфолио.
В заключительной части модуля мы дадим рекомендации, как грамотно оформить своё портфолио на GitHub и на какие моменты стоит обратить внимание, чтобы получить несколько дополнительных баллов в конкурсе при трудоустройстве.

## СКВОЗНОЙ ПРИМЕР ПРОЕКТА

На протяжении всего модуля мы будем работать над небольшим учебным проектом — задачей очистки данных о квартирах в Москве из модуля «PY-14. Очистка данных».

Наш проект продемонстрирует применение различных методов очистки данных на каждом из её этапов:

работа с пропусками,\
работа с выбросами,\
работа с дубликатами.\
Он будет содержать Jupyter-ноутбук с кодом, который мы использовали при изучении темы очистки, а также пояснения к нему. Также в нашем проекте будет несколько вспомогательных файлов

In [4]:
# Начальная структура проекта будет следующей (в дальнейшем она немного изменится):

DataCleaningProject
        ├─data
            └─sber_data.csv
        │
        └─images
             └─boxplot.png
             └─data_cleaning.png
             └─example_outliers.png
            └─method_sigm.png
        │
        └─outliers_lib
             └─find_outliers.py
             └─README.md
        data_cleaning.ipynb

IndentationError: unindent does not match any outer indentation level (<string>, line 11)

Где:

data — папка с исходными данными (у нас это данные о квартирах в Москве);\
images — папка с изображениями, необходимыми для проекта;\
outliers_lib — папка со вспомогательными модулями для поиска выбросов (find_outliers.py) и описание этих модулей (файл README.md);\
data_cleaning_example.ipynb — Jupyter-ноутбук, содержащий основной код проекта, в котором демонстрируются методы и подходы решения задач очистки данных.

Важное замечание. Весь код, который используется в проекте, мы изучали ранее, поэтому останавливаться на нём подробно мы не будем. Цель этого модуля — не решить новую задачу, а превратить уже решённую в пример проекта. Однако рекомендуем просмотреть ноутбук, чтобы освежить знания

## Язык разметки Markdown

✍ Начнём с краткого знакомства с языками разметки: поговорим о том, какие они бывают и для чего предназначены, а затем плавно перейдём к языку разметки, который мы будем использовать при оформлении своих репозиториев на GitHub.

***ЧТО ТАКОЕ ЯЗЫК РАЗМЕТКИ?***

Язык разметки — это специальный компьютерный язык для описания оформления и строения документа.

Представим на некоторое время, что языков разметки не существует, а перед нами как перед разработчиками стоит простая задача: в предложении

Markdown — простой язык разметки.
    
требуется сделать слово «Markdown» полужирным (Markdown).

Если мы введём какую-то управляющую конструкцию, которая в режиме чтения не будет отображаться явно, но будет преобразована в оформление, мы сможем достичь примерно такого результата:

(начало полужирного текста) Markdown (окончание полужирного текста) — простой язык разметки.
    
Однако если мы будем использовать эту конструкцию часто, то писать столько символов будет просто неудобно. Поэтому слово «начало» мы опустим, слово «окончание» заменим на один символ, например /, а «полужирного текста» заменим на одно слово strong.

(strong) Markdown (/strong) — простой язык разметки.
    
Сейчас проблема в том, что часто приходится писать круглые скобки не только для оформления текста, но и как часть предложения. Поэтому давайте заменим круглые скобки на что-то более редкое, например, на знаки < и >.

<strong> Markdown </strong> — простой язык разметки.
    
Мы описали простую конструкцию, которая может явно указать транслятору на то, что ограниченный текст является полужирным. Если у тех, кто читает этот текст в режиме просмотра, есть транслятор, который преобразует указанную разметку в оформление, то наша задача решена.

Такие управляющие конструкции, указывающие на определённое оформление текста, называются тегами.

В нашем примере записан реальный пример тега для придания тексту полужирного начертания на языке разметки гипертекста HTML.

![mdn_git_2_1.png](mdn_git_2_1.png)


Важно понимать, что разметка используется не только для изменения внешнего вида текста. Она может указывать на структуру документа, связи между фрагментами, назначение элементов и иную логику в отношении текста, изображений, аудио и других объектов. Например, язык вёрстки HTML позволяет создавать структуру сайтов, указывая переходы между страницами, расположение элементов на сайте и многое другое. В свою очередь браузер выступает в роли транслятора, который преобразует HTML-код в графическое представление веб-страницы. Вы можете самостоятельно посмотреть текстовое представление любого сайта, нажав правой кнопкой на странице и выбрав «Исходный текст страницы» — откроется малопонятный на первый взгляд HTML-документ, в котором с помощью специальных тегов и команд прописаны все инструкции по отображению сайта в окне браузера.

На самом деле практически все пользователи создают документы на каком-то из языков разметки, но не знают об этом — создание тегов берёт на себя графический интерфейс.

WYSIWYG (“What You See Is What You Get”) — свойство прикладных программ или веб-интерфейсов, в которых содержание отображается в процессе редактирования и выглядит максимально похожим на конечный результат.

![MDN_GIT_2_2_2.png](MDN_GIT_2_2_2.png)


Пример разметки с помощью WYSIWYG-расширения. В режиме редактирования кода видно, что оформление создаётся с помощью языка разметки Markdown.

Самый простой и повседневный пример WYSIWYG-сервиса — программа MS Word, которая позволяет создавать текстовые документы в графическом интерфейсе: можно задавать шрифт текста, его размер, наклон и ширину, добавлять в документы списковые конструкции, изображения, формулы и многое другое. Ещё один пример WYSIWYG-сервиса — любые конструкторы сайтов. Они позволяют создавать структуру сайтов, даже если вы не владеете HTML.

Однако практически все разработчики сталкиваются с необходимостью описания представления данных с помощью языков разметки.

Процесс создания страниц из составных элементов называется компьютерной вёрсткой. При этом могут использоваться как WYSIWYG-редакторы, так и редакторы, требующие знания языков разметки.

Если разметки очень много, как, например, при разработке сайта, может быть выделена должность отдельного специалиста — верстальщика. В его обязанности входит разметка документа по определённым требованиям.

Обратите внимание! Язык разметки — это не то же самое, что язык программирования. Языки программирования служат для обработки данных, а языки разметки — для их представления.