# Добро пожаловать в модуль, посвящённый созданию проектов на *GitHub*!

✍ Ранее мы уже познакомились с таким инструментом версионирования кода, как Git, и веб-сервисом, основанном на нём, — GitHub. В этом модуле мы продолжим изучать эту тему: научимся работать с языком разметки Markdown, поговорим о том, как оформлять свои проекты с его помощью, об основных командах системы Git и о том, как производить версионирование своего кода.

Заранее отметим, что данный модуль является бонусным и содержит дополнительные материалы, то есть от его прохождения не зависит ни ваш прогресс, ни дальнейшее обучение на курсе. Вы вполне можете вернуться к нему в удобное вам время, однако мы рекомендуем ознакомиться с ним, и вот почему:


- Темы, которые раскрываются в этом модуле, важны для любого разработчика, желающего создать собственное портфолио и повысить свой профессионализм.

- Инструменты, которые мы рассмотрим, могут встретиться вам в вашей профессиональной деятельности: например, с языком *Markdown* вы встретитесь при оформлении ноутбуков, а *Git* и *GitHub* — это негласный стандарт хранения и версионирования кода проектов.

## Для чего нужно портфолио?

Чаще всего от кандидата на позицию Data Scientist ожидают определённого уровня технических знаний. Специалистам уровня *Junior* особенно непросто: как правило, опыта разработки проектов и прохождения технических интервью у них не хватает или нет совсем. Код кандидата, написанный до интервью, может стать конкурентным преимуществом.

- Во-первых, работодатель сразу сможет оценить уровень вашего кода и сложность выполненных проектов. То есть вы заранее демонстрируете свои так называемые *hard skills*.

- Во-вторых, хорошо оформленный аккаунт на GitHub с несколькими репозиториями позволит вам показать работодателю свой профессионализм, обучаемость, ответственность, а также владение навыком презентации своих проектов. Всё это лежит в области *soft skills*, которые сегодня не менее важны, чем *hard skills*.

Правильное оформление профиля и двух-трёх наиболее показательных репозиториев на *GitHub* поможет обойти конкурентов. Когда по итогам цикла собеседований остаётся несколько равноценных кандидатов, каждый бит информации может оказаться решающим, в том числе и проекты на *GitHub*.

Модуль состоит из трёх частей:

- Язык разметки *Markdown*.
В первой части вы познакомитесь с языками разметки и узнаете, зачем они нужны, а также изучите основы синтаксиса языка Markdown.

- Система контроля версий *Git*.
Во второй части мы повторим системы управления версиями и подробнее разберёмся с их самым популярным представителем — *Git*. Мы обсудим основные концепции версионирования кода, поговорим об основных командах *Git*, которые должен знать каждый разработчик, изучим ветвление в Git и методологии управления ветвлением в проектах.

- Оформление портфолио.
В заключительной части модуля мы дадим рекомендации, как грамотно оформить своё портфолио на *GitHub* и на какие моменты стоит обратить внимание, чтобы получить несколько дополнительных баллов в конкурсе при трудоустройстве.

`Примечание`. Если вы считаете, что уже достаточно хорошо знакомы с оформлением разметки *Markdown* и грамотно управляетесь с системой *Git*, то можете сразу переходить к третьей части модуля (юнит «Рекомендации к составлению портфолио на GitHub»).

`Внимание!` Для полноценной работы нам понадобятся все инструменты, с которыми мы знакомились в модуле «PYTHON-8. Инструменты для Data Science», поэтому если вы не прошли данный модуль, настоятельно рекомендуем это сделать, установив все необходимые инструменты.

## Сквозной пример проекта

На протяжении всего модуля мы будем работать над небольшим учебным проектом — задачей очистки данных о квартирах в Москве из модуля «PY-14. Очистка данных».

Наш проект продемонстрирует применение различных методов очистки данных на каждом из её этапов:

- работа с пропусками,
- работа с выбросами,
- работа с дубликатами.

Он будет содержать Jupyter-ноутбук с кодом, который мы использовали при изучении темы очистки, а также пояснения к нему. Также в нашем проекте будет несколько вспомогательных файлов, о которых мы расскажем ниже.

![image.png](attachment:image.png)

Где:

- ``data`` — папка с исходными данными (у нас это данные о квартирах в Москве);
- ``images`` — папка с изображениями, необходимыми для проекта;
- ``outliers_lib`` — папка со вспомогательными модулями для поиска выбросов (find_outliers.py) и описание этих модулей (файл README.md);
- ``data_cleaning_example.ipynb`` — Jupyter-ноутбук, содержащий основной код проекта, в котором демонстрируются методы и подходы решения задач очистки данных.

Важное замечание. Весь код, который используется в проекте, мы изучали ранее, поэтому останавливаться на нём подробно мы не будем. Цель этого модуля — не решить новую задачу, а превратить уже решённую в пример проекта. Однако рекомендуем просмотреть ноутбук, чтобы освежить знания.

## Разметка

✍ Начнём с краткого знакомства с языками разметки: поговорим о том, какие они бывают и для чего предназначены, а затем плавно перейдём к языку разметки, который мы будем использовать при оформлении своих репозиториев на GitHub.

![image.png](attachment:image.png)

Важно понимать, что разметка используется не только для изменения внешнего вида текста. Она может указывать на структуру документа, связи между фрагментами, назначение элементов и иную логику в отношении текста, изображений, аудио и других объектов. Например, язык вёрстки HTML позволяет создавать структуру сайтов, указывая переходы между страницами, расположение элементов на сайте и многое другое. В свою очередь браузер выступает в роли транслятора, который преобразует HTML-код в графическое представление веб-страницы. Вы можете самостоятельно посмотреть текстовое представление любого сайта, нажав правой кнопкой на странице и выбрав «Исходный текст страницы» — откроется малопонятный на первый взгляд HTML-документ, в котором с помощью специальных тегов и команд прописаны все инструкции по отображению сайта в окне браузера.

На самом деле практически все пользователи создают документы на каком-то из языков разметки, но не знают об этом — создание тегов берёт на себя графический интерфейс.

![image.png](attachment:image.png)

Самый простой и повседневный пример WYSIWYG-сервиса — программа MS Word, которая позволяет создавать текстовые документы в графическом интерфейсе: можно задавать шрифт текста, его размер, наклон и ширину, добавлять в документы списковые конструкции, изображения, формулы и многое другое. Ещё один пример WYSIWYG-сервиса — любые конструкторы сайтов. Они позволяют создавать структуру сайтов, даже если вы не владеете HTML.

Однако практически все разработчики сталкиваются с необходимостью описания представления данных с помощью языков разметки.

Процесс создания страниц из составных элементов называется компьютерной вёрсткой. При этом могут использоваться как WYSIWYG-редакторы, так и редакторы, требующие знания языков разметки.

Если разметки очень много, как, например, при разработке сайта, может быть выделена должность отдельного специалиста — верстальщика. В его обязанности входит разметка документа по определённым требованиям.

Обратите внимание! Язык разметки — это не то же самое, что язык программирования. Языки программирования служат для обработки данных, а языки разметки — для их представления.

Примечание. Для любознательных мы собрали список самых используемых на сегодняшний день языков разметки.

## Язык разметки MARKDOWN

![image.png](attachment:image.png)

Мы используем этот язык при работе с текстовыми ячейками в Jupyter-ноутбуках. Для этого при создании новой ячейки мы можем выбрать Markdown, в новой ячейке на языке разметки написать нужный нам текст, затем выполнить ячейку как обычную ячейку с кодом и получить результат.

![image.png](attachment:image.png)

## Редакторы MARKDOWN

![image.png](attachment:image.png)