# Курс "Компонентные модели"

## Автор: Харюк Павел, аспирант факультета ВМК МГУ имени М.В. Ломоносова
### Составлено: 2017-2018 гг.

## Проект

## Удалённая работа

Для подготовки проектов для экзамена предоставляется учётная запись на удалённом кластере с доступом по ssh. Для запуска сессии используется команда:

```bash
ssh -p 22 username@server
```

Внутри сессии занятость ресурсов и контроль за запущенными задачами можно осуществлять с помощью команд **top / htop**. Для выхода нужно нажать **q**.

Запуск задач в фоновом режиме рекомендуется осуществлять с помощью программы **tmux**:
```bash
tmux # запуск новой сессии
tmux attach -t n # открыть сессию с номером n
tmux ls # список запущенных сессий
man tmux # больше информации о программе
```



Свернуть запущенную сесссию можно комбинацией клавиш **Ctrl+B** (переход в командный режим), затем нажать **d**. Просмотр вывода в терминале: **Ctrl+b**, затем **Page Up**. Выход из командного режима: **q**.

Jupyter Notebook также можно запустить в удалённом режиме с помощью ssh тунеля:

```bash
jupyter notebook --no-browser --port=yyyy # на удалённом сервере

ssh -N -f -L localhost:xxxx:localhost:yyyy username@server # на локальном компьютере
```
**yyyy** - номер порта для запущенного ноутбука на сервере, **xxxx** - порта на локальной машине. После доступ открыт из любого браузера по адресу ***localhost:xxxx***. Параметры:
-N = не исполнять удалённые команды;
-f = фоновый режим;
-L = конфигурация портов (от *yyyy* к *xxxx*).

При первом подключении в последних версиях Jupyter сервер запросит токен (уникальную строку, предоставляющукю доступ к использованию запущенного сервера). Узнать её можно, запустив на удалённой машине команду:
```bash
jupyter notebook list
```

## Система контроля версий ***git***

Удобна для разработки проектов. Также часто используется в проектах, над которыми ведётся работа нескольких человек. Имеет возможность создавать ответвления в проектах, совмещение изменений и ответвлений, отслеживание изменений и т.д.

Для хранения проектов можно использовать сервисы ***github*** и ***bitbucket***:

http://github.com/

http://bitbucket.org/

Несколько полезных команд:

```bash
git init # создать репозиторий в текущей директории
git add filename # добавить файл с именем filename
git commit -m "Comment on commit" # сохранить изменения и ввести для них комментарий с помощью строки
git commit -a # сохранить изменения и ввести для них комментарий с помощью текстового редактора (в Ubuntu - nano)
git push # записать коммиты на сервер
git pull # получить коммиты с сервера


```

Особенность работы системы: сохранять историю измнений, для этого нужно, чтобы файл был текстовым. Бинарные файлы пересохраняются при любом изменении, что ведёт к росту размера репозитория. Поэтому рекомендуется добавлять только изменяемые файлы. Можно настроить фильтр: для этого в корневой директории репозитория необходимо создать файл ***.gitignore***, в который записать с каждой новой строки все файлы, которые следует игнорировать. Например,
если файл содержит следующие строки:

```
*~
*.pdf
```

то система гит будет игнорировать все файлы, имена которых заканчиваются на ***~*** и ***.pdf***.

Кроме того, есть возможность заставить систему ***git*** интерпретировать **.docx** файлы как текстовые, для этого необходимо произвести следующий ряд действий ( http://blog.martinfenner.org/2014/08/25/using-microsoft-word-with-git/ ):

1. установить ***pandoc***
2. добавить строчку в файле **.gitattributes** (должен находиться в корневой директории проекта, если его нет - создать вручную):
```
*.docx diff=pandoc
```
3. добавить строки в файл **.gitconfig** из домашней директории пользователя:
```
[diff "pandoc"]
    textconv=pandoc --to=markdown
    prompt = false
[alias]
    wdiff = diff --word-diff=color --unified=1
```

## Работа над проектами: внешние ресурсы

Для проекта требуется выбрать статью, результаты которой необходимо воспроизвести, а так же предложить некоторые свои изменения и дополнения. Поиск статьи предлагается вести с использованием следующих средств:

***1) Google scholar***

http://scholar.google.com

Ресурс от Google, отображает несколько версий статей (не все ресурсы позволяют свободное чтение материалов), имеет возможность искать похожие статьи, указывает статьи, которые ссылались на данную. Кроме того, имеет удобную форму экспорта цитаты в разные форматы, в т.ч. bibtex.

***2) arXiv***

https://arxiv.org/

Ресурс от Корнелльского университета, позволяет публиковать в открытом доступе препринты статей. Google Scholar индексирует и его.

***3) StackOverflow***

https://stackoverflow.com/

Данный и подобные сервисы полезны в поиске ответов на различные вопросы. Часто правильно сформулированный зпрос в Google (обычный поисковик от Google) ведёт к исчерпувающему решению типичной проблемы.

***4) Google***

http://google.com

Используйте поисковик! В интернете можно найти очень многое, главное - правильно сформулировать запрос. Часто имеет смысл искать не только на русском, но и на других языках (в частности, на английском).

## Экзаменационное задание

Необходимо выбрать статью, имеющую отношение к темам, рассматриваемым в курсе. Выбор согласуется с преподавателем. Статью необходимо прочитать, выделить основные моменты, подготовить по ним презентацию. 

Вероятнее всего, что в процессе работы над этим заданием придётся привлекать внешние ресурсы - для этих целей пользуйтесь ресурсами из списка выше (но не обязательно ими ограничиваться).

Если в статье представлен новый алгоритм, необхлжимо его реализовать и попробовать воспроизвести часть результтов, приведённой в статье. Можно взять уже готовые реализации алгоритмов, однако тогда потребуется более объёмное воспроизведение результатов. 

Идеально, если удастся предложить какое-то своё дополнение, в простом случае - применение к другим данным/задаче.