# План:

1) Работа с файлами и директориями

2) Работа с содержимым и pipes

3) Bash

4) Прочее

# Работа с файлами и директориями

- `.` - текущая директория
- `..` - директория на уровень выше
- `~` - домашняя директория (обычно это `/home/username`)
- `/` - корневая директория

Узнать текущую директорию можно командой `pwd`

In [1]:
!pwd

/Users/Alexander/Documents/GitHub/TechnoSphere-IDA/notebooks/06. 20.03.2018


Узнать текущего пользователя - `whoami`

In [2]:
!whoami

Alexander


Переход в другую директорию осуществляется командой `cd`

In [3]:
!mkdir example_dir
!cd example_dir
!pwd

/Users/Alexander/Documents/GitHub/TechnoSphere-IDA/notebooks/06. 20.03.2018


Команда `mkdir` создаёт директории

Посмотреть содержимое директории можно при помощи команды `ls`. Если не указать директорию, то по умолчанию будет использована текущая директория. Пример: `ls /my/awesome/dir`


Полезные опции:
- `-a` - отобразить все файлы и директории (по умолчанию не оторбажаются названия начинающиеся с точки)
- `-l` - отобразить списком
- `-h` - for humans
- `-t` - отсортировать по времени изменения
- `-s` - отсортировать по размеру файлов (размер директорий не учитывается, для этого пользуйтесь командой `du`)

Посмотреть список доступных опций можно при помощи команды `man`. Запомните команду `man`. 

In [6]:
!man ls


LS(1)                     BSD General Commands Manual                    LS(1)

NNAAMMEE
     llss -- list directory contents

SSYYNNOOPPSSIISS
     llss [--AABBCCFFGGHHLLOOPPRRSSTTUUWW@@aabbccddeeffgghhiikkllmmnnooppqqrrssttuuwwxx11] [_f_i_l_e _._._.]

DDEESSCCRRIIPPTTIIOONN
     For each operand that names a _f_i_l_e of a type other than directory, llss
     displays its name as well as any requested, associated information.  For
     each operand that names a _f_i_l_e of type directory, llss displays the names
     of files contained within that directory, as well as any requested, asso-
     ciated information.

     If no operands are given, the contents of the current directory are dis-
     played.  If more than one operand is given, non-directory operands are
     displayed first; directory and non-directory operands are sorted sepa-
     rately and in lexicographical order.

In [7]:
!du -s -h /Users/v.fedorenko/Downloads/

du: /Users/v.fedorenko/Downloads/: No such file or directory


Поиск по man можно осуществить с помощью команды `apropos`

In [8]:
!apropos "copy file"

gcp(1), cp(1)            - copy files and directories
ginstall(1), install(1)  - copy files and set attributes
git-checkout-index(1)    - Copy files from the index to the working tree
File::Copy(3pm)          - Copy files or filehandles
cp(1)                    - copy files
cpio(1)                  - copy files to and from archives


Другие полезные команды для работы с файлами и директориями. Для работы с директориями нужно указать флаг `-r`

- `cp source_file target_file` 
- `mv old_path new path` 
- `rm file_to_remove`

Если кто-то советует вам сделать `rm -rf /` - скорее всего, вас разыгрывают</h3>

<img src="https://ih0.redbubble.net/image.238376101.3327/flat,800x800,075,f.jpg">

In [9]:
!mkdir remove_me_dir
!rm remove_me_dir

rm: remove_me_dir: is a directory


In [10]:
!rm -r remove_me_dir

Сообщение `rm: remove_me_dir: is a directory` печатается в `stderr`, но об этом чуть позже.

Создать пустой файл можно командой `touch`. Если файл уже существует - то файл не будет модифицироваться

In [11]:
!touch empty_file

`echo` - печать аргумента в `stdout`. 

In [12]:
!echo "Hello, world"

Hello, world


Узнать какому исполняему файлу соответствует команда

In [13]:
!which python

/Users/Alexander/anaconda2/bin/python


### Globing

Позволяет создавать маски для имён файлов и директорий

1) `*` - любое количество произвольных символов. Пример: `head *.txt`

2) `?` - один призвольный символ. Пример: `ls 0?.txt`

3) `{aa,ab,cd,ef}` - один символ из указанной группы. Пример: `rm split_{a,b,c,d}.txt`

4) `[0-9]` - один символ из указанного диапазона. Пример: `gzip logs-2017-10-2[0-5].txt`

Посмотреть все переменные окружения можно следующей командой

In [14]:
!env

TERM_PROGRAM=iTerm.app
SHELL=/bin/zsh
TERM=xterm-color
CLICOLOR=1
TMPDIR=/var/folders/rb/8mlx2czs6wv9sbx_5726v_br0000gn/T/
Apple_PubSub_Socket_Render=/private/tmp/com.apple.launchd.s42RpPPdDH/Render
TERM_PROGRAM_VERSION=3.1.5
TERM_SESSION_ID=w0t0p0:B4B83BF4-0F92-4341-84AD-A42A01FC1F87
ZSH=/Users/Alexander/.oh-my-zsh
USER=Alexander
SSH_AUTH_SOCK=/private/tmp/com.apple.launchd.PrAVjqVNc5/Listeners
__CF_USER_TEXT_ENCODING=0x1F5:0x7:0x31
JPY_PARENT_PID=62997
PAGER=cat
LSCOLORS=Gxfxcxdxbxegedabagacad
PATH=/Users/Alexander/anaconda2/bin:/Users/Alexander/anaconda2/bin:/usr/local/bin:/usr/bin:/bin:/usr/sbin:/sbin:/Applications/MacVim.app/Contents/bin:/Library/Frameworks/Mono.framework/Versions/Current/Commands:/Library/TeX/texbin
_=/usr/bin/env
PWD=/Users/Alexander/Documents/GitHub/TechnoSphere-IDA/notebooks/06. 20.03.2018
MPLBACKEND=module://ipykernel.pylab.backend_inline
LANG=ru_RU.UTF-8
ITERM_PROFILE=Default
XPC_FLAGS=0x0
XPC_SERVICE_NAME=0
SHLVL=2
COLORFGBG=12;8
HO

Установить переменную окружения можно командой `export`. 

Например: `export JAVA_HOME=/usr/java/bin; echo $JAVA_HOME`

Так же, перемннные окружения можно задать в файле `~/.bash_profile`. После того, как вы изменили  `~/.bash_profile` необходимо его активировать `source ~/.bash_profile` или закрыть и заново открыть терминал

# Работа с содержимым и pipes

#### head & tail
Вывести начало или конец файла или потока - `head` и `tail` соответственно. Полезная опция - `-n`, задаёт сколько строк нужно вывести. По умолчанию 10.

In [15]:
!head -3 /my/awesome/file.txt

head: /my/awesome/file.txt: No such file or directory


In [16]:
!tail -3 /my/awesome/file.txt

tail: /my/awesome/file.txt: No such file or directory


In [17]:
!tail -F ./watch_me.txt

tail: ./watch_me.txt: No such file or directory


#### grep

Команда `grep` служит для фильтрации входного потока.  `grep ERROR very_important_log.txt`. Полезные опции:

- `-i` - игнорировать регистр
- `-v` - инвертированная фильтрация
- `-E` - расширенные регулярные выражения
- `-A 2` - выводить по две строчки перед совпавшим шаблоном
- `-B 4` - выводить по четыре строчки после совпавшего шаблона
- `-C 3` - контекст 3 строчки до 3 после
- `--color` - помочь глазам и подсветить совпавший шаблон
- `-m 5` - вывести первые 5 совпадений
- `-l` - вывести имена совпавших файлов

#### awk

AWK является отдельным языком программирования, про который можно сделать отдельную лекцию. Пара примеров:

`awk -F '\t' '{print $1}'` - разбить каждую строчку потока по разделителю `-F` и напечатать первое поле

`awk -F '\t' '($3==10)' {print $0}` - разбить каждую строчку потока по разделителю `-F` и напечатать исходные строки, где 3-е поле равно десяти 

`cat done.* | awk -F '\t' '{c[$2] += 1} END {d=0; for(key in c){print key, c[key]; d += c[key]}; print "TOTAL: ",d}'` 
- Заводим счётчик под каждое уникальное значение второе поле, печатаем значение и счётчик и сумму всех счётчиков

https://habrahabr.ru/company/ruvds/blog/327754/

#### split

Разбивает исходный файл на меньшие файлы с заданными параметрами. Может пригодится при параллельной обработке. Пример:

`split -a 4 -l 100 -d my_big_file.txt split_part_` - разобьёт файл my_big_file.txt на файлы по 100 строк, будет использовать 4 символа под суффикс, файлы будут называться split_part_0000, split_part_0001. Опция -d нужна для того, чтобы суффиксы формировались из чисел, по умолчанию буквы латинского алфавита

#### tr

Утилита нужна для преобразования текста во входном потоке

`tr "[:lower:]" "[:upper:]"` - заменяет все буквы нижнего регистра на соответствующие заглавные буквы 

`tr " " "\n"` - заменяет пробелы на переводы строк

#### wc 

Утилита для подсчтёта символов, слов, строк. Пример: `wc -l my_big_file.txt`

#### cut 

Утилита для вырезания полей или символов из входного потока:

`cut -d : -f 1,7 /etc/passwd` 

`who | cut -c 1-16,26-38`

#### uniq

Возвращает уникальные элементы из входного потока. Но не совсем. uniq заменяет группу подряд идущих уникальных значений на единичное значение. Предположим, у нас есть файл `uniq_test_1.txt` с содержимым `1 1 1 1 2 2 2` и `uniq_test_2.txt` c содержимым `1 1 2 2 1 1`.

`cat uniq_test_1.txt | tr " " "\n" | uniq | tr "\n" " " ` выдаст `1 2`

`cat uniq_test_2.txt | tr " " "\n" | uniq | tr "\n" " " ` выдаст `1 2 1`

Полезные опции:

`-c` - подсчитывает количество каждого элемента
`-u` - выводит только уникальные элементы
`-d` - выводит только дубликаты

#### sort

Сортирует входной поток данных. Полезные опции:

`-k1,3` - сортировать по ключу, начинающемуся с 1-ого поля и заканчивающемся на 3 поле

`-n` - воспринимать ключи числами. По умолчанию, числа будут сортироваться, как строки в лексикографическом порядке

`-r` - сортировка в обратном порядке

`-h` - сортировать по-человечески. То есть, понимать, что 3K это больше 783, а 4K меньше 3M

`-p` - сортировать в p процессов. Данная опция может отсутствовать

## Pipes.

Потоки данных можно перенаправлять через специальный символ - "|" (pipe). Тогда stdout одной команды станет stdin следующей команды. Пример: 

`cat my_file.txt | head | grep awesome_pattern | awk '{print $NF}' > result.txt`

Существуют три потока данных `0 — STDIN, 1 — STDOUT и 2 — STDERR`.  Оператор `>` перенаправляет только stdout.  Пример:

`magic_script.sh > /dev/null 2>&1` - stdout скрипта летит в `/dev/null`, stderr - в стандартный вывод

#### Useless `cat`

<img src="https://squarewheelscycling.com/uploads/monthly_2015_08/useless-cat.jpg.e67ee19e399ff56da91d778b461a3e1e.jpg">

Многие команды принимают аргументами, как файл, так и stdin. Например, 

`head file.txt`

`cat file.txt | head`. 

Второе называют антипаттерном useless cat.

# Bash

`#!/bin/bash`
Первая строка скрипта - это shebang, который сообщает системе, как исполнять этот скрипт: http://en.wikipedia.org/wiki/Shebang_(Unix) 


Простой пример hello world:

`echo Hello world!`

Отдельные команды начинаются с новой строки или разделяются точкой с запятой:

`echo 'Это первая строка'; echo 'Это вторая строка'`

Вот так объявляется переменная:

`VARIABLE="Просто строка"`


VARIABLE = "Просто строка"


Использование переменой:

`echo $VARIABLE`
`echo "$VARIABLE"`
`echo '$VARIABLE'`

Когда вы используете переменную - присваиваете, экспортируете и т.д. - пишите её имя без `$`. А для получения значения переменной используйте `$`. Заметьте, что ' (одинарные кавычки) не раскрывают переменные в них.

В bash есть полезные встроенные переменные, например

`echo "Последнее возвращенное значение: $?"`

`echo "PID скрипта: $$"`

`echo "Количество аргументов: $#"`

`echo "Аргументы скрипта: $@"`

`echo "Аргументы скрипта, распределённые по отдельным переменным: $1 $2..."`

Чтение аргументов из устройста ввода:

`echo "Как Вас зовут?"`

`read NAME # Обратите внимание, что нам не нужно определять новую переменную`

`echo Привет, $NAME!`

У нас есть обычная структура if: наберите 'man test' для получения подробной информации о форматах условия

`if [ $NAME -ne $USER ]`

`then`

`    echo "Имя не совпадает с именем пользователя"`

`else`

echo "Имя совпадает с именем пользователя"`

`fi`

Примечание: если `$Name` пустой, bash интерпретирует код как:


`if [ -ne $USER ]`

`# а это ошибочная команда`

`# поэтому такие переменные нужно использовать так:`

`if [ "$Name" -ne $USER ] ...`

`# когда $Name пустой, bash видит код как:`

`if [ "" -ne $USER ] ...`

`# что работает правильно`


Также есть условное исполнение

`echo "Исполнится всегда" || echo "Исполнится, если первая команда завершится ошибкой"`

`echo "Исполнится всегда" && echo "Исполнится, если первая команда выполнится удачно"`

Можно использовать && и || в выражениях if, когда нужно несколько пар скобок:

`if [ $NAME == "Steve" ] && [ $AGE -eq 15 ]`

`then`

`    echo "Исполнится, если $NAME равно Steve И $AGE равно 15."`

`fi`

Ещё пример

`if [ $NAME == "Daniya" ] || [ $NAME == "Zach" ]`

`then`

`echo "Исполнится, если $NAME равно Daniya ИЛИ Zach."`

`fi`


Цикл for перебирает элементы переданные в аргументе:

`# Содержимое $VARIABLE будет напечатано три раза.

`for VARIABLE in {1..3}`

`do`

`    echo "$VARIABLE"`

`done`

Или с использованием "традиционного" синтаксиса цикла for:

`for ((a=1; a <= 3; a++))`
`do`
`    echo $a`
`done`

Цикл for можно использовать для действий с файлами. Запустим команду 'cat' для файлов file1 и file2

`for VARIABLE in file1 file2`

`do`

`    cat "$VARIABLE"`

`done`

... или выводом из команд. Запустим cat для вывода из ls.

`for OUTPUT in $(ls)`

`do`

`    cat "$OUTPUT"`

`done`

Цикл while:

`while [ true ]`

`do`

`    echo "тело цикла здесь..."`

`    break`

`done`

# Other

1) Background Mode - `jupter notebook &`

2) Просмотр запущенных процессов - `ps aux`

3) vim.

4) Отправка запросов `curl "https://en.wikipedia.org/w/api.php?action=query&titles=python&prop=revisions&rvprop=content&format=json"`

5) ps - просмотр запущенных процессов

6) top/htop - мониторинг процессов



#### Архивирование

`zip archive.zip first_file.txt second_file.tsv`

`zip -r archive_with_dir.zip ./cool_dir/`

`gzip my_file.txt` - удаляет исходный файл, создаёт архив с суффиксом - `my_file.txt.gz`

`gunzip my_file.txt.gz`

`gunzip -k -c my_file.txt.gz` - `-k` говорит о том, что исходный файл удалять не надо, `-c` - выводит результат в `stdout`. Данный набор опций нужен настолько часто, что ему соответствует утилита `zcat`

Аналогичным образом работает `bzip2` и `bunzip2`. Сильнее сжимает, но требует больше процессорного времени

#### screen

Утилита создаёт "экран", который продолжает работать, когда терминал закрыт.

`screen -S screenname` - создать экран

`screen -ls` - список запущенных скринов

`screen -X -S screenname quit` - выйти из скрина

Свернуть скрин: cntrl+A, cntrl+D

Пролистать скрин: cntrl+A, Esc. Выход из режима пролистывания - Esc.

Альтернатива: **tmux**

#### scp

scp нужна для копирования файлов с/на удалённый хост:

`scp "username@hostname:dir_to_file" local_path_for_file`

`scp local_file "username@hostname:dir_to_file"`

#### ssh

Зайти на удалённый хост: 

`ssh username@host`

`ssh -N -f -L localhost:LOCAL_PORT:localhost:HOST_PORT username@hostname`


#### less 

Просмотр содержимого файла


#### xargs 

"Разворачивание stdin в набор аргументов" 


#### find

Трудно поверить, но данная утилита помогает искать файлы. Ознакомьтесь с мануалом данной команды, он может пригодиться при выполнении самостоятельного задания

##### cron

Сервис для создания периодичных задач: каждую минуту/час/день. Для заведения "задач" - `crontab -e`. Примеры:

 ``` 23 */2 * * * echo "Выполняется в 0:23, 2:23, 4:23 и т. д."
 5 4 * * sun echo "Выполняется в 4:05 в воскресенье"
 0 0 1 1 * echo "С новым годом!"
 15 10,13 * * 1,4 echo "Эта надпись выводится в понедельник и четверг в 10:15 и 13:15"
 0-59 * * * * echo "Выполняется ежеминутно"
 0-59/2 * * * * echo "Выполняется по четным минутам"
 1-59/2 * * * * echo "Выполняется по нечетным минутам"
 */5 * * * * echo "Прошло пять минут"```

In [18]:
!mkdir another_dir
!cd another_dir
!for i in {0..50000}; do touch "$i.txt"; done; rm *.txt

/bin/sh: /bin/rm: Argument list too long


In [19]:
!ls -la | tail

total 128
drwxr-xr-x   8 Alexander  staff    272 20 мар 20:51 .
drwxr-xr-x  10 Alexander  staff    340 20 мар 19:07 ..
-rw-r--r--@  1 Alexander  staff   6148 20 мар 20:51 .DS_Store
drwxr-xr-x   3 Alexander  staff    102 20 мар 19:10 .ipynb_checkpoints
drwxr-xr-x   2 Alexander  staff     68 20 мар 20:44 another_dir
-rw-r--r--@  1 Alexander  staff  56696 20 мар 20:47 bash_lecture.ipynb
-rw-r--r--   1 Alexander  staff      0 20 мар 19:15 empty_file
drwxr-xr-x   2 Alexander  staff     68 20 мар 19:10 example_dir


In [20]:
!find . -name "*.txt" | xargs rm 

<h3><a href="https://tproger.ru/news/how-to-exit-damned-vim/">Из Vim не может выйти уже более миллиона человек: статистика от Stack Overflow (24 мая 2017)</a></h3>

Недавно вопрос «Как выйти из редактора Vim?», опубликованный в 2012 году, достиг рекордного количества просмотров: 1 000 000. В честь этого события на Stack Overflow провели исследование и выложили статистику, которая иллюстрирует популярную проблему.

<img src="https://lh3.googleusercontent.com/-GNcxZZi34HE/V5YcDwlB-aI/AAAAAAAAGF0/XcpCFtLRSgsW_J6DvUGHjWi8Ezj72PMdg/w530-h696-n/f506bdc3-8270-4e2f-9e83-9c36d8450136">

<img src="http://teaching.idallen.com/cst8207/15f/notes/data/vim_exit.jpg">

<h3><a href="https://tproger.ru/translations/dont-copy-paste-from-internet-to-terminal/">Не вставляйте в консоль скопированный из Интернета код!</a></h3>

# Полезные ссылки

<a href="https://github.com/jlevy/the-art-of-command-line/blob/master/README-ru.md">Искусство командной строки</a>

<a href="http://datascienceatthecommandline.com/">Data Science at the Command Line<a/>
<img src="http://datascienceatthecommandline.com/assets/img/data-science-at-the-command-line.png">