# Упражнение 1. Объединение файлов

Напишите скрипт <font color=green>unite.py</font>, который объединяет несколько текстовых файлов в один файл. Первым аргументом скрипта должно быть им выходного файла, а далее должны следовать имена входных файлов в том порядке, в котором их следует объединить.

#### Примеры использования скрипта

```bash
python3 unite.py output_file.txt f1.txt f2.txt f3.txt
python3 unite.py output_file.txt *  # объединить все файлы в текущей директории.
```

Если у Вас Windows и программа не запускается из cmd.exe во втором варианте (со звездочкой), исполльзуйте powershell.

In [1]:
import sys
import os


def file_unition(output_name, *args):
    out = open(output_name, 'w+')
    for input_file in args:  # Сейчас это - список с элементами вида 'fn.txt'
        for name in input_file:
            if name == '*':  # Если на входе была подана *
                txtlist = [txt_file for txt_file in os.listdir() if txt_file[-4:] == '.txt']
                for name in txtlist:
                    inp = open(name, 'r')
                    for text in inp:
                        out.write(text)
                    inp.close()
            else:
                inp = open(name, 'r')
                for text in inp:
                    out.write(text)
                inp.close()
            out.write('\n')
    out.close()


file_unition(sys.argv[1], sys.argv[2:])

# Упражнение 2. Перемещение файла

Напишите скрипт <font color=green>move.py</font>, который будет перемещать (переименовывать) файл.

#### Примеры использования скрипта

```bash
python3 move.py old_file_name new_file_name
```

Если у Вас Windows и программа не запускается из cmd.exe во втором варианте (со звездочкой), исполльзуйте powershell.

In [None]:
import sys
import os


def move(old_file_name, new_file_name):
    os.rename(old_file_name, new_file_name)


move(sys.argv[1], sys.argv[2])

# Упражнение 3. Среднее и дисперсия

Напишите скрипт <font color=green>moments.py</font> который будет вычислять среднее и несмещенную оценку дисперсии выборки, содержащейся в первом файле, и записывать их во второй файл. 

#### Примеры использования скрипта

```bash
python3 moments.py data.txt moments.txt
```

Данные в файле с данными и в файле результами разделяются симовлом "новая строка" `'\n'`.

Если у Вас Windows и программа не запускается из cmd.exe во втором варианте (со звездочкой), исполльзуйте powershell.

In [None]:
import sys

def moments(L):
    first_sum = 0
    second_sum = 0
    for i in L:
        first_sum += int(i)
    first_moment = first_sum/len(L)  # Математическое ожидание
    for i in L:
        second_sum += (int(i) - first_moment)
    second_moment = (1/len(L)) * second_sum  # Выборочная дисперсия
    return first_moment, second_moment

input_name, output_name = sys.argv[1], sys.argv[2]
with open(input_name, 'r') as input_file:
    data = input_file.read().split('\n')

e_moment, d_moment = moments(data)

with open(output_name, 'w') as output_file:
    output_file.write(str(e_moment) + '\n' + str(d_moment))

# <font color=green>Стандартные потоки</font>

При запуске терминала `bash` или `powershell` автоматически создаются 3 файловых дескриптора `stdin`, `stdout`, `stderr`. Эти файловые дексрипторы изначально не связаны с какими-либо файлами в файловой системе. Они используются программами, запускаемыми в консоли, для ввода текста с клавиатуры и вывода информации в эту консоль. Это происходит так: при запуске приложение получает в свое распоряжение перечисленные файловые дескрипторы. `stdin`, `stdout`, `stderr` называют стандартными потоками ввода-вывода (std происходит от standard).  

1. `stdin` - поток, который используется для считывания информации из консоли. Например, у Вас есть скрипт <font color=green>name.py</font> с кодом
```python
print("What is your name?")
name = input()
```
который запускается из консоли командой
```bash
python3 name.py
```
Когда интерпретатор доберется до инструкции
```python
name=input()
```
он предложит пользователю записать строку в поток ввода `stdin`.

2. `stdout` - поток, который используется программой для вывода результатов своей работы. В примере со скриптом <font color=green>name.py</font> выполнение инструкции `print("What is your name?")` привело к тому, что в `stdout` была записана строка `"What is your name?"`. Если поток `stdout` направлен в консоль, то текст отобразиться в ней. О том, как настраивать потоки будет сказано ниже. 

3. `stderr` - стандартный вывод ошибок и нужен для вывода в консоль сообщений об ошибках. Он работает также, как и `stdout`, но является отдельным потоком.

В `python` стандартные потоки доступны в модуле `sys` под именами `sys.stdin`, `sys.stdout`, `sys.stderr`. Технически они являются **обыкновенными файловыми объектами**.

### Пример 1. Использование стандартных потоков в Python

In [15]:
import sys
sys.stdout.write("Hello stdout")
sys.stderr.write("Hello stderr")
sys.stdin.write("Hello stdin")  # Ошибка, так как sys.stdin открыт на чтение

Hello stdout

Hello stderr

UnsupportedOperation: not writable

В последней строке мы получаем ошибку, так как `sys.stdin` открыт для чтения.
Сравните с результатом выполнения следующего кода.

In [17]:
f = open("test_write.txt", 'w')
f.close()
with open("test_write.txt", 'r') as f:
    f.write('try_write')

UnsupportedOperation: not writable

Попробуем считать данные из потоков.

In [18]:
import sys
s = sys.stdin.read()
print("s = '{}'".format(s))
s = sys.stdout.read()  # Ошибка, так как объект открыт для записи.

s = ''


UnsupportedOperation: read

Видно, что поток `stdin` пустой, а поток `stdout` не поддерживает чтение из него.

***

Для печати в `stderr` удобно использовать встроенную функцию `print()`.

In [19]:
import sys
print("Warning! This is the first time I am printing into stderr.", file=sys.stderr)



***

## <font color=blue>Управление потоками ввода-вывода</font>

По умолчанию все три потока "смотрят" в консоль, но инструменты `bash` и `powershell` позволяют перенаправлять потоки в файлы и в другие программы. Так можно можно обрабатывать данные с помощью пайплайнов из разнородных частей. 

Потоки ввода-вывода доступны в `bash` и `powershell` под идентификаторами  0, 1, 2 (`stdin`, `stdout` и `stderr` соответственно).

1. **Перенаправление вывода с помощью команд `'>'` и `'>>'`.**<br>
Запись `[n]>file_name` означает, что теперь файловый дескриптор под номером `n` указывает в файл `file_name`. Номер `n` можно не указывать (поэтому он взят в квадратные скобки). Если `n` не указан, то будет перенаправлен стандартный вывод `stdout`. Попробуйте
```bash
echo "test stdout redirection" >out  # echo предназначена для демонстрации текста
```
В результате будет создан файл <font color=green>out</font> и в нем окажется соответсвующий текст. Вывести содержимое файла можно с помощью
```bash
cat out  # cat объединяет несолько файлов и показывает то, что получилось
```
В отдельный файл можно на править сообщения об ошибках.
```bash
echo "raise EOFError" >eoferror.py  # создаем скрипт, который будет поднимать исключение о конце файла
python3 eoferror.py                 
python3 eoferror.py 2>errors        # теперь перенаправляем ошибки в файл errors
cat errors
```
Также можно полностью избавиться от сообщений об ошибках.
```bash
python3 eoferror.py 2>/dev/null  # /dev/null специальное устройство, которое выбрасывает то, что поступает на вход
```
**Важно!** команда `'>'` удаляет исходное содержимое файла, в который осуществляется запись. Если требуется дописать результат в конец файла, пользуйтесь `'>>'`.

- **Перенаправление ввода с помощью команды `'<'`.**<br>
Запись `<file_name` означает, что вместо того, чтобы считывать входные данные из консоли, программа будет их брать из файла `file_name`. Привести яркий пример использования такой конструкции с известными утилит UNIX сложно, поэтому мы сами создадим программу для демонстрации перенаправления потока ввода.
```bash
echo "print(int(input())**2)" >sqr.py  # скрипт для возведения целого числа в квадрат
python3 sqr.py                         # протестируйте программу
echo 10 >sqr_input_data                # помещаем входные данные для программы в файл
python3 sqr.py <sqr_input_data         # Передаем скрипту данные из файла
```

- **Туннель (pipe) `'|'`.**<br>
Наиболее популярный инструмент для управления потоками ввода-вывода. В конструкции 
```bash
command1 | command2
```
`'|'` соединяет `stdout` первой комманды с `stdin` второй команды.<br><br>
**Примеры:**
 ```bash
 ls -l | head --lines=3  # Утилита head возвращает начало файла, который подан ей на вход. В данном случае - первые 3 строки результата работы 'ls -l'
 ```
Другой пример - сортировка поступающих на вход строк.
```bash
echo $'Егор\nВасилий\nАнна' >names.txt
cat names.txt | sort
```

- **Копирование (дуплицирование) потока с помощью команды n1>&n2.**<br>
С помощью `n1>&n2` файловый дескриптор `n1` делается копией файлового дескриптора `n2`. Копирование потока можно использовать, если требуется одновременно показать результат работы программы в консоли и записать в файл. Само разделение потока производиться с помощью команды [`tee`](https://en.wikipedia.org/wiki/Tee_(command)), однако чтобы ошибки также попали в логи, надо объединить `stderr` с `stdout`.
```bash
python3 my_experiment.py 2>&1 | tee log.txt
```
В результате логи выполняемых вычислений будут не только показаны на экране, но и записаны в файл `log.txt`.<br><br>
Другой пример - фильтрация результатов поиска файлов утилитой `find`. При поиске файлов от корневого каталога в Linux Ubuntu пользователь может получать много сообщений об ошибках типа "Отказано в доступе". Чтобы исключить строки с сообщениями об ошибке, нужно отобрать строки, которые не содержат текст "Permission denied". Утилита `grep` предназначена для поиска текста в файлах, но с ключом `-v` можно наоборот отобрать те строки, которые не содержат "Permission denied".
```bash
find / -name my_template 2>&1 | grep -v "Permission denied"
```

### Замечание 1

В инструкциях `bash` и  `powershell` можно  использовать несколько команд для настройки потоков. Они выполняются слева направо **до** того, как запускается основная программа.<br>
**Примеры:**
```bash
echo "print(\"Hello, I am eoferror.py\");raise EOFError" >eoferror.py
python3 eoferror.py >out 2>errors
cat out
cat errors
```
Чуть более сложный пример. И `stdout` и `stderr` отбрасываются.
```bash
echo "print(\"Hello, I am eoferror.py\");raise EOFError" >eoferror.py
python3 eoferror.py >/dev/null 2>&1  # сначала stdout направляется на нулевое устройство, а затем stderr копируется с stdout и тем самым тоже направляется на нулевое устройство
```

### Замечание 2
Перенаправление сбрасывается после выполнения команды, и все потоки снова указывают на консоль.
 
### Упражнение 5. Печать в stderr

Используя модуль [platform](https://docs.python.org/3/library/platform.html), запишите в файл <font color=green>system.txt</font> название операционной системы и в следующей строке ее версию (`platform.system()` и `platform.release()`). Если файл <font color=green>system.txt</font>, программа должна печатать в stderr строку "WARNING: file system.txt already exists and will be overwritten" и создавать новый файл вместо старого.

### Упражнение 6. Пайплайн

Напишите 3 скрипта: <font color=green>choose_digits.py</font>, <font color=green>choose_odd.py</font>, <font color=green>sqr.py</font>. Первый и второй должны, пока на вход не поступит пустая строка, проверять соответсвенно (1)состоит ли строка из одних только цифр (`str.isdigit()`) и (2)является ли строка нечетным числом. Если строка прошла проверку, она должна печататься в `stdout`. Скрипт <font color=green>sqr.py</font> должен возводить поступившие на числа в квадрат и сразу печатать их в `stdout`.

Считайте во входных данных нет целых чисел с ведущими нулями. В скрипте <font color=green>choose_odd.py</font> проверке на то, что в строку входят только цифры не должна выполняться.

Скрипты должны корректно работать в пайплайне.
```bash
python3 choose_digits.py | python3 choose_odd.py | python3 sqr.py
```
Для этого необходимо, чтобы первые 2 скрипта перед завершением печатали пустые строки.


### Упражнение 7. Чтение из файла и запись в файл

Подготовьте входной файл <font color=green>input.txt</font> для пайплайна из упражнения 6 и составьте такую команду для консоли, чтобы чтение строк производилось из файла <font color=green>input.txt</font>, а запись результатов работы осуществлялась в файл <font color=green>output.txt</font>.