# OS

In [3]:
import os 

В библиотеке `tempfile` есть ф-ция `gettempdir()`. Она возвращает путь до папки **temp**, где хранятся временные файлы.

In [2]:
import tempfile
storage_path = os.path.join(tempfile.gettempdir(), 'my_file.json')

`os.path.exists(path)` - проверяет существует ли файл по данному пути.

In [4]:
# Проверяет существует ли файл по данному пути
os.path.exists(storage_path)

True

# argparse
Модуль для обработки аргументов переданных из командной строки.     
Источник: [habr: "Изучаем Python: модуль argparse"](https://habr.com/ru/company/ruvds/blog/440654/)

```python
import argparse 

parser = argparse.ArgumentParser(description='Videos to images')
parser.add_argument('indir', `type=str`, help='Input dir for videos')
parser.add_argument('outdir', type=str, help='Output dir for image')

args = parser.parse_args()
```
- `type = str` - ожидается, что в консоль будет передан строковый формат.
- `help = " "` - это информация, которая будет выведена при запросе `--help` или `-h`.

Здесь, в начале файла, импортируется модуль `argparse`. Затем, с использованием конструкции `argparse.ArgumentParser()`, создаётся объект `parser` с указанием его описания. Далее, с помощью метода `parser.add_argument()`, описывается переменная `indir`, в которую планируется записать путь к папке с видеофайлами. При этом указывается то, что она имеет строковой тип, а также задаётся справочная информация о ней. После этого, точно так же, создаётся переменная `outdir`, в которую попадёт путь к папке, в которую скрипт должен будет поместить изображения, созданные на основе видеофайлов. На следующем шаге работы в переменную args попадает результат разбора аргументов командной строки. То, что передано скрипту при запуске, теперь будет доступно в виде свойств `indir` и `outdir` объекта `args`. Теперь с этими значениями можно работать. В данном случае мы просто выводим в консоль то, что передано скрипту в аргументе `indir`.


Вот как запустить этот скрипт из командной строки:       
```
python videos.py /videos /images
```
Обратите внимание на то, что строки /videos и /images не нужно заключать в кавычки.

## Позиционные аргументы (обязательные)

Конструкция вида `parser.add_argument('indir', type=str, help='Input dir for videos')` из скрипта *videos.py* предназначена для создания позиционного аргумента (**positional argument**). При вызове скрипта важен порядок указания таких аргументов. Так, первый аргумент, переданный скрипту, становится первым позиционным аргументом, второй аргумент — вторым позиционным аргументом.    

Чтобы запустить скрипт, в котором предусмотрено использование позиционных аргументов, такие аргументы всегда нужно указывать при его запуске, иначе будет ошибка.

## Необязательные аргументы

Необязательные аргументы создают так же, как и позиционные. Основная разница между командами их создания заключается в том, что при указании имён таких аргументов эти имена начинаются с последовательности символов `--`, или, для кратких форм аргументов, с символа `-`. Например, необязательный аргумент можно создать так:

```python
parser.add_argument('-m', '--my_optional',
    type=int,
    default=2,
    help='provide an integer (default: 2)')
```

- Тут `--my_optional` это полное имя аргумента, а `-m` сокращенное. 
- `default = 2` - дефолтное значение, если аргумент не будет указан.

Необязательным аргументам можно назначать значения, которые они будут иметь по умолчанию. В нашем случае, если при вызове скрипта аргументу *my_example* не будет задано никакого значения, в него будет записано число 2, которое и будет выведено в консоль. Для того чтобы задать значение этого аргумента во время запуска скрипта можно воспользоваться такой конструкцией:    

`python my_example.py  --my_optional=3` 

# csv
Модуль для обработки CSV, TSV, etc - табличных данных.     
Источник: [Python для сетевых инженеров](https://pyneng.readthedocs.io/ru/latest/book/17_serialization/csv.html)

**CSV (comma-separated value)** - это формат представления табличных данных (например, это могут быть данные из таблицы или данные из БД). В этом формате каждая строка файла - это строка таблицы. Несмотря на название формата, разделителем может быть не только запятая.    

И хотя у форматов с другим разделителем может быть и собственное название, например, **TSV (tab separated values)**, тем не менее, под форматом CSV понимают, как правило, любые разделители.    

In [1]:
import csv

In [22]:
with open(r"./staff/Chapter7/Chapter7_csv_test_data1.csv") as f:
    print(f.read())

with open(r"./staff/Chapter7/Chapter7_csv_test_data1.csv") as csv_file:
    reader = csv.reader(csv_file)
    print(type(reader))
    for row in reader:
        print(row, len(row))

first name, last name, module1, module2
Vasya, Shystriy, 420, 90
Peter, Klesh', 111, 90.2
<class '_csv.reader'>
['first name', ' last name', ' module1', ' module2'] 4
['Vasya', ' Shystriy', ' 420', ' 90'] 4
['Peter', " Klesh'", ' 111', ' 90.2'] 4


`reader` - это объект генератор, т.е. он прочитывается только один раз.    

Чаще всего заголовки столбцов удобней получить отдельным объектом. Т.к. объект reader - это генератор, то для этого можно воспользоваться ф-цией `next()`. Например: 

In [24]:
with open(r"./staff/Chapter7/Chapter7_csv_test_data1.csv") as csv_file:
    reader = csv.reader(csv_file)
    headers = next(reader)
    print("Headers: {} {}".format(headers, len(headers)))
    for row in reader:
        print("Data: {} {}".format(row, len(row)))

Headers: ['first name', ' last name', ' module1', ' module2'] 4
Data: ['Vasya', ' Shystriy', ' 420', ' 90'] 4
Data: ['Peter', " Klesh'", ' 111', ' 90.2'] 4


Иногда полученный CSV объект удобно форматровать в список, т.е. 2D array:

In [28]:
with open(r"./staff/Chapter7/Chapter7_csv_test_data1.csv") as csv_file:
    reader = list(csv.reader(csv_file))
    print(reader)

[['first name', ' last name', ' module1', ' module2'], ['Vasya', ' Shystriy', ' 420', ' 90'], ['Peter', " Klesh'", ' 111', ' 90.2']]


## Другие разделители
Регулируются с помощью параметра `delimiter = ""`.

In [26]:
with open(r"./staff/Chapter7/Chapter7_csv_test_data2") as f:
    print(f.read())


with open(r"./staff/Chapter7/Chapter7_csv_test_data2") as csv_file:
    reader = csv.reader(csv_file, delimiter = ";")
    for row in reader:
        print(row, len(row))

first name; last name; module1; module2
Vasya; Shystriy; 420; 90
Peter; Klesh'; 111; 90.2
['first name', ' last name', ' module1', ' module2'] 4
['Vasya', ' Shystriy', ' 420', ' 90'] 4
['Peter', " Klesh'", ' 111', ' 90.2'] 4


## Чтение строк содержащих специальные знаки

Иногда запятая не разделяет данные, а является частью строки. В этом случаии, строка (один элемент таблицы) включатеся в кавычки. Кавычки указывают на то, что именно является целой строкой. Когда запятая находится в кавычках, модуль csv не воспринимает её как разделитель.    

Также перенос строки воспринимается как новый ряд, если строка не включена в кавычки. Если  жестрока находится в кавычках, то можно переносить строку внутри одного элемента.

In [27]:
# файл в котором нет пробелов после разделяющей запятой
with open(r"./staff/Chapter7/Chapter7_csv_test_data3.csv") as f:
    print(f.read())

with open(r"./staff/Chapter7/Chapter7_csv_test_data3.csv") as csv_file:
    reader = csv.reader(csv_file, quotechar='"')
    for row in reader:
        print(row, len(row))

first name,last name,module1,module2,description
Vasya,Shystriy,"420.2",90,Good loot
Peter,Klesh',111,90.2,"Very very
wild scav"
['first name', 'last name', 'module1', 'module2', 'description'] 5
['Vasya', 'Shystriy', '420.2', '90', 'Good loot'] 5
['Peter', "Klesh'", '111', '90.2', 'Very very\nwild scav'] 5


Параметр `skipinitialspace = True` убирает пробелы, если данные разделены через запятую и пробел (`data1, data2`). 

In [28]:
# файл в котором есть пробел после разделяющей запятой
with open(r"./staff/Chapter7/Chapter7_csv_test_data4.csv") as f:
    print(f.read())

with open(r"./staff/Chapter7/Chapter7_csv_test_data4.csv") as csv_file:
    reader = csv.reader(csv_file, quotechar='"', skipinitialspace = True)
    for row in reader:
        print(row, len(row))

first name, last name, module1, module2, description
Vasya, Shystriy, "420.2", 90, Good loot
Peter, Klesh', 111, 90.2, "Very very
wild scav"
['first name', 'last name', 'module1', 'module2', 'description'] 5
['Vasya', 'Shystriy', '420.2', '90', 'Good loot'] 5
['Peter', "Klesh'", '111', '90.2', 'Very very\nwild scav'] 5


## Запись в csv файл

Запись в файл осуществляется через объект `csv.writer(file)`. Один список - это один ряд в файле. Можно сразу записать 2D список.    
- Параметр `quoting = ...` указывает надо ли включать элементы в двойные кавычки. 
    - `quoting = QUOTE_NONNUMERIC` - все строковые элементы вкючены в кавычки.
    - `quoting=csv.QUOTE_NONE` - удаляет все кавычки. Требует параметр `escapechar = ''`.

In [16]:
data = [['hostname', 'vendor', 'model', 'location'],
        ['sw1', 'Cisco', 3750, 'London, Best str'],
        ['sw2', 'Cisco', 3850, 'Liverpool, Better str'],
        ['sw3', 'Cisco', 3650, 'Liverpool, Better str'],
        ['sw4', 'Cisco', 3650, 'London, Best str']]


with open(r'./staff/Chapter7/sace_test_data1.csv', 'w') as f:
    writer = csv.writer(f, quoting=csv.QUOTE_NONNUMERIC)
    for row in data:
        writer.writerow(row)

with open(r'./staff/Chapter7/sace_test_data1.csv') as f:
    print(f.read())

"hostname","vendor","model","location"

"sw1","Cisco",3750,"London, Best str"

"sw2","Cisco",3850,"Liverpool, Better str"

"sw3","Cisco",3650,"Liverpool, Better str"

"sw4","Cisco",3650,"London, Best str"




Можно записать файл целикос с помощью метода `writer.writerows()`:

In [29]:
data = [['hostname', 'vendor', 'model', 'location'],
        ['sw1', 'Cisco', '3750', 'London, Best str'],
        ['sw2', 'Cisco', '3850', 'Liverpool, Better str'],
        ['sw3', 'Cisco', '3650', 'Liverpool, Better str'],
        ['sw4', 'Cisco', '3650', 'London, Best str']]


with open(r'./staff/Chapter7/save_test_data1.csv', 'w') as f:
    writer = csv.writer(f, quoting=csv.QUOTE_NONNUMERIC)
    writer.writerows(data)

with open(r'./staff/Chapter7/save_test_data1.csv') as f:
    print(f.read())

"hostname","vendor","model","location"

"sw1","Cisco","3750","London, Best str"

"sw2","Cisco","3850","Liverpool, Better str"

"sw3","Cisco","3650","Liverpool, Better str"

"sw4","Cisco","3650","London, Best str"




## DictReader

А иногда удобней получить словари, в которых ключи - это названия столбцов, а значения - значения столбцов. Для этого в модуле есть `DictReader`. Он возвращает `csv.DictReader object`, где каждый ряд - это `OrderedDict` (до версии python 3.6) и обычный `dict` (после версии python 3.8) с заголовками в качестве ключей. Например:

In [27]:
with open(r"./staff/Chapter7/Chapter7_csv_test_data1.csv") as csv_file:
    reader = csv.DictReader(csv_file)
    for row in reader:
        print (row)
        for key, value in row.items():
            print("{}: {}".format(key, value))

OrderedDict([('first name', 'Vasya'), (' last name', ' Shystriy'), (' module1', ' 420'), (' module2', ' 90')])
first name: Vasya
 last name:  Shystriy
 module1:  420
 module2:  90
OrderedDict([('first name', 'Peter'), (' last name', " Klesh'"), (' module1', ' 111'), (' module2', ' 90.2')])
first name: Peter
 last name:  Klesh'
 module1:  111
 module2:  90.2


## DictWriter

С помощью `DictWriter` можно записать словари в формат CSV. В целом DictWriter работает так же, как writer, но так как словари не упорядочены, надо указывать явно в каком порядке будут идти столбцы в файле.    
1. Для этого используется параметр `fieldnames`. Надо указать какая строка содержит названия столбцов. 
2. `writer.writeheader()` сообщает объекту `writer` названия столбцов. 

In [33]:
data = [{
    'hostname': 'sw1',
    'location': 'London',
    'model': 3750,
    'vendor': 'Cisco'
}, {
    'hostname': 'sw2',
    'location': 'Liverpool',
    'model': 3850,
    'vendor': 'Cisco'
}, {
    'hostname': 'sw3',
    'location': 'Liverpool',
    'model': 3650,
    'vendor': 'Cisco'
}, {
    'hostname': 'sw4',
    'location': 'London',
    'model': 3650,
    'vendor': 'Cisco'
}]

with open(r'./staff/Chapter7/save_test_data2.csv', 'w') as f:
    writer = csv.DictWriter(
        f, fieldnames=list(data[0].keys()), quoting=csv.QUOTE_NONNUMERIC)
    writer.writeheader()
    for d in data:
        writer.writerow(d)

with open(r'./staff/Chapter7/save_test_data2.csv') as f:
    print(f.read())

"hostname","location","model","vendor"

"sw1","London",3750,"Cisco"

"sw2","Liverpool",3850,"Cisco"

"sw3","Liverpool",3650,"Cisco"

"sw4","London",3650,"Cisco"




# json
Модуль для обработки json файлов.   
Источник: [Python для инженеров](https://pyneng.readthedocs.io/ru/latest/book/17_serialization/json.html)

## Что такое json

**JSON** (англ. **JavaScript Object Notation**) — текстовый формат обмена данными, основанный на JavaScript. Как и многие другие текстовые форматы, JSON легко читается людьми. Используется большим кол-вом API; это главный web формат.

**json types**     
- strings: `"abc", "a", "123"`,  etc 
- numbers: `1, 2123, 2.34`, etc
- bool: `true` or `false` (с маленькой буквы)
- null: `null` (аналог None)
- arryas: `["asd", "a", 1]` (то же самое, что список)
- objects: `{"key": "value", "age" : 33}` (то же самое, что словарь)

**Структура json**    
Обычно файл состоит из классов - т.е. отдельных objects, внутри которых могут быть любые поля из json types (включая object). Поля разделены запятыми. Если в файле несколько классов, то их включают в array.    

Например, внутри `people_test_data1.json`
```json
[
    {
        "firstName": "Jane",
        "hobbies": ["running", "sky diving", "singing"],
        "age": 35,
        "education": true
        "children": [
            {
                "firstName": "Alice",
                "age": 6
            },
            {
                "firstName": "Bob",
                "age": 8
            }
        ]
    },

    {
        "firstName": "Kirk",
        "hobbies": null,
        "age": 14,
        "education": false
        "children": null
    }
]
```

## Работа с JSON в Python 

In [34]:
import json

Для чтения в модуле json есть два метода:     
- `json.load` - метод считывает файл в формате JSON и возвращает объекты Python
- `json.loads` - метод считывает строку в формате JSON и возвращает объекты Python

In [62]:
with open(r'./staff/Chapter7/people_test_data1.json') as f:
    templates = json.load(f)
    print("{} -> {}\n".format(templates, type(templates)))
    
for i, ex in enumerate(templates):
    print("{}: \n{} -> {}\n".format(i, ex, type(ex)))

[{'firstName': 'Jane', 'hobbies': ['running', 'sky diving', 'singing'], 'age': 35, 'education': True, 'children': [{'firstName': 'Alice', 'age': 6}, {'firstName': 'Bob', 'age': 8}]}, {'firstName': 'Kirk', 'hobbies': None, 'age': 14, 'education': False, 'children': None}] -> <class 'list'>

0: 
{'firstName': 'Jane', 'hobbies': ['running', 'sky diving', 'singing'], 'age': 35, 'education': True, 'children': [{'firstName': 'Alice', 'age': 6}, {'firstName': 'Bob', 'age': 8}]} -> <class 'dict'>

1: 
{'firstName': 'Kirk', 'hobbies': None, 'age': 14, 'education': False, 'children': None} -> <class 'dict'>



Т.к. все json types имеют прямые питоновские аналоги. Поэтому при считыванни json файлов, питон напрямую преобразует файл в питоновские структуры (так как человек их прочитал бы в json файле). Различия json формата от питона:     


| JSON                                          | Python                                    |
|-----------------------------------------------|-------------------------------------------|
| null                                          | None                                      |
| true/false                                    | True/False                                |
| Ключи json object -  только строковые объекты | Ключи словарей -  любые неизменяемые типы |

In [90]:
with open(r'./staff/Chapter7/people_test_data1.json') as f:
    file_content = f.read() # считываем все в одну строку
    templates = json.loads(file_content) # преобразуем json строку в питоновский формат

print(templates)

[{'firstName': 'Jane', 'hobbies': ['running', 'sky diving', 'singing'], 'age': 35, 'education': True, 'children': [{'firstName': 'Alice', 'age': 6}, {'firstName': 'Bob', 'age': 8}]}, {'firstName': 'Kirk', 'hobbies': None, 'age': 14, 'education': False, 'children': None}]


### Записть в формате JSON

Для записи информации в формате JSON в модуле json также два метода:    

- `json.dump` - метод записывает объект Python в файл в формате JSON.
- `json.dumps` - метод возвращает строку в формате JSON.

Параметры методов:
- `indent = 4` - размер отступов при записи в json файл/строку.
- `sort_keys = True` - сортировка данных в json object по имени ключей.


**`json.dump`** - записывает объект Python в файл в формате JSON.

In [81]:
student1 = {
    "firstName": "Rick",
    "age": 24,
    "education": True,
    "courses" : {
        "math": 4,
        "English": 5
    }
}
student2 = {
    "firstName": "Alex",
    "age": 23,
    "education": True,
    "courses" : {
        "math": 2,
        "English": 1
    }
}

    
data = [student1, student2]
with open(r"./staff/Chapter7/save_test_data1.json", "w") as f:
    json.dump(data, f, indent = 4, sort_keys = True)
    
with open(r"./staff/Chapter7/save_test_data1.json") as f:
    print(f.read())

[
    {
        "age": 24,
        "courses": {
            "English": 5,
            "math": 4
        },
        "education": true,
        "firstName": "Rick"
    },
    {
        "age": 23,
        "courses": {
            "English": 1,
            "math": 2
        },
        "education": true,
        "firstName": "Alex"
    }
]


**`json.dumps`** - метод возвращает строку в формате JSON.

In [80]:
student3 = {
    "firstName": "Dane",
    "age": 20,
    "education": False,
    "courses" : None
}
# преобразует данные в json строку
student_json_str = json.dumps(student3, indent = 4, sort_keys = True)
print(student_json_str, "\n--------------\n")

with open(r"./staff/Chapter7/save_test_data2.json", "w") as f:
    f.write(student_json_str)
    
with open(r"./staff/Chapter7/save_test_data2.json") as f:
    print(f.read())

{
    "age": 20,
    "courses": null,
    "education": false,
    "firstName": "Dane"
} 
--------------

{
    "age": 20,
    "courses": null,
    "education": false,
    "firstName": "Dane"
}
