# Стандартная библиотека

Структура занятия:

1) csv

2) json

3) пикл

4) xml

5) datetime

6) math

7) random

8) hashlib

9) base64


## csv

CSV (от англ. Comma-Separated Values — значения, разделённые запятыми) — текстовый формат, предназначенный для представления табличных данных. Строка таблицы соответствует строке текста, которая содержит одно или несколько полей, разделенных запятыми. 

В Python работа с CSV-файлами поддерживается стандартным модулем csv, предоставляющем следующие основные объекты и функции:
- `csv.reader(csvfile, dialect='excel', **fmtparams)` - создает и возвращает объект для чтения строк
- `csv.writer(csvfile, dialect='excel', **fmtparams)` - создает и возвращает объект для записи строк
- `class csv.DictReader(csvfile, fieldnames=None, restkey=None, restval=None, dialect='excel', *args, **kwds)` - создает и возвращает объект для чтения данных в словари
- `class csv.DictWriter(csvfile, fieldnames, restval='', extrasaction='raise', dialect='excel', *args, **kwds)` - создает и возвращает объект для записи данных из словарей

In [None]:
import csv

with open('names.csv', 'w', newline='') as csvfile:
    fieldnames = ['first_name', 'last_name']
    writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

    writer.writeheader()
    writer.writerow({'first_name': 'Baked', 'last_name': 'Beans'})
    writer.writerow({'first_name': 'Lovely', 'last_name': 'Spam'})
    writer.writerow({'first_name': 'Wonderful', 'last_name': 'Spam'})

In [None]:
with open('names.csv', newline='') as csvfile:

    reader = csv.DictReader(csvfile)

    for row in reader:

        print(row)

In [None]:
with open('names.csv', newline='') as csvfile:

    reader = csv.reader(csvfile)

    for row in reader:

        print(row)

## json

По сути, формат json является стандартом текстовой сериализации объектов.

Удобный, легковесный, человекочитаемый. 

JSON-текст представляет собой одну из двух структур:
- набор пар ключ: значение (словарь в терминологии Python), где ключ - строка, значение - любой тип;
- упорядоченный набор значений (список в терминологии Python).

Значением может быть:
- строка (в двойных кавычках);
- число;
- логическое значение (true/false);
- null;
- одна из структур.

Пример: 
```json
{
    "Модель": "ChinaPhone11",
    "Цена": {
        "Новый": 1999.9,
        "Б/у": 800,
        "На запчасти": 200
    },
    "Цвет": ["Красный", "Золотой"],
    "Комментарий": null,
    "Топ-бренд": true
}
```

JSON-формат поддерживается стандартным пакетом json, предоставляющем следующие основные функции:
- `json.dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True, allow_nan=True, cls=None, indent=None, separators=None, default=None, sort_keys=False, **kw)`
- `json.loads(s, encoding=None, cls=None, object_hook=None, parse_float=None, parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)`



In [None]:
import json

d = {
    "Модель": "ChinaPhone",
    "Цена": {
        "Новый": 1999.9,
        "Б/у": 800,
        "На запчасти": 200
    },
    "Цвет": ["Красный", "Золотой"],
    "Комментарий": None,
    "Топ-бренд": True,
    "Популярность": float('inf')
}

j = json.dumps(d, indent=2, ensure_ascii=False)  # indent + print сделают вывод json красивым
print(j)

In [None]:
d = json.loads(j)
d

## пикл

Стандартный модуль pickle, при помощи которого можно сохранять практически любой объект Python в двоичном формате (файле), а затем извлекать его обратно

Основные функции модуля:
- `pickle.dump(obj, file, protocol=None, *, fix_imports=True)` - сериализация или пиклинг
- `pickle.load(file, *, fix_imports=True, encoding='ASCII', errors='strict')` - десериализация или анпиклинг

Pickle является основным способом сериализации объектов для python, является инструментом по-умолчанию для передачи данных между процессами python (при использовании многопроцессорности)

Следующие типы могут быть сериализованы с помощью pickle:

    None, True, False;
    int, float, complex;
    str, bytes, bytearrays;
    tuple, list, set, dict (если содержат только сериализуемые объекты);
    functions (встроенные и пользовательские), определённые на верхнем уровне модуля;
    class, определённые на верхнем уровне модуля;
    инстансы таких классов, результат вызова __getstate__() которых сериализуем.


Минусы формата pickle:
- специфичен для Python;
- небезопасен.


In [None]:
import pickle
from dataclasses import dataclass

@dataclass
class User:
    name: str
    role: str
        
def plus(a, b):
    return a + b

data = {
    'a': [1, 2.0, 3+4j],
    'b': ("character string", b"byte string"),
    'c': {None, True, False},
    'd': User,
    'e': User('A', 'B'),
    'f': plus,
}

with open('data.pickle', 'wb') as f:
    pickle.dump(data, f, pickle.HIGHEST_PROTOCOL)

In [None]:
data

## xml

XML (от англ. eXtensible Markup Language) — «расширяемый язык разметки». Рекомендован Консорциумом Всемирной паутины (W3C). Спецификация XML описывает XML-документы. XML разрабатывался как язык с простым формальным синтаксисом, удобный для создания и обработки документов как программами, так и человеком, с акцентом на использование в Интернете. Язык называется расширяемым, поскольку он не фиксирует разметку, используемую в документах

Пример:
```xml
<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE recipe>
<recipe name="хлеб" preptime="5min" cooktime="180min">
   <title>
      Простой хлеб
   </title>
   <composition>
      <ingredient amount="3" unit="стакан">Мука</ingredient>
      <ingredient amount="0.25" unit="грамм">Дрожжи</ingredient>
      <ingredient amount="1.5" unit="стакан">Тёплая вода</ingredient>
   </composition>
   <instructions>
     <step>
        Смешать все ингредиенты и тщательно замесить. 
     </step>
     <step>
        Закрыть тканью и оставить на один час в тёплом помещении. 
     </step>
     <!-- 
        <step>
           Почитать вчерашнюю газету. 
        </step>
         - это сомнительный шаг...
      -->
     <step>
        Замесить ещё раз, положить на противень и поставить в духовку.
     </step>
   </instructions>
</recipe>
```

In [None]:
import xml.etree.ElementTree as ET
tree = ET.parse('bread_data.xml')
root = tree.getroot()

In [None]:
for i in root.iter('ingredient'):
    print(i.attrib, i.text)

In [None]:
for i in root.find('instructions').findall('step'):
    print(i.text.strip())

Также есть поддержка XPath

In [None]:
for i in root.findall('.//ingredient'):
    print(i.text)

## datetime 

https://docs.python.org/3/library/datetime.html

Модуль для работы с временем и датой

Основные объекты:
- `class datetime.date`
- `class datetime.time`
- `class datetime.datetime` - класс-композиция date и time
- `class datetime.timedelta` - класс для работы с разницами во времени

In [None]:
import datetime

now = datetime.datetime.now()
now

In [None]:
td = datetime.timedelta(
    days=4,
    seconds=2,
    microseconds=2,
    milliseconds=2,
    minutes=2,
    hours=2,
    weeks=1
)
now - td

In [None]:
now + td

In [None]:
datetime.datetime.today(), datetime.datetime.now()

In [None]:
datetime.datetime.now().isoformat()

In [None]:
datetime.date.today().isoformat()

In [None]:
dt = datetime.time(hour=12, minute=34, second=56, microsecond=0)
dt.isoformat()

## math 

https://docs.python.org/3/library/math.html

Модуль для простых математических вычислений

Содержит набор функций для числовых вычислений

In [None]:
import math

val = 10.2
math.floor(val)  # округление вниз

In [None]:
math.ceil(val)  # округление вверх

In [None]:
math.gcd(10, 200, 1000)  # наименьший общий делитель

In [None]:
math.gcd(10, 201, 1000)

Работа с логарифмами


In [None]:
math.exp(val)

In [None]:
math.log(10000, 10)

In [None]:
math.log2(1024)

Тригонометрические функции

In [None]:
math.acos(0.2)  # аргумент в радианах

In [None]:
math.cos(2)  # аргумент в радианах

In [None]:
math.radians(90)

Константы

In [None]:
math.e

In [None]:
math.pi

In [None]:
math.inf, float('inf')

In [None]:
math.nan

## random 

https://docs.python.org/3/library/random.html

Модуль для псевдо-случайных выборок с различными распределениями

В основе работы генератора псевдо-случайных чисел (ГПСЧ) лежит алгоритм под названием [Вихрь Мерсенна](https://ru.wikipedia.org/wiki/%D0%92%D0%B8%D1%85%D1%80%D1%8C_%D0%9C%D0%B5%D1%80%D1%81%D0%B5%D0%BD%D0%BD%D0%B0) 

Функции, которые позволяют зафиксировать состояние генератора ПСЧ
- `random.seed(a=None, version=2)` - инициализирует и фиксирует ГПСЧ значением `a`, если `a` пусто или `None` - текущем временем
- `random.getstate()` - возвращает текущее состояние ГПСЧ
- `random.setstate(state)` - задаёт текущее состояние ГПСЧ

In [None]:
import random
random.seed(1)  # инициализирует и фиксирует ГПСЧ значением 1 (фиксация нужна для повторимости, например в тестах)

In [None]:
random.getstate()

In [None]:
random.random()

Целочисленные функции
- `random.randrange(stop)` - вернёт cлучайное число до `stop`
- `random.randrange(start, stop[, step])`
- `random.randint(a, b)` - псевдоним randrange(a, b+1)

In [None]:
random.randrange(2, 10)

In [None]:
random.randint(2, 10)

Функции для работы с последовательностями
- `random.choice(seq)` - вернёт 1 cлучайный элемент из `seq`
- `random.choices(population, weights=None, *, cum_weights=None, k=1)`
- `random.shuffle(x)` - на месте перемешивает последовательность `x`

In [None]:
seq = [12, 17, 19, 300, 425]
random.choice(seq)

In [None]:
random.choices(seq, [1, 10, 1, 1, 1], k=2)

In [None]:
random.shuffle(seq)
seq

## hashlib 

https://docs.python.org/3/library/hashlib.html

Модуль для работы с некоторыми криптографическими хеш-функциями

In [None]:
import hashlib

hashlib.algorithms_available  # все возможные функции

In [None]:
h = hashlib.new('sha512')
h.update(b'password')

h.hexdigest()

In [None]:
h.digest()

In [None]:
h.update(b' salt')

In [None]:
h.hexdigest()

In [None]:
h = hashlib.new('sha512')
h.update(b'password salt')
h.hexdigest()

## base64 

https://docs.python.org/3/library/base64.html

Модуль для работы с форматами [base64](https://ru.wikipedia.org/wiki/Base64), base32, base16

Для справки: base64 используется для представления двоичных файлов, осуществляет преобразование двоичных данных в строку

In [None]:
import base64

base64.b64encode(b'password')

In [None]:
base64.b64encode('пароль'.encode())

In [None]:
bytes_deb64 = base64.b64decode(b'0L/QsNGA0L7Qu9GM')
bytes_deb64

In [None]:
bytes_deb64.decode()

In [None]:
image = 'iVBORw0KGgoAAAANSUhEUgAAAAUAAAAFCAYAAACNbyblAAAAHElEQVQI12P4//8/w38GIAXDIBKE0DHxgljNBAAO9TXL0Y4OHwAAAABJRU5ErkJggg=='
bytes_deb64 = base64.b64decode(image)
bytes_deb64

In [None]:
from IPython import display  # дополнительные функции jupyter
display.HTML(f'<img src="data:image/png;base64,{image}" />')