# Семинар 5. Словари, функции, файлы

1. Словарь

    1.1. Что такое словарь?
    
    1.2. Операции со словарем
    
        1.2.1. Операторы
        
        1.2.2. Индексирование
        
        1.2.3. Методы

2. Функции

    2.1. Что такое функция? Объявление функции.
    
    2.2. Аргументы функции, вызов функции
    
    2.3. Документирование функции
    
    2.4. Произвольное число аргументов
    
    2.5. Лямбда-функции
    
    2.6. Сортировка при помощи лямбда-функций


3. Файлы

    3.1. Что такое файл? Текстовые и бинарные файлы
    
    3.2. Функция `open`. Режимы доступа к файлу
    
    3.3. Методы файлового потока
    
    3.4. Менеджер контекста `with ... as`
    
    3.5. Модуль `pickle`. Сохранение и загрузка объектов `Python`
        

## Словарь `dict`

Словарь - это изменяемая последовательность пар ключ-значение, организованный для быстрого доступа по ключу.

Ключи должны быть константами, значения могут быть любыми объектами.

Синтаксис: 

- `{ключ1:значение1, ключ2:значение2, ...}`


- `dict(ключ1 = значение1, ключ2 = значение2, ...)`


- `dict([(ключ1, значение1), (ключ2, значение2), ...])`



In [1]:
# создание словаря, 1 вариант
{'key':1, 2:'value', (5,6):[i**2 for i in range(5)]}

{'key': 1, 2: 'value', (5, 6): [0, 1, 4, 9, 16]}

In [2]:
# создание словаря, 2 вариант
# ключами могут быть только синтаксически корректные имена
dict(x = 5, y = 6, z = 7, s = 'string')

{'x': 5, 'y': 6, 'z': 7, 's': 'string'}

In [3]:
# создание словаря, 3 вариант
# словарь как в 1 варианте
dict((('key',1), 
      (2,'value'), 
      ((5,6),[i**2 for i in range(5)])
     ))

{'key': 1, 2: 'value', (5, 6): [0, 1, 4, 9, 16]}

## Операторы

`in, not in` - содержит/не содержит ключ


In [4]:
d = {'a':1, 'b':2, 'c':3}

In [5]:
# оператор in осуществляет поиск совпадающего ключа
'a' in d

True

In [6]:
'd' not in d

True

## Индексирование

Получение значения по ключу.

Синтаксис: `d[key]`

In [7]:
d['a']

1

In [9]:
d['d']

KeyError: 'd'

In [11]:
# добавить пару ключ:значение
d['f'] = 5
d

{'a': 1, 'b': 2, 'c': 3, 'f': 5}

## Методы

`d.get(key, default)` – получить значение по ключу `key`; если такого ключа нет, вернуть `default`

`d.items()` – получить список кортежей (ключ, значение)

`d.keys()` – получить список ключей

`d.values()` – получить список значений

`d.update(d2)` – обновить словарь, используя другой словарь

`d.pop(key, default)` – достать пару (key, value) из словаря; если такого ключа нет, вернуть `default`

In [2]:
[x for x in dir(dict) if not x.startswith('__')]

['clear',
 'copy',
 'fromkeys',
 'get',
 'items',
 'keys',
 'pop',
 'popitem',
 'setdefault',
 'update',
 'values']

In [1]:
# два словаря
pos = {'x':1.0, 'y':0.0, 'z':0.5}
vel = {'vx':0.0, 'vy':0.2, 'vz':0.1}

In [2]:
# получить значение по ключу
pos['x'], pos.get('x')

(1.0, 1.0)

In [3]:
# значение по-умолчанию позволит избежать None
pos.get('w'), pos.get('w', 0.3)

(None, 0.3)

In [54]:
list(pos.keys())

['x', 'y', 'z']

In [55]:
# получить все ключи
for k, v in pos.items():
    print(k, v)

x 1.0
y 0.0
z 0.5


In [11]:
# получить все значения
pos.values()

dict_values([1.0, 0.0, 0.5])

In [10]:
# получить все пары ключ-значение
pos.items()

dict_items([('x', 1.0), ('y', 0.0), ('z', 0.5)])

In [18]:
# обновить словарь другим словарем (ключи различны)
pos.update(vel)
pos

{'x': 1.0, 'y': 0.0, 'z': 0.5, 'vx': 0.0, 'vy': 0.2, 'vz': 0.1}

In [19]:
# обновить другим словарем с таким же ключом
pos.update({'y':0.2})
pos

{'x': 1.0, 'y': 0.2, 'z': 0.5, 'vx': 0.0, 'vy': 0.2, 'vz': 0.1}

In [20]:
# достать элемент из словаря
pos.pop('x'), pos

(1.0, {'y': 0.2, 'z': 0.5, 'vx': 0.0, 'vy': 0.2, 'vz': 0.1})

In [21]:
pos.pop('x')

KeyError: 'x'

In [22]:
pos.pop('x', 0.0)

0.0

## Задание


Вывести на экран 10 наиболее часто встречающихся слов в любой из глав рассказа [Маленький принц](http://www.lib.ru/EKZUPERY/mprinc.txt):
- Составить словарь {'слово':кол-во в тексте}
- Преобразовать в список [(‘слово’:кол-во в тексте)]
- Поменять местами элементы в кортежах и отсортировать список
- Взять 10 первых (последних) элементов


## Функции

Функция - это часть кода программы, которая выполняется только по вызову. Функция получает информацию извне через аргументы и может возвращать результат.

Синтаксис объявления функции:

```
def имя_функции(арг1, арг2, ..., им_арг1=знач1, им_арг2=знач2, ...):
    инструкция1
    инструкция2
    ...
    return объект
```

`арг1, арг2, ...` - позиционные аргументы

`им_арг1, им_арг2, ...` - именованные аргументы


Синтаксис вызова функции:

`имя_функции(знач1, знач2, ..., им_арг1=знач3, им_арг2=знач4, ...)`

Примечания:

- все позиционные аргументы располагаются перед именованными

- вместо именованных аргументов можно передавать позиционные и наоборот*


*о четком разграничении между позиционными и именованными аргументами в Python 3.8 см. https://docs.python.org/3/whatsnew/3.8.html

## Примеры

In [65]:
# объявление функции без аргументов
def func():
    print('Hello, World!')

In [67]:
# вызов функции без аргументов
func()

Hello, World!


In [68]:
# объявление функции с позиционными аргументами
def poly2(x, a, b, c):
    return a+b*x+c*x*x

In [71]:
# вызов функции с позиционными аргументами
poly2(1, 2, -3, 2)

1

In [72]:
# объявление функции с позиционными и именованными аргументами
def poly2kw(x, a=2, b=-3, c=2):
    return a+b*x+c*x*x

In [73]:
# вызов функции с позиционными и именованными аргументами
# достаточно указать только позиционные аргументы
poly2kw(1)

1

In [74]:
# именованные аргументы можно указывать в любом порядке (но после позиционных)
poly2kw(1, b=4, a=3)

9

In [47]:
# вместо именованных аргументов можно передавать позиционные
# здесь переданы значения аргументов a, b (согласно порядку в объявлении функции)
poly2kw(1, 3, 4)

9

In [75]:
# вместо позиционных можно передавать именованные
poly2kw(x=1, a=3, b=4)

9

In [76]:
# пример рекурсивной функции
def fact(n):
    if n > 1:
        return n * fact(n - 1)
    return 1

In [77]:
fact(5)

120

## Документирование функции `docstring`

Синтаксис: `в начале тела функции объявить строку`

Пример - функция solve из [numpy.linalg](https://github.com/numpy/numpy/blob/master/numpy/linalg/linalg.py)

```
def solve(a, b):
    """
    Solve a linear matrix equation, or system of linear scalar equations.

    Computes the "exact" solution, `x`, of the well-determined, i.e., full
    rank, linear matrix equation `ax = b`.

    Parameters
    ----------
    a : (..., M, M) array_like
        Coefficient matrix.
    b : {(..., M,), (..., M, K)}, array_like
        Ordinate or "dependent variable" values.

    Returns
    -------
    x : {(..., M,), (..., M, K)} ndarray
        Solution to the system a x = b.  Returned shape is identical to `b`.

    Raises
    ------
    LinAlgError
        If `a` is singular or not square.

    See Also
    --------
    scipy.linalg.solve : Similar function in SciPy.

    Notes
    -----

    .. versionadded:: 1.8.0

    Broadcasting rules apply, see the `numpy.linalg` documentation for
    details.

    The solutions are computed using LAPACK routine ``_gesv``.

    `a` must be square and of full-rank, i.e., all rows (or, equivalently,
    columns) must be linearly independent; if either is not true, use
    `lstsq` for the least-squares best "solution" of the
    system/equation.

    References
    ----------
    .. [1] G. Strang, *Linear Algebra and Its Applications*, 2nd Ed., Orlando,
           FL, Academic Press, Inc., 1980, pg. 22.

    Examples
    --------
    Solve the system of equations ``3 * x0 + x1 = 9`` and ``x0 + 2 * x1 = 8``:

    >>> a = np.array([[3,1], [1,2]])
    >>> b = np.array([9,8])
    >>> x = np.linalg.solve(a, b)
    >>> x
    array([2.,  3.])

    Check that the solution is correct:

    >>> np.allclose(np.dot(a, x), b)
    True

    """
```

In [38]:
from numpy.linalg import solve
# Shift+Tab на следующей строке
#solve()

In [85]:
from math import sqrt
 
def check(a):
    """
    Check if given number is prime.
 
    Parameters
    ----------
    a : given number.
 
    Returns
    -------
    x : True if the nubber is prime
        False if it is not
    """

    d = 2
    while d <= sqrt(a):
        if (a % d) == 0:
            return (False)
        else:
            d += 1
    return True
 

for i in range (1, 16):
    print (i, "->", check(i))

1 -> True
2 -> True
3 -> True
4 -> False
5 -> True
6 -> False
7 -> True
8 -> False
9 -> False
10 -> False
11 -> True
12 -> False
13 -> True
14 -> False
15 -> False


In [78]:
# простой пример
def add(a, b):
    '''
    Вычисляет сумму аргументов c = a + b
    
    Parameters
    ----------
    
    a: число, строка, список
        Первый аргумент
        
    b: число, строка, список
        Второй аргумент
        
    Returns
    -------
    c : тип соответствует типам a и b
        Сумма аргументов: a + b
    
    '''
    return a + b

In [79]:
# посмотреть документацию Shift+Tab
add(1, 2)

3

## Задание

Написать функцию, которая возвращает `True`, если аргумент является простым числом и `False` в противном случае. Задокументировать функцию при помощи `docstring`.

## Произвольное число аргументов

Синтаксис объявления:

```
def имя_функции(*кортеж_арг, **словарь_именарг):
	инструкция1
	инструкция2
	…
	return возвращаемый_объект
```

Синтаксис вызова:

- стандартный:
```имя_функции(знач1, знач2, …, именарг1=знач3, именарг2=знач4, …)```

- с распаковкой:
```имя_функции(*кортеж_значений, **словарь_имен_и_значений)```


In [86]:
# только позиционные аргументы
def func(*args):
    print('Кортеж аргументов:', args)

In [87]:
# стандартный вызов
func(1, 2, 3, 4, 5, 'arg', 'fff', [])

Кортеж аргументов: (1, 2, 3, 4, 5, 'arg', 'fff', [])


In [88]:
# вызов с распаковкой
tpl = ('a', 'b', 'c')
func(*tpl)

Кортеж аргументов: ('a', 'b', 'c')


In [75]:
# только именованные аргументы
def func_kw(**kwargs):
    print('Словарь аргументов:', kwargs)

In [76]:
# стандартный вызов
func_kw(x = 1, y = 2, z = 3)

Словарь аргументов: {'x': 1, 'y': 2, 'z': 3}


In [77]:
# вызов с распаковкой
d = {'x':1, 'y':2, 'z':3}
func_kw(**d)

Словарь аргументов: {'x': 1, 'y': 2, 'z': 3}


## Задание

Написать функцию norm, позволяющую рассчитывать различные нормы в векторных пространствах произвольной размерности.
Позиционные аргументы задают координаты вектора. Именованный аргумент `kind` задает тип нормы:
- 1 - $L_1$, манхэттенское расстояние
- 2 - $L_2$, евклидова норма
- 3 - $L_\infty$, максимум модулей координат

## Лямбда-функции

Лямбда-функция - это короткая безымянная функция.

Синтаксис объявления лямбда-функции: `lambda арг1, арг2, ...: выражение`

Возвращаемое значение - результат вычисления `выражения`.


In [77]:
dist = lambda x, y: (x**2 + y**2)**0.5

dist(1, 1)

1.4142135623730951

In [79]:
lst = [(15-3*i, i**2, 'абвгде'[i*2%6]) for i in range(5)]
lst

[(15, 0, 'а'), (12, 1, 'в'), (9, 4, 'д'), (6, 9, 'а'), (3, 16, 'в')]

In [80]:
get0 = lambda x : x[0]
get2 = lambda x : x[2]

[get0(x)*get2(x) for x in lst]

['ааааааааааааааа', 'вввввввввввв', 'ддддддддд', 'аааааа', 'ввв']

In [7]:
# сортировка списка
lst.sort() # изменяет список
lst

[(3, 16, 'в'), (6, 9, 'а'), (9, 4, 'д'), (12, 1, 'в'), (15, 0, 'а')]

In [8]:
# сортировка с использованием функции
lst.sort(key=get0)
lst

[(3, 16, 'в'), (6, 9, 'а'), (9, 4, 'д'), (12, 1, 'в'), (15, 0, 'а')]

In [9]:
lst.sort(key=get2)
lst

[(6, 9, 'а'), (15, 0, 'а'), (3, 16, 'в'), (12, 1, 'в'), (9, 4, 'д')]

In [12]:
from math import sin, cos

# лямбда-функцию можно создавать сразу там, где она требуется
lst.sort(key=lambda x: cos(x[0]) + sin(x[1]), reverse=True)
lst

[(12, 1, 'в'), (6, 9, 'а'), (15, 0, 'а'), (3, 16, 'в'), (9, 4, 'д')]

In [14]:
(*map(lambda x: cos(x[0]) + sin(x[1]), lst),)

(1.6853249435403885,
 1.3722887718921226,
 -0.7596879128588213,
 -1.2778958132655107,
 -1.667932757192605)

## Задание

Дан список:
```
[(14, 0.48, 'iczjypun'),
 (13, 0.06, 'leonbpu'),
 (7, 0.0, 'inflo'),
 (1, 0.58, 'tukw'),
 (15, 0.94, 'hepgtz'),
 (4, 0.35, 'rfwzdtu'),
 (16, 0.28, 'vukow'),
 (19, 0.94, 'uxf'),
 (10, 0.88, 'kjydu'),
 (6, 0.61, 'uishdymr'),
 (5, 0.55, 'amxylfrw'),
 (11, 0.11, 'fanw'),
 (1, 0.02, 'yerpnsfhw'),
 (4, 0.18, 'xdoaq'),
 (15, 0.06, 'hpzey')]
```

Отсортировать его по следующим условиям:
- по синусу второго элемента, по-возрастанию
- сумме второго и косинуса первого элемента, по-убыванию
- по сумме синуса первого элемента и косинуса длины строки, по-возрастанию

## Файлы

Файл - это именованная область памяти на носителе информации.

Файлы разделяют на текстовые, с которыми может непосредственно работать человек, и бинарные (двоичные).

Имя файла обычно имеет расширение, которое связано с типом файла, например:

- `*.txt, *.json, *.py, *.h, *.cpp, *.csv, ...` - текстовые файлы
- `*.bin, *.png, *.mp4, *.exe, *.mp3, *.pdf, ...` - бинарные файлы

Каждый бинарный файл имеет определенную структуру и считывается/записывается предназначенной для этого файла программой.

## Функция `open`

Позволяет открыть файл для чтения/записи и создать файловый поток.

Синтаксис: `f = open(file, mode, ...)`

- `f` - файловый поток
- `file` - путь к файлу
- `mode` - режим доступа к файлу


## Режимы доступа к файлу

Режим доступа `mode` указывается в виде строки из одного или нескольких символов:

- `r` – чтение из файла (*read*)
- `w` – запись в файл (*write*)
- `x` – создать новый файл и открыть на запись
- `a` – дозапись в конец файла (*append*)
- `+` – открыть файл для обновления (чтения и записи)
- `b` – бинарный режим (*binary*)
- `t` – текстовый режим (*text*)

Режимы можно комбинировать:

- `rt` - текстовый файл в режиме чтения
- `wb` - бинарный файл в режиме записи

## Методы файлового потока

- `f.read()` – прочитать файл целиком и вернуть строку или буфер
- `f.readline()` – прочитать строку из файла
- `f.readlines()` – прочитать все строки из файла и вернуть список строк
- `f.write(text/buffer)` – записать текст или содержимое буфера
- `f.writelines()` – записать список строк в файл
- `f.close()` – закрыть файловый поток


In [50]:
# открыть файл в текстовом режиме для записи и записать в него строку
f = open('notes.txt', 'wt')
f.write('''Методы файлового потока
f.read() – прочитать файл целиком и вернуть строку или буфер
f.readline() – прочитать строку из файла
f.readlines() – прочитать все строки из файла и вернуть список строк
f.write(text/buffer) – записать текст или содержимое буфера
f.writelines() – записать список строк в файл
f.close() – закрыть файловый поток
''')
f.close()

In [51]:
# открыть файл в текстовом режиме для чтения, прочитать содержимое и вывести на экран
f = open('notes.txt', 'rt')
print(f.read())
f.close()

Методы файлового потока
f.read() – прочитать файл целиком и вернуть строку или буфер
f.readline() – прочитать строку из файла
f.readlines() – прочитать все строки из файла и вернуть список строк
f.write(text/buffer) – записать текст или содержимое буфера
f.writelines() – записать список строк в файл
f.close() – закрыть файловый поток



In [54]:
# запустить терминальное приложение, выводящее содержимое файла в стандартный поток
# для linux - приложение cat
!type notes.txt

Методы файлового потока
f.read() – прочитать файл целиком и вернуть строку или буфер
f.readline() – прочитать строку из файла
f.readlines() – прочитать все строки из файла и вернуть список строк
f.write(text/buffer) – записать текст или содержимое буфера
f.writelines() – записать список строк в файл
f.close() – закрыть файловый поток


## Менеджер контекста `with ... as`

Менеджер контекста позволяет работать в определенном контексте.
При работе с файлам - это контекст открытого файла. Выход из контекста означает автоматическое закрытие файла.

Синтаксис: 
```
with open('notes.txt', 'rt') as f:
    text = f.read()
```

После выхода из блока `with` файл `f` будет автоматически закрыт.

In [57]:
text = '''Менеджер контекста позволяет работать в определенном контексте. 
При работе с файлам - это контекст открытого файла.
Выход из контекста означает автоматическое закрытие файла.'''

with open('notes2.txt', 'wt') as f:
    f.write(text)

In [58]:
with open('notes2.txt', 'rt') as f:
    print(f.read())

Менеджер контекста позволяет работать в определенном контексте. 
При работе с файлам - это контекст открытого файла.
Выход из контекста означает автоматическое закрытие файла.


In [59]:
!type notes2.txt

Менеджер контекста позволяет работать в определенном контексте. 
При работе с файлам - это контекст открытого файла.
Выход из контекста означает автоматическое закрытие файла.


## Модуль `pickle`

`pickle` позволяет сохранять и загружать практически любые объекты Python в **бинарные** файлы.

Основные методы:

- `dump(obj, file, ...)` - сохранить объект в файловый поток
- `obj = load(file, ...)` - загрузить объект из файлового потока


In [60]:
import pickle

In [61]:
lst = [(14, 0.48, 'iczjypun'),
 (13, 0.06, 'leonbpu'),
 (7, 0.0, 'inflo'),
 (1, 0.58, 'tukw'),
 (15, 0.94, 'hepgtz'),
 (4, 0.35, 'rfwzdtu'),
 (16, 0.28, 'vukow'),
 (19, 0.94, 'uxf'),
 (10, 0.88, 'kjydu'),
 (6, 0.61, 'uishdymr'),
 (5, 0.55, 'amxylfrw'),
 (11, 0.11, 'fanw'),
 (1, 0.02, 'yerpnsfhw'),
 (4, 0.18, 'xdoaq'),
 (15, 0.06, 'hpzey')]

In [62]:
# сохранить список в бинарный файл
with open('binary.pkl', 'wb') as f:
    pickle.dump(lst, f)

In [63]:
!type binary.pkl

Ђ•N      ]”(KG?ЮёQл…ёЊiczjypun”‡”K
G?®ёQл…ёЊleonbpu”‡”KG        Њinflo”‡”KG?вЏ\(хВЏЊtukw”‡”KG?оzбG®Њhepgtz”‡”KG?ЦffffffЊrfwzdtu”‡”KG?Сл…ёQмЊvukow”‡”KG?оzбG®Њuxf”‡”K
G?м(хВЏ\)Њkjydu”‡”KG?г…ёQл…Њuishdymr”‡”KG?б™™™™™љЊamxylfrw”‡”KG?ј(хВЏ\)Њfanw”‡”KG?”zбG®{Њ	yerpnsfhw”‡”KG?З
=pЈЧ
Њxdoaq”‡”KG?®ёQл…ёЊhpzey”‡”e.


In [64]:
# загрузить объект из файлового потока
with open('binary.pkl', 'rb') as f:
    obj = pickle.load(f)
obj

[(14, 0.48, 'iczjypun'),
 (13, 0.06, 'leonbpu'),
 (7, 0.0, 'inflo'),
 (1, 0.58, 'tukw'),
 (15, 0.94, 'hepgtz'),
 (4, 0.35, 'rfwzdtu'),
 (16, 0.28, 'vukow'),
 (19, 0.94, 'uxf'),
 (10, 0.88, 'kjydu'),
 (6, 0.61, 'uishdymr'),
 (5, 0.55, 'amxylfrw'),
 (11, 0.11, 'fanw'),
 (1, 0.02, 'yerpnsfhw'),
 (4, 0.18, 'xdoaq'),
 (15, 0.06, 'hpzey')]

In [65]:
obj == lst

True

## Задание

Сгенерировать список списков списков (*трехмерный список*) из целых чисел и:

- сохранить его в текстовый файл, загрузить из этого файла текст и отобразить на экране,
- сохранить его в бинарный файл, загрузить обратно как объект и сравнить с исходным