# Структуры данных и функции

1. Изменяемые и неизменяемые типы данных

    Строки
    
    Списки

    Кортежи (tuple vs named tuple)

    Сеты (+frozen set)
    
    Словари
    
    Файлы, режимы чтения (+ контекстные менеджеры)

2. Функции
   
   Аргументы
   
   Namespaces
   
   Scopes (LEGB)
   
   Enclosing
   
   Function as an object

3. Функциональное программирование

    Парадигмы программирования
    
    Динамическая типизация и какие еще лейблы можно наклеить на Python
    
    List comprehensions
    
    Lambda, map, filter, reduce, zip
    
    functools, itertools - basics
    
    Декораторы
    
    Области видимости
      
    

*Бонусы: избавляемся от шершавых листов, enumerate и другие прелести.

## __Структура данных__ - это программная единица, к функциям которой относят хранение и обработку множества однотипных или логически связанных данных в вычислительной технике, реализованную через интерфейс, состоящий из набора функций для добавления, поиска, изменения и удаления данных.

## ~~50~~ 3 оттенка термина «структура данных»:

-  Абстрактный тип данных;
-  Реализация какого-либо абстрактного типа данных;
-  Экземпляр типа данных (конкретный список);

## Структура данных = типы данных + ссылки + операций над ними в выбранном языке программирования. 

- Тип данных - множество значений и операций на этих значениях.

- Ссылка - это объект, указывающий на определенные данные, но не хранящий их.

## В начале был PEP8

### Предпосылки:

Код читают чаще, чем пишут. Давайте работать над его читаемостью. 

### Поработали:

https://www.python.org/dev/peps/pep-0008/

### Пример того, за что можно получить по рукам

<img src="images/pep_example.png" width="2500" height="1500">


<img src="images/pep8.jpg" width="2500" height="1500">

<img src="images/datatypes.png" width="2500" height="1500">

## __Строки__ - это упорядоченные последовательности символов, используемые для хранения и представления текстовой информации.

## Литералы строк


In [1]:
"Апостроф или кавычка?"
'Апостроф или кавычка?'
"""Апостроф или три кавычки"""
"Апостроф"" или кавычка?"
"Апостроф " " или кавычка?"

'Апостроф  или кавычка?'

# Записываем многострочные блоки текста

In [2]:
big = '''a very very
... very big
... string'''
print(big)

a very very
very big
string


# __Экранирование__ - это замена в тексте управляющих символов на соответствующие текстовые подстановки.



In [3]:
problem = 'C:\teeeeeeext.txt'
no_problem = r'C:\teeeeeeext.txt'
no_problem = 'C:\\teeeeeeext.txt'

print(problem, no_problem)

C:	eeeeeeext.txt C:\teeeeeeext.txt


<img src="images/ekr.png" width="800" height="800">

### Проблема: 
Иногда мы хотим избавить backslash в тексте от рабских функций. Но в питоне так не принято... 
### Raw string - освободитель backslash'ей!
<img src="images/r.png" width="600" height="600">
_______________________________________________

Формально:

### Если перед открывающей кавычкой стоит символ 'r' (в любом регистре), то механизм экранирования отключается.

# ~~БОЛЬ~~ Кодировки

__ASCII__ (American Standard Code for Information Interchange) - стандарт кодирования символов, а именно: латинского алфавита, цифр и некоторых символов. 

__Unicode__ -  стандарт кодирования символов, включающий в себя знаки почти всех письменных языков мира. В настоящее время стандарт является доминирующим в Интернете. 


In [4]:
print(f"Функция ord() символ переводит в его код ASCII: {2} -", ord("2"),
     f"\nФункция chr() код ASCII переводит в символ: {50} -", chr(50))

Функция ord() символ переводит в его код ASCII: 2 - 50 
Функция chr() код ASCII переводит в символ: 50 - 2


# Разница между ascii(), str(), repr()

## Общее

Методы для получения строкового представления объектов.


## Кратко об отличиях

__repr__ - однозначный (“official” string representation of an object)

__str__ - человекочитаемый (nicely printable string representation of an object)

__ascii__ - родственник repr'a,  заменяющий не-ASCII символы на escape characters


## Прямо в тексте

 %s-спецификатор -  конвертирует, используя str()
 
 %r - конвертирует, используя repr()
 
 %a - конвертирует, используя ascii()

In [5]:
import datetime 
today = datetime.datetime.now() 

print("str() -", str(today),
      "\nrepr() -", repr(today))

mot = "Les garçons"
print("\nrepr() -", repr(mot),
      "\nascii() -", ascii(mot))

str() - 2019-11-09 22:11:24.315677 
repr() - datetime.datetime(2019, 11, 9, 22, 11, 24, 315677)

repr() - 'Les garçons' 
ascii() - 'Les gar\xe7ons'


## Метод - это функция, которая применяется к объекту определенного типа и позволяет делать какие-либо манипуляции с ним.

In [6]:
example = "Python is awesome" 
example

'Python is awesome'

## Метод find() - позволяет найти подстроку в строке и вывести ее индекс. 


In [7]:
example.find("aw")

10

## А если подстроки в строке нет?

## При отсутствии подстроки в строке выводит -1.

In [8]:
example.find("l")

-1

## Ищем с правого конца
возвращает номер последнего вхождения подстроки

In [9]:
example.rfind("aw")

10

## А как еще найти индекс подстроки?

In [10]:
example.index("Py")

0

## И в чем тогда разница между index и find?

In [11]:
example.index("Snake")

ValueError: substring not found

## Упс.. Оказывается, индекс умеет ругаться :(

# Строки можно конкатенировать

In [None]:
first = "lenin"
second = "grib"
third = first + " " + second + " "
print(third)

# и склеивать по заданному символу

" ".join([first, second])


### И дублировать

In [None]:
print(third*10, "\n")

## Строка как торт - слайсинг
<img src="images/lenin.jpeg" width="500" height="500">

In [None]:
print(f"Слайсим:{repr(third)}\n"+third[:5], third[-5:-1], third[::-2]) # шагаем
# А еще мы можем разрезать по швам
print("Применяем метод .split():", third.split(" "))

# Хотим изменений

In [None]:
third.replace("grib ", "molodec!")

# Балуемся кортежами

In [None]:
third.partition("nin")

# Когда размер имеет значение

In [None]:
ecclesiastes = "vanitas vanitatum et omnia vanitas";
print(ecclesiastes.zfill(46))

In [None]:
ecclesiastes.center(46, " ")

In [None]:
print(".ljust(): ", ecclesiastes.ljust(46, "E"),
      "\n.rjust(): ", ecclesiastes.rjust(46, "E"))

# Или так
_______________________

S.lstrip([chars])	- удаляем пробельные символы в начале строки

S.rstrip([chars])	- удаляем пробельные символы в конце строки

S.strip([chars])	-удаляем пробельные символы в начале и в конце строки

# ~~Cпойлер к дезе~~ 
Возвращаем количество непересекающихся вхождений подстроки в диапазоне [начало, конец]

In [None]:

"ahahaahauhuhhahahahahahehehehe".count("ah")

# Играем с регистрами

In [None]:
print("Upper case -", third.upper(), "\n",
      "Title -", third.title(), "\n",
     "Lower case -", third.lower(), "\n",
     "Capitalize -", third.capitalize(), "\n"
     "Swapcase - ", third.swapcase())

In [None]:
def capitalize_name(name):
    return name.capitalize()

name = "alice"
f"{capitalize_name(name)} is my friend"

# Ставим диагноз строкам
___________________________

S.isdigit()	 - состоит ли строка из цифр

S.isalpha()	 - состоит ли строка из букв

S.isalnum()	- состоит ли строка из цифр или букв

___________
S.islower()	- состоит ли строка из символов в нижнем регистре

S.isupper()	- состоит ли строка из символов в верхнем регистре

S.istitle()	Начинаются ли слова в строке с заглавной буквы
___________

S.isspace()	- состоит ли строка из неотображаемых символов (пробел, символ перевода страницы ('\f'), "новая строка" ('\n'), "перевод каретки" ('\r'), "горизонтальная табуляция" ('\t') и "вертикальная табуляция" ('\v'))
___________

S.startswith(паттерн)	 - начинается ли строка S с паттерна

S.endswith(паттерн)	- заканчивается ли строка S паттерном


### Так почему же immutable..

In [None]:
second[2] = "ё"

__Остается только создавать новые объекты каждый раз, когда мы захотим модифицировать нашу строку__

In [None]:
replace_result = second.replace("i", "ё")
print(id(replace_result), id(second))
print(second, replace_result)

# Форматирование строк
________________________________


### Способ 1, для дедов - % 

- становится нечитаемым на больших текстах
- легко может стать причиной возникновения ошибок

In [None]:
price = "cheap"
name = "Linus Torvalds"
"'Talk is %s. Show me the code.' ― %s" % (price, name)


### Способ 2 - .format()
_______________________________
- появился в Python 2.6
- более здоровая альтернатива %-форматированию
- все равно вербозный способ

In [None]:
"'Talk is {}. Show me the code.' ― {}".format(price, name)

In [None]:
"'Talk is {1}. Show me the code.' ― {0}".format(name, price)

In [None]:
data = {"price": "cheap", "name": "Linus Torvalds"}
"'Talk is {price}. Show me the code.' ― {name}".format(**data)

### Способ 3 - just one simple.. great magnificent f 
- царствование с Python 3.6 версии
- самый быстрый способ форматирования
- подробности в PEP 498
<img src="images/f.jpeg" width="300" height="300">

In [None]:
f"'Talk is {price}. Show me the code.' ― {name}" 


### Включаем критическое мышление

In [None]:
import timeit
pc_way = timeit.timeit("""price = "cheap"
name = "Linus Torvalds"
'Talk is %s. Show me the code. ― %s' % (price, name)""", number=100000)
format_way = timeit.timeit("""price = "cheap"
name = "Linus Torvalds"
'Talk is {}. Show me the code. ― {}'.format(price, name) """, number=100000)
f_way = timeit.timeit("""price = "cheap"
name = "Linus Torvalds"
f'Talk is {price}. Show me the code. ― {name}'""", number=100000)
print("%-форматирование:", pc_way, "\n",
     "Метод .format()", format_way, "\n",
     "f-форматирование:", f_way, "\n")

### А еще... Даже строка умеет в математику

In [None]:
f"{2 * 46}"

### Итак, мы ~~вспомнили~~ узнали
- Определение строк и методов
- Методы строк
 - Отличия index() и find()
 - Конкатенация и дублирование строк
 - Слайсинг
 - Методы смены регистров 
- Форматирование строк
 - %-форматирование
 - Метод .format()
 - Божественный f

<img src="images/me.jpeg" width="400" height="400">

# Список - упорядоченная изменяемая коллекция объектов произвольных типов. Динамический массив ссылок.

#### Инициализировать пустой список можно через конструктор или через литералы

In [None]:
# через литералы
a = []
# через конструктор
b = list()

### Список может содержать любое колличество любых объектов (в т.ч. и вложенные списки) или не содержать ничего

In [None]:
snake = list('hat')
noble_programmer = ["Knuth", "Tanenbaum", "bike"]
matrix = [[1, 2], [3, 4]]
hungry_list = []

### Важно: при создании списка с начальным значением не происходит копирования этого значения

In [None]:
matrix = [[0]] * 3
matrix

In [None]:
matrix[0][0] = 'Null'
matrix

Как правильно?

## Основные методы list

### Добавление элементов

- __append__ и __extend__ - добавляют в конец списка один элемент или некоторую последовательность.

In [None]:
l = [1, 2, 3]
l.append(4)
l.extend((5, 6))
l

- вставить элемент перед элементом с указанным индексом можно с помощью метода __insert__

In [None]:
l = [1, 2, 3]
l.insert(0, 'Null')
print(l)
l.insert(-2, 'some')
print(l)

### Замена
- можно заменить целую последовательность на другую:

In [None]:
l = [1, 2, 3]
l[:2] = [0] * 2
l

### Конкатенация списков

- результат конкатенации списка - всегда новый список.

In [None]:
l1 = [1, 2]
l2 = [3]
print(id(l1), id(l2))
print(id(l1 + l2))

Но есть возможность __inplace__ конкатенации 

In [None]:
l1 = [1, 2]
l2 = [3]
print(id(l1), id(l2))
l1 += l2 
print(id(l1))

### Удаление элемента

- удалить элемент или целую последовательность из списка можно с помощью оператора __del__, указав индекс.

In [None]:
l = [1, 2, 3]
del l[:2]
l

In [None]:
l = [1, 2, 3]
del l[:]
l

- с помощью метода __pop__ можно получить в качестве возвращаемого значения удаляемый элемент

In [None]:
l = [1, 2, 3]
first = l.pop(0)
print(first, l)

- удалить первое вхождение элемента в список

In [None]:
kebab = [1, 1, 3]
kebab.remove(1)
kebab

### Несколько других полезных методов

__list.index(x, [start [, end]])__

Возвращает положение первого элемента со значением x (при этом поиск ведется от start до end)

In [None]:
l = [1, 2, 3]
l.index(1)

__Мальчик__: оборачивает все в try;

__Мужчина__: знает, что и так все будет хорошо

In [None]:
l = [1, 2, 3]
l.index(4)

__list.count(x)__
Возвращает количество элементов со значением x

In [None]:
l = [1, 1, 1, 2, 3]
l.count(1)

In [None]:
l = [1, 1, 1, 2, 3]
l.count(4)

### Как перевернуть список?

In [None]:
l = [1, 2, 3]
a = l.reverse()
print(a)
l

In [None]:
l = [1, 2, 3]
lr = l[::-1]
lr

In [None]:
l = [1, 2, 3]
lr = reversed(l)
lr

### Как сортировать список ?

In [None]:
l = [3, 1, 2]
l.sort()
l

In [None]:
l = [3, 1, 2]
ls = sorted(l)
ls

Функции __sorted__ и методу __sort__ можно опционально указать направление сортировки, а также функцию-ключ

In [None]:
l = [3, 4, 2, 1]
l.sort(key=lambda x: x % 2, reverse=True)
l

Сортировка и сравнение в Python 3.х не конвертирует типы, в отличии от Python 2.x

In [None]:
a = [2, 1, '1']
a.sort()

### Генераторы списков aka list comprehensions

Cпециальная синтаксическая конструкция, которая позволяет по определенным правилам создавать заполненные списки. Их удобство заключается в более компактной записи программного кода в сравнении с созданием списка обычным способом.

Генератор списков - способ построить новый список, применяя выражение к каждому элементу последовательности. Генераторы списков очень похожи на цикл __for__.

In [None]:
a = []
for i in range(10):
    a.append(i)

a_gen = [i for i in range(10)]
a == a_gen

Папа: __SETL__

Сын: __ABC__

Внук: __Python__

In [None]:
[x ** 2 for x in range(10) if x % 2 == 1]

Компактная альтернатива комбинациям __map__ и __filter__

In [None]:
list(map(lambda x: x ** 2,
         filter(lambda x: x % 2 == 1,
                range(10))))

Могут быть вложенными

In [None]:
[[j for j in range(5)] for i in range(5)]

In [None]:
matrix = [[1, 2, 3], [4, 5], [6, 7, 8, 9]] 
[val for sublist in matrix for val in sublist] 

## Slicing

Слайсинг позваляет брать слайсы от последовательности через функцию `slice`. Может работать с любом объектом реализующим протокол последовательность (имплементированны методы `__getitem__()` and `__len__()`)

Синтаксис


In [None]:
slice(stop)
slice(start, stop, step)

In [None]:
employee = ['Vasya', 'Pupkin', 'senior', '300k/ns']
NAME = slice(2)
POSITION = slice(2, 3)
SALARY = slice(3, None)
print(employee[NAME])
print(employee[SALARY])
print(SALARY)

### Теперь вы знаете:

* Как создать список любой вложенности
* Методы работы со списком
* Некоторые build-in функции
* Slicing

<img src="./images/cat.jpg">

# ~~Кортеж~~ Tuple

Литералы кортежа - простые скобки. Их можно опускать.

In [None]:
point = 1, 2
date = 'may', 22

Одноэлементый кортеж - всегда в скобках. В противном случае провоцирует трудноотлавливаемвый баг.

Плохо:

In [None]:
t = 'some',
x, = t
x

Нормально:

In [None]:
t = ('some', )
[x] = t
x

По сути тоже самое, что и list, но неизменяемый.

Зачем?

 * Обезопасить данные от изменения.​

 * В среднем работает быстрее списка​

 * Занимает меньше места.​

 * Могут быть ключем в словаре. Почему ?

In [None]:
lst = [10, 20, 30]
tpl = (10, 20, 30)
print(lst.__sizeof__())
print(tpl.__sizeof__())

Сравнение кортежей происходит в лексикографическом порядке, длина учитывается только если одна последовательность является префиксом другой

In [None]:
(1,2,3) < (1,2,4)

In [None]:
(1, 2, 3, 4) < (1, 2, 4)

Конкатенировать можно через +, результат всегда новый объект.

### Перевернуть tuple

In [None]:
tuple(reversed((1, 2, 3)))

In [None]:
(1, 2, 3)[::-1]

### Зачем нужна "лишняя" функция reversed ?

* слайс всегда возвращает копию при работе с встроенными коллекциями
* `reversed` специализирован для разных типов, способ итерироваться с конца и не платить за это памятью. O(1)

### enumerate

In [None]:
my_list = ['apple', 'banana', 'grapes', 'pear']
for c, value in enumerate(my_list, 1):
    print(c, value)

Предпочитай итерацию по объекту циклам со счётчиком. Ошибка на 1 в индексе --- это классика. Если же индекс требуется, помни про enumerate

In [None]:
# Плохо
for i in range(len(xs)) :
    x = xs[i]

# Лучше
for x in xs:
    ...

# Или
for i, x in enumerate(xs):
    ...

#### Рекомендую ознакомиться со всем списком [встроенных функций](https://docs.python.org/3/library/functions.html)

### tuple vs list

__list__
* Mutable

* Медленнее

* Семантически гомогенная последовательность

* Unhashable


__tuple__
* Immutable

* Быстрее

* Семантически гетерогенная структура данных

* Hashable


### hashable

Объект будет `__hashable__` если у него сть некоторое хеш-значение, которое не меняется на протяжении жизни этого объекта (получают через метод `__hash__`), и его можно сравнить с другими объектами (реализован метод `__eq__` или `__cmp__`). Хешируемые объекты, которые считаются одинаковыми должны иметь одинаковое хэш значение. 

In [None]:
a = (1, 2, 3)
c = (1, 2, 3)
a == c

In [None]:
a.__hash__() == c.__hash__()

In [None]:
id(a) != id(c)

#### Вопрос: что будет в словаре?

In [None]:
d = {
    1: '1',
    1.0: '1.0',
    True: 'True'
}

## Namedtuple

Именованный кортеж - тип кортежа, специализированный на фиксированное множество полей.  Каждый сохраненный в них объект может быть доступен через уникальный, удобный для чтения человеком идентификатор.

In [None]:
from collections import namedtuple
Car = namedtuple('Car' , 'color mileage')
my_car = Car('red', 3812.4)
my_car

In [None]:
my_car.color

Индексы все еще доступны:

In [None]:
my_car[0]

Есть несколько удобных встроенных методов

In [None]:
my_car._asdict()

Метод _replace(). Создаёт поверхностную (shallow) копию кортежа и поволяет выборочно заменять некоторые поля:

In [None]:
my_car._replace(color='blue')

Метод класса _make() может быть использован, чтобы создать новый экземпляр именованного кортежа из последовательности:

In [None]:
Car._make(['red', 999])

## Множественное присваивание и распаковка

In [None]:
x, y = 10, 20

То же самое, но по-другому:

In [None]:
x, y = 10, 20
x, y = (10, 20)
(x, y) = 10, 20
(x, y) = (10, 20)

Можно использовать на любом итерируемом объекте

In [None]:
x, y = [10, 20]
x

In [None]:
x, y = 'hi'
x

Работает с любым количеством объектов и даже с переменными:

In [None]:
point = 10, 20, 30
x, y, z = point
print(x, y, z)
(x, y, z) = (z, y, x)
print(x, y, z)

Можно использовать asterisk:

In [None]:
first, *_, last = range(4)
first, last

In [None]:
print(*[1], *[2], 3)
{*range(4), 4}

In [None]:
first, *middle, last = range(4)
middle, type(middle)

### Распаковка в звездочку - всегда [список](https://www.python.org/dev/peps/pep-3132/#acceptance)

## Аналогично работает распаковка двумя звездочками **

In [None]:
dict(**{'x': 1}, y=2, **{'z': 3})

В словаре свежие ключи будут перетирать уже существующие в словаре

In [None]:
{'x': 1, **{'x': 2}}

In [None]:
{**{'x': 2}, 'x': 1}

<img src="./images/voprosi.jpg">


# Сет (множество) - неупорядоченная коллекция уникальных хешируемых объектов.


### Где используют?
1. Удаление дубликатов из последовательности
2. Membership testing
3. Подсчет пересечений, объединений, разности и симметрической разности


#### NB!
- Сеты не поддерживают индексирование и слайсинг
- Упорядоченной вставки у них нет

## Как создать сет?

In [None]:
container = set()
container

А еще сет задается фигурными скобками...

In [None]:
lol_net = {}
type(lol_net)

Но обязательно с элементами внутри!

In [None]:
lol = {"youth", "of", "the", "nation"}
print(lol, id(lol))
lol.add("me")
print(lol, id(lol))

А что будет, если подать не набор объектов, а одну-единственную строку?

In [None]:
s = set("privet")
s

Множество имеет тот же литерал, что и словарь, но пустое множество с помощью литерала создать нельзя!

## Методы множеств

### Возвращают True или False:

set.isdisjoint(another_set) - True, если set и another_set не имеют общих элементов.

set.issubset(another_set) - True, все элементы set принадлежат another_set.

set.issuperset(another_set) - True, все элементы another_set принадлежат set.


### Вспоминая теорию множеств:

set.union(set1, ...) - объединение нескольких множеств.

set.intersection(set1, ...) - пересечение множеств.

set.difference(other, ...) - множество всех элементов set, не принадлежащих ни одному из other.

set.symmetric_difference(other) - все элементы исходных множеств, не принадлежащие одновременно обоим исходным множествам.

### И еще один mutable - меняем ~~жизнь~~ множества!

<img src="images/mutable.jpg" width="700" height="700">

set.update(other, ...) - объединение одного множества другим.

set.intersection_update(other, ...) - пересечение.

set.difference_update(other, ...) - вычитание.

set.symmetric_difference_update(other) - множество из элементов, встречающихся в одном множестве, но не встречающиеся в обоих.

set.add(elem) - добавляет элемент в множество.

set.remove(elem) - удаляет элемент из множества. KeyError, если такого элемента не существует.

set.discard(elem) - удаляет элемент, если он находится в множестве.

set.pop() - удаляет первый элемент из множества. Так как множества не упорядочены, нельзя точно сказать, какой элемент будет первым.

set.clear() - очистка множества.

## frozenset - неизменямый тип множества.
![SegmentLocal](images/frozen.gif "segment")

In [None]:
frozen = frozenset("diplome")
frozen.add("water")

### molodec! но не ленин

- Дали определение сету и его отмороженному родственнику
- Потрогали методы сетов и пустоту
- Вспомнили Кантора ~~и забыли~~

## Задание

In [None]:
pizza = {"dough", "tomatoes", "pepperoni", "ground pepper", "sweet basil",
         "a lot of cheeeese", "onion", "garlic", "salt", "oregano"}
shaverma = {"lavash", "cucumbers", "tomatoes", "sauce", "fried chicken", "onion", "cabbage"}

In [None]:
pizza.difference(shaverma)
shaverma.difference(pizza)
pizza.intersection(shaverma)

# Словарь - это неупорядоченная коллекция объектов с доступом по ключу.


### Как инициализировать словарь?

## 1. С помощью литерала

In [None]:
dictionary = {}
# or
dictionary = {'West World': 8.4, 'True Detective': 7.6}
dictionary

## 2. Функция dict()

In [None]:
dictionary = dict()
# or
dictionary = dict([(1, 100), (2, 400)])
dictionary

## 3. Метод .fromkeys()

In [None]:
dictionary = dict.fromkeys(["Leonardo", "Donatello",
                           "Raphael", "Michelangelo"], "ninja")
dictionary

## 4. Генератор словарей

In [None]:
dictionary = {number: number**2 for number in range(0, 7, 2)}
dictionary

## Титул Ключа может быть присвоен
- единственному в своем роде 

- неизменяемому и

- хешируемому типу
<img src="images/all.png" width="1000" height="800">

## Методы словарей

### Возвращает пары (ключ, значение).

In [None]:
dictionary.items() 


dict.keys() - возвращает ключи в словаре.

dict.values() - возвращает значения в словаре.


Возвращает значение ключа. Если его нет, не бросает исключение, а создает ключ с указанным значением (по умолчанию None).

In [None]:
dictionary.setdefault("new")
dictionary

Возвращает значение ключа, но если его нет, не бросает исключение, а возвращает default (по умолчанию None).

In [None]:
dictionary.get("smth")
dictionary

dict.pop(key[, default]) - удаляет ключ и возвращает значение. Если ключа нет, возвращает default (по умолчанию бросает исключение).

dict.popitem() - удаляет и возвращает пару (ключ, значение). Если словарь пуст, бросает исключение KeyError. Помните, что словари неупорядочены.

dict.update([other]) - обновляет словарь, добавляя пары (ключ, значение) из other. Существующие ключи перезаписываются. Возвращает None (не новый словарь!).

### Обсудили словари

- 4 способа создать словарь бесплатно
- Кому может быть присвоен титул Ключа
- Методы словарей
 - берем всё - .items()
 - ключи - .keys()
 - значения - .values()
 - получили, что спросили - .get() / .setdefault()

# Файлы и работа с ними

### Функция open

Текстовые и бинарные файлы в Python сильно отличаются.

Создать объект типа файл можно с помощью функции open,
которая принимает один обязательный аргумент — путь к
файлу:

In [None]:
open('./data/test.txt')

Аргументов у функции open - много, обратить внимание нужно на:
* __mode__ - определяет в каком режиме будет открыт файл. Возможные значения:
  * "r", "w", "x", "a", "+"
  * "b", "t".
* для текстовых файлов
  * __encoding__
  * __errors__


                  | r   r+   w   w+   a   a+
------------------|--------------------------
read              | +   +        +        +
write             |     +    +   +    +   +
write after seek  |     +    +   +
create            |          +   +    +   +
truncate          |          +   +
position at start | +   +    +   +
position at end   |                   +   +

Создать новый текстовый файл в системной кодировке и
открыть его для записи:

In [None]:
open("./data/text.txt", "x") # failing if the file already exists

### Методы работы с файлами

#### Чтение

Метод __read__ читает не более n символов из файла

In [None]:
file_handle = open('./data/test.txt')
file_handle.read(7)

Методы readline и readlines читают одну или все строчки
соотвественно. Можно указать максимальное количество
символов, которые надо прочитать:

In [None]:
file_handle = open('./data/test.txt')
print(len(file_handle.readline()))

file_handle.readlines()

### Запись

In [None]:
file_handle = open("./data/example.txt", "w")
file_handle = close("./data/example.txt", "w")
file_handle.write('someinformation')

Неявного добавления символа переноса строки, как в __print__ - нет!

Записать последовательность строк можно с помощью
метода writelines:

In [None]:
file_handle.writelines(['spam', 'egg'])
open("./data/example.txt", "r").readlines()

И еще немного методов работы с файлом

In [None]:
file_handle = open("./data/example.txt", "r+")
file_handle.fileno() # file descriptor”

In [None]:
file_handle.tell() # file object’s current position in bytes

In [None]:
file_handle.seek(8)
file_handle.tell()

In [None]:
file_handle.write("something unimportant")
file_handle.flush() # Flush the write buffers of the stream
file_handle.close()

### Файл всегда нужно закрывать

А сделать это удобно можно с помощью контекстного менеджера:

In [None]:
with open("./data/example.txt", "r+") as ouf:
    ...
    # do your stuff here and dont worry about file closing

### Вся правда о файлах

В UNIX - все файл: директории, жесткий диск, сетевые устройста, пайплайны, stdin/stdout и тд.

И работая с файламими в shell мы как правило работаем с __inode__

* Inode - структура данных, которая является репрезентацией файла (хранит метаинформацию)
* Index node (maybe?)
* Хранится на диске, указывает на фактическое местоположение файла

Хранит:
* группу и имя владельца
* тип: обычный, директория, символьное или блочное устройство, FIFO pipe
* Права доступа
* время доступа: к файлу, файл изменен, inode'а изменена.
* Количество жестких ссылок к файлу
* Адреса блоков диска, хранящих информацию
* Размер файла

Не хранит путь до файла!

__Файловый дескриптор__ — это неотрицательное целое число. Когда мы открываем существующий файл и создаем новый файл, ядро возвращает процессу файловый дескриптор.

При запуске программы в оболочке открывается три дескриптора 0, 1 и 2. По умолчанию с ними связаны следующие файлы:

По умолчанию UNIX-шеллы связывают файловый дескриптор 0 со стандартным вводом процесса (терминал), файловый дескриптор 1 — со стандартным выводом (терминал), и файловый дескриптор 2 — со стандартной ошибкой (то есть то куда выводятся сообщения об ошибках). Это соглашение соблюдается многими UNIX-шеллами и многими приложениями — и в ни коем случае не является составной частью ядра.

#### Почему важно закрывать файловый дискриптор ?

* Отправляет программу в руки сборщика мусора
* Может замедлить программу. Слишком много открытых вещей - большой расход RAM
* Большинство изменений в файле применятся только после закрытия файла.
* Теоретически вы можете упереться в лимит ОС на открытые файлы
* Windows считает открытые файлы заблокированными, так что, например, другой скрипт на питоне не сможет их прочитать.
* Дурной тон

# Все это, конечно, прекрасно и обязательно нужно запомнить...

In [None]:
help(str)

<img src='./images/voprosiki.jpg'>