# Глава 9. Кортежи, файлы и все остальное

## Кортежи (tuples)

* **Это упорядоченные коллекции объектов произвольных типов**

Подобно строкам и спискам, являются коллекциями объектов, упорядоченных по позициям. Подобно спискам, могут содержать объекты любого типа.

* **Обеспечивают доступ к элементам по смещению**

Подобно строкам и спискам поддерживают все операции, которые основаны на использовании смещения, такие как индексирование и извлечение среза.

* **Относятся к категории неизменяемых последовательностей**

Подобно строкам, являются неизменяемыми объектами, поэтому не поддерживают никаких операций непосредственного изменения, которые применяются к спискам.

* **Имеют фиксированную длину, гетерогенны и поддерживают произвольное число уровней вложенности**

Т.к. являются неизменяемыми объектами, то нельзя изменить длину кортежа, минуя процедуру создания копии. С другой стороны, кортежи могут хранить другие составные объекты (списки, словари и другие кортежи), а следовательно поддерживают произвольное число уровней вложенности.

* **Массивы ссылок на объекты**

Подобно спискам, кортежи проще представлять, как массивы ссылок на объекты, - кортежи хранят указатели (ссылки) на другие объекты, а операция индексирования над кортежами выполняется очень быстро.

`()` - пустой кортеж

`T = (0,)` - кортеж из одного элемента (не выражение)

`T = (0, 'Ni', 1.2, [3, 4])` - кортеж из четырех элементов

`T = tuple('spam')` - создание кортежа из итерируемого объекта

`T = T1 + T2`, `T * 3` - конкатенация, повторение

`T.index('Ni)` - поиск элемента

`T.count('Ni)` - подсчет вхождений

In [1]:
(0, 'Ni', 1.2, [3, 4])

(0, 'Ni', 1.2, [3, 4])

In [2]:
T = tuple('spam')
T

('s', 'p', 'a', 'm')

In [3]:
T * 3

('s', 'p', 'a', 'm', 's', 'p', 'a', 'm', 's', 'p', 'a', 'm')

## Кортежи в действии

In [4]:
T = (1, 2, 3, 4)
K = T[0], T[1:3]  # индексирование и извлечение среза, создается
K                 # новый кортеж

(1, (2, 3))

### Особенности синтаксиса определения кортежей: запятые и круглые скобки

Поскольку круглые скобки могут также окружать выражения, необходимо что-то предпринять, чтобы дать интерпретатору понять, что единственный объект в  круглых скобках  – это кортеж, а  не простое выражение.

Если вам действительно необходимо получить кортеж с единственным элементом, нужно просто добавить запятую после этого элемента, перед закрывающей круглой скобкой

In [5]:
x = (40)  # целое число
x

40

In [6]:
y = (40,)  # кортеж, содержащий целое число
y

(40,)

В виде исключения при определении кортежей интерпретатор позволяет опускать открывающую и  закрывающую круглые скобки, если синтаксически
конструкция интерпретируется однозначно. Например, если кортеж создается простым перечислением нескольких элементов, разделенных запятыми. В контексте операции присваивания интерпретатор распознает, что это кортеж, даже при отсутствии круглых скобок.

In [7]:
x = 1, 2, 3, 4
x

(1, 2, 3, 4)

> Единственное место, где круглые **скобки являются обязательными**, – при **передаче кортежей функциям в виде литералов** (где круглые скобки имеют важное значение)

### Преобразования, методы и неизменяемость

Несмотря на отличия в  синтаксисе литералов, операции, выполняемые над
кортежами, идентичны операциям, применяемым к  строкам и  спискам. Единственное отличие состоит в  том, что операции `+`, `*` и извлечения среза при применении к кортежам возвращают новые кортежи, а также в том, что в отличие от строк, списков и словарей, кортежи
имеют сокращенный набор методов.

Если, к примеру, необходимо отсортировать содержимое кортежа, его сначала следует преобразовать в список, чтобы превратить в изменяемый объект и получить доступ к методу сортировки или задействовать функцию `sorted`, которая принимает объекты любых типов последовательностей (и не только):

In [8]:
T = ('cc', 'aa', 'dd', 'bb')
tmp = list(T)
tmp.sort()
tmp

['aa', 'bb', 'cc', 'dd']

In [9]:
T = tuple(tmp)
T

('aa', 'bb', 'cc', 'dd')

In [10]:
sorted(T)  # или просто sorted

['aa', 'bb', 'cc', 'dd']

Два метода:

* `index`

* `count`

In [11]:
T = (1, 2, 3, 2, 4, 2)
T.index(2)

1

In [13]:
T.index(2, 3, len(T))  # аргументы: value, [start, [stop]

3

In [14]:
T.count(2)

3

>**Правило неизменяемости применяется только к самому кортежу, но не к объектам, которые он содержит**.

Например, список внутри кортежа может изменяться как обычно

In [15]:
T = (1, [2, 3], 4)

In [16]:
T[1] = 'spam'

TypeError: 'tuple' object does not support item assignment

In [17]:
T[1][0] = 'spam'
T

(1, ['spam', 3], 4)

### Зачем нужны кортежи, если есть списки?

**Неизменяемость кортежей** обеспечивает своего рода **поддержку целостности** – вы можете быть уверены, что кортеж не будет изменен посредством другой ссылки из другого места в  программе, чего нельзя сказать о списках.

Тем самым кортежи играют роль объявлений «констант», присутствующих в  других языках программирования, несмотря на то, что в языке Python это понятие связано с объектами, а не с переменными.

Также существуют ситуации, в которых кортежи можно использовать, а списки - нет. Например, **в качестве ключей словаря**.

## Файлы

Встроенная функция **`open`** создает объект файла, который обеспечивает связь с файлом, размещенным в компьютере. После вызова функции `open` можно выполнять операции чтения и записи во внешний файл, используя методы полученного объекта.

`open` - открытие файла, атрибуты `r`, `w`, `b`

`input = open('filename', 'r')` - открывает для чтения
`output = open('filename', 'w')` - открывает для записи

**Методы**:

* `input.read()` - чтение файла целиком в единственную строку

* `input.read(N)` - чтение следующих N символов (или байтов) в строку

* `input.readline()` - чтение следующей текстовой строки (включая символ конца строки) в строку

* `input.readlines()` - чтение файла целиком в список строк (включая символ конца строки)

* `output.write(somestring)` - запись строки символов (или байтов) в файл

* `output.writelines(somelist)` - запись всех строк из списка в файл

* `output.close()` - закрытие файла вручную (выполняется по окончании работы с файлом)

* `output.flush()` - выталкивает выходные буферы на диск, файл остается открытым

* `anyFile.seek(N)` - изменяет текущую позицию в файле для следующей операции, смещая ее на N байтов от начала

### Открытие файлов

Чтобы открыть файл, программа должна вызвать функцию `open`, передав ей
имя внешнего файла и режим работы.

Обычно в качестве режима используется строка: 
* `'r'` – когда файл открывается для чтения (по умолчанию),
* `'w'` – когда файл открывается для записи
* `'a'` – когда файл открывается на запись в конец.

В строке режима могут также указываться другие параметры:
* Добавление символа `b` в строку режима означает работу с двоичными данными (в версии  3.0 отключается интерпретация символов конца строки и кодирование символов Юникода).
* Добавление символа `+` означает, что файл открывается для чтения и для записи (то есть вы получаете возможность читать и записывать данные в один и  тот же объект файла, часто совместно с  операцией позиционирования в файле).

Функция может принимать третий необязательный аргумент, управляющий **буферизацией выводимых данных**, – значение ноль означает, что выходная информация не будет буферизироваться (то есть она будет записываться во внешний файл сразу же, в момент вызова метода записи). Имя внешнего файла может включать платформозависимые префиксы абсолютного или относительного пути к файлу. Если путь к файлу не указан, предполагается, что он находится в текущем рабочем каталоге (то есть в каталоге, где был запущен сценарий).

### Использование файлов

* **Для чтения лучше использовать итераторы файлов**

Файлы имеют итератор, который автоматически читает информацию из файла строку за строкой в контексте цикла `for`, в генераторах списков и в других итерационных контекстах

`for line in open('data'): do smth`

* **Содержимое файлов находится в строках, а не в объектах**

Данные, получаемые из файла, всегда попадают в сценарий в виде строки, поэтому вам необходимо будет выполнять преобразование данных в другие типы объектов языка Python, если эта форма представления вам не подходит. Кроме того, в состав Python входят дополнительные стандартные библиотечные инструменты, предназначенные для работы с универсальным объектом хранилища данных (например, модуль `pickle`) и  обработки упакованных двоичных данных в  файлах (например, модуль `struct`)

* **Вызов метода `close` является необязательным**

Вызов метода `close` разрывает связь с  внешним файлом. Интерпретатор Python немедленно освобождает память, занятую объектом, как только в программе будет утеряна последняя ссылка на этот объект. Как только объект файла освобождается, интерпретатор автоматически закрывает ассоциированный с  ним файл (что происходит также в  момент завершения программы).

Благодаря этому вам не требуется закрывать файл вручную, особенно в небольших сценариях, которые выполняются непродолжительное время.

>**С  другой стороны, вызов метода `close` не повредит, и его рекомендуется использовать в крупных системах.**

* **Файлы обеспечивают буферизацию ввода-вывода и позволяют производить позиционирование в файле**

По умолчанию вывод в файлы всегда выполняется с помощью промежуточных буферов, то есть в момент записи текста в  файл он не попадает сразу же на диск  – буферы выталкиваются на диск только в момент закрытия файла или при вызове метода `flush`.

Вы можете отключить механизм буферизации с помощью дополнительных параметров функции `open`, но это может привести к снижению производительности операций ввода-вывода. Файлы в языке Python поддерживают также возможность позиционирования – метод `seek` позволяет сценариям управлять позицией чтения и записи.

## Файлы в действии

В первом примере выполняется открытие нового текстового файла
в режиме для записи, в него записываются две строки (завершающиеся сим-
волом новой строки `\n`), после чего файл закрывается.

Далее этот же файл открывается в режиме для чтения и выполняется чтение строк из него. Обратите внимание, что третий вызов метода `readline` возвращает пустую строку – таким способом методы файлов в языке Python сообщают о том, что был достигнут конец файла.

> `readline` возвращает пустую строку когда достигнут конец файла (пустая строка в файле возвращается как строка, содержащая единственный символ новой строки, а не как действительно пустая строка)

In [18]:
myfile = open('./exercises/2_9/myfile.txt', 'w') # открывает файл (создает/очищает)
myfile.write('hello text file\n')
# write записывает строку текста и возвращает
# количество записанных символов

16

In [19]:
myfile.write('goodbye text file\n')

18

In [20]:
myfile.close() # выталкивает выходные буферы на диск

In [21]:
myfile = open('./exercises/2_9/myfile.txt') # открывает файл, 'r' - по умолчанию

In [22]:
myfile.readline() # читает строку

'hello text file\n'

In [23]:
myfile.readline() # читает строку

'goodbye text file\n'

In [24]:
myfile.readline() # пустая строка - конец файла

''

In [25]:
open('./exercises/2_9/myfile.txt').read() # прочитать целиком в строку

'hello text file\ngoodbye text file\n'

In [27]:
# лучше использовать итератор
for line in open('./exercises/2_9/myfile.txt'):
    print(line, end='')

hello text file
goodbye text file


### Текстовые и двоичные файлы в Python 3.0

* Содержимое **текстовых файлов** представляется в виде обычных строк типа **`str`**, выполняется автоматическое кодирование/декодирование символов Юникода и по умолчанию производится интерпретация символов конца строки


* Содержимое **двоичных файлов** представляется в виде строк типа **`bytes`**, и оно передается программе без каких-либо изменений

Когда выполняется операция чтения двоичных данных из файла, она возвращает объект типа `bytes`  – последовательность коротких
целых чисел, представляющих абсолютные значения байтов (которые могут
соответствовать символам, а  могут и  не соответствовать), который во многих отношениях очень близко напоминает обычную строку

In [28]:
with open('./exercises/2_9/data.bin', 'wb') as f:
    f.write(b'\x00\x00\x00\x07spam\x00\x08')

In [29]:
with open('./exercises/2_9/data.bin', 'rb') as f:
    data = f.read()
    
data

b'\x00\x00\x00\x07spam\x00\x08'

In [30]:
data[4:8]  # ведет себя как строка

b'spam'

In [31]:
data[4:8][0]  # Но в действительности хранит 8-битные целые числа

115

In [32]:
bin(data[4:8][0])

'0b1110011'

Кроме того, **двоичные файлы не выполняют преобразование символов конца
строки** – текстовые файлы по умолчанию отображают все разновидности символов конца строки в символ `\n` в процессе записи и чтения, и производят преобразование символов Юникода в  соответствии с  указанной кодировкой.

### Сохранение и интерпретация объектов Python в файлах

**Данные всегда записываются в файл в виде строк**, а методы записи не выполняют автоматического форматирования строк

In [33]:
X, Y, Z = 43, 44, 45
S = 'Spam'
D = {'a': 1, 'b': 2}
L = [1, 2, 3]

In [34]:
F = open('./exercises/2_9/datafile.txt', 'w')     # Создает файл для записи
F.write(S + '\n')                 # Строки завершаются символом \n
F.write('%s,%s,%s\n' % (X, Y, Z)) # Преобразует числа в строки
F.write(str(L) + '$' + str(D) + '\n') # Преобразует и разделяет символом $
F.close()

In [35]:
chars = open('./exercises/2_9/datafile.txt').read()
chars

"Spam\n43,44,45\n[1, 2, 3]${'a': 1, 'b': 2}\n"

In [36]:
print(chars)

Spam
43,44,45
[1, 2, 3]${'a': 1, 'b': 2}



Чтобы преобразовать список и словарь в третьей строке файла, можно воспользоваться встроенной функцией `eval`, которая **интерпретирует строку как программный код на языке Python** (формально – строку, содержащую выражение на языке Python)

In [37]:
line = chars.split('\n')[2]
line

"[1, 2, 3]${'a': 1, 'b': 2}"

In [38]:
objects = [eval(P) for P in line.split('$')]
objects

[[1, 2, 3], {'a': 1, 'b': 2}]

### Сохранение объектов Python с помощью модуля `pickle`

Функция `eval`, использованная в  предыдущем примере для преобразования
строк в объекты, представляет собой мощный инструмент. И иногда даже слишком мощный. Функция **`eval` без лишних вопросов выполнит любое выражение на языке Python**, даже если в результате будут удалены все файлы в компьютере, если передать в выражение соответствующие права доступа!

Если вам действительно необходимо извлекать объекты Python из файлов, но вы не можете доверять источнику этих файлов, идеальным решением будет использование модуля **`pickle`**, входящего в состав стандартной библиотеки Python.

Модуль `pickle` позволяет сохранять в  файлах практически любые объекты
Python

In [39]:
D = {'a': 1, 'b': 2}

F = open('./exercises/2_9/datafile.pkl', 'wb')
import pickle
pickle.dump(D, F)  # Модуль pickle запишет в файл любой объект
F.close()

In [40]:
F = open('./exercises/2_9/datafile.pkl', 'rb')
E = pickle.load(F) # Загружает любые объекты из файла
E

{'a': 1, 'b': 2}

Модуль `pickle` выполняет то, что называется **сериализацией объектов**, – преобразование объектов в строку байтов и обратно, не требуя от нас почти никаких действий.

В действительности, внутренняя реализация модуля `pickle` выполнила преобразование нашего словаря в строку, при этом незаметно для нас (и может выполнить еще более замысловатые преобразования при использовании модуля в других режимах)

In [41]:
open('./exercises/2_9/datafile.pkl', 'rb').read()

b'\x80\x03}q\x00(X\x01\x00\x00\x00aq\x01K\x01X\x01\x00\x00\x00bq\x02K\x02u.'

Модуль **`shelve`** – инструмент, который использует модуль `pickle` для сохранения объектов Python в файлах с доступом по ключу

### Сохранение и интерпретация упакованных двоичных данных в файлах

В некоторых приложениях приходится иметь дело с  упакованными двоичными данными, которые создаются, например, программами на языке C.

Стандартная библиотека языка Python включает инструмент, способный помочь в этом, – модуль `struct`, который позволяет сохранять и восста-
навливать упакованные двоичные данные. В некотором смысле, это совершенно другой инструмент преобразования данных, интерпретирующий строки в файлах как двоичные данные.

Например, чтобы создать файл с упакованными двоичными данными, откройте его в режиме `'wb'` - запись двоичных данных и передайте модулю `struct` строку формата и некоторый объект Python.

В следующем примере используется строка формата, которая определяет пакет данных, содержащий:
* 4-байтовое целое число,
* 4-символьную строку
* и 2-байтовое целое число,

причем все представлены в формате big-endian – в порядке следования байтов «от старшего к младшему» (существуют также спецификаторы форматов, которые поддерживают наличие символов дополнения слева, числа с  плавающей точкой и многие другие):

In [42]:
F = open('./exercises/2_9/data.bin', 'wb') # Открыть файл для записи в двоичном режиме

import struct

data = struct.pack('>i4sh', 7, b'spam', 8) # Создать пакет двоичных данных
data

b'\x00\x00\x00\x07spam\x00\x08'

In [43]:
F.write(data)
F.close()

In [44]:
F = open('./exercises/2_9/data.bin', 'rb')
data = F.read()  # получить упакованные двоичные данные
data

b'\x00\x00\x00\x07spam\x00\x08'

In [45]:
values = struct.unpack('>i4sh', data)  # преобразовать в объекты
values

(7, b'spam', 8)

### Менеджеры контекста файлов

Менеджеры контекста в  основном применяются для обработки исключений, тем не менее они позволяют обертывать программный код, выполняющий операции с файлами, дополнительным слоем логики, который гарантирует, что после выхода за пределы блока инструкций менеджера файл будет закрыт автоматически, и позволяет не полагаться на автоматическое закрытие файлов механизмом сборки мусора

```
with open(r'data.txt') as myfile:
    for line in myfile:
        do smth
```

### Другие инструменты для работы с файлами

Функция `seek` переустанавливает текущую позицию в файле (для следующей операции чтения или записи),

функция `flush` принудительно выталкивает содержимое выходных буферов на диск (по умолчанию файлы всегда буферизуются) и так далее.

Следует также отметить, что функция `open` и объекты файлов, которые она возвращает, являются в языке Python основным интерфейсом к внешним файлам, однако в арсенале Python существуют и другие инструменты, напоминающие файлы.

Назовем некоторые из них:
* **Стандартные потоки ввода-вывода**

Объекты уже открытых файлов в модуле `sys`, такие как `sys.stdout`

* **Дескрипторы файлов в модуле `os`**

Целочисленные дескрипторы файлов, обеспечивающие поддержку низкоуровневых операций, таких как блокировка файлов

* **Сокеты, каналы и очереди (FIFO)**

Объекты, по своим характеристикам напоминающие файлы, используемые
для синхронизации процессов или организации взаимодействий по сети

* **Файлы с доступом по ключу, известные как «хранилища» («shelves»)**

Используются для хранения объектов языка Python по ключу

* **Потоки командной оболочки**

Такие инструменты, как `os.popen` и  `subprocess.Popen`, которые поддерживают возможность запуска дочерних процессов и выполнения операций с их стандартными потоками ввода-вывода

## Пересмотренный перечень категорий типов

* Над объектами одной категории могут выполняться одни и  те же операции, например над строками, списками и  кортежами можно выполнять операции для последовательностей, такие как конкатенация и  определение длины.


* Непосредственное изменение допускают только изменяемые объекты (списки, словари и множества) – вы не сможете непосредственно изменить числа, строки и кортежи.


* Файлы экспортируют только методы, поэтому понятие изменяемости к ним по-настоящему неприменимо – хотя они могут изменяться при выполнении операции записи, но это не имеет никакого отношения к ограничениям типов в языке Python.


* В категорию «Числа» в таблице входят все числовые типы: целые, вещественные, комплексные, фиксированной точности и рациональные.


* В категорию «Строки» в таблице входят строки типа `str`, а также `bytes`. Строковый тип `bytearray` относится к изменяемым типам.


* Множества напоминают словари, в которых ключи не имеют значений. Элементы множеств не отображаются на значения и неупорядочены, поэтому множества нельзя отнести ни к отображениям, ни к последовательностям. Тип `frozenset` – это неизменяемая версия типа `set`.


* Вдобавок к вышесказанному, в версиях Python 2.6 и 3.0 все типы, перечисленные в таблице, обладают методами, которые обычно реализуют операции, характерные для определенного типа.

| **Тип объектов** | **Категория** | **Изменяемый?** |
| --- | --- | --- |
| Числа (все) | Числа | Нет |
| Строки | Последовательности | Нет |
| Списки | Последовательности | Да |
| Словари | Отображения | Да |
| Кортежи | Последовательности | Нет |
| Файлы | Расширения | Неприменимо |
| Множества | Множества | Да |
| Фиксированные множества (frozenset) | Множества | Нет |
| bytearray | Последовательности | Да |

> **Придется держать в уме: перегрузка операторов**
>
> Объекты, реализованные с  помощью классов, могут свободно попадать в  любую из этих категорий.

Например, если нам потребуется реализовать новый тип объектов последовательностей, который был бы совместим со встроенными типами последовательностей, мы могли бы описать класс, который перегружает операторы индексирования и конкатенациии так далее.

Точно так же можно было бы создать новый изменяемый или неизменяемый объект, выборочно реализовав методы, вызываемые для выполнения операций непосредственного изменения (например, для выполнении операций присваивания `self[index] = value` вызывается метод `__setitem__`).

Существует также возможность выполнять реализацию новых объектов на других языках программирования, таких как C, в виде расширений. Чтобы определить выбор между множествами операций над числами, последовательностями и  отображениями, необходимо будет подставить указатели на функции C в ячейки структуры.

## Гибкость объектов

В этой части книги были представлены несколько составных типов объектов
(коллекции с компонентами).

В общем случае:
* Списки, словари и кортежи могут хранить объекты любых типов.
* Списки, словари и кортежи допускают произвольную вложенность.
* Списки и словари могут динамически увеличиваться и уменьшаться.

In [46]:
L = ['abc', [(1, 2), ([3], 4)], 5]
L[1][1][0][0]

3

## Ссылки и копии

При выполнении операции присваивания всегда сохраняется ссылка на объект, а не копия самого объекта.

В процессе выполнения операций присваивания может быть создано несколько ссылок на один и тот же объект, поэтому очень важно понимать, что изменения, произведенные в изменяемом объекте с помощью одной ссылки, отразятся и на других ссылках, указывающих на этот же объект.

Если такой порядок вещей является нежелательным, необходимо явно сообщить интерпретатору, чтобы он создал **копию объекта**.

In [47]:
X = [1, 2, 3]
L = ['a', X, 'b']
D = {'x': X, 'y': 2}

Появляется 3 ссылки на первый список:
* из переменной `X`,
* из элемента списка, соответствующего переменной `L`
* и из элемента словаря, соответствующего переменной `D`

Так как списки относятся к категории изменяемых объектов, изменения в объекте списка, произведенные с помощью любой из трех ссылок, также отразятся на других двух ссылках:

In [48]:
X[1] = 'surprise'

In [49]:
L

['a', [1, 'surprise', 3], 'b']

In [50]:
D

{'x': [1, 'surprise', 3], 'y': 2}

Когда действительно **необходимо создать копию объекта**, вы можете запросить их:

* Выражение **извлечения среза с пустыми пределами (`L[:]`)** создает **поверхностную** копию последовательности


* Метод словарей и множеств **`copy`** создает **поверхностную** копию словаря


* Некоторые встроенные функции, такие как `list`, создают копию списка (`list(L)`)


* **Модуль `copy`**, входящий в состав стандартной библиотеки, создает полные копии объектов

## Сравнивание, равенство и истина

**Любые объекты языка Python поддерживают операции сравнения**: проверка на равенство, относительная величина и так далее.

Операции сравнения в языке Python всегда проверяют все части составных объектов, пока результат не станет определенным. В действительности, при сравнивании вложенных объектов интерпретатор Python всегда автоматически выполняет обход структуры данных, чтобы применить операции сравнения рекурсивно, слева направо и  настолько глубоко, насколько это необходимо. Первое найденное различие определяет результат сравнения.

In [51]:
L1 = [1, ('a', 3)]  # # Разные объекты с одинаковыми значениями
L2 = [1, ('a', 3)]

L1 == L2, L1 is L2  # Равны? Это один и тот же объект?

(True, False)

Из-за природы ссылок в языке Python существует два способа проверки на равенство:

* **Оператор `==`** проверяет равенство значений. Интерпретатор выполняет проверку на равенство, рекурсивно сравнивая все вложенные объекты.


* **Оператор `is`** проверяет идентичность объектов. Интерпретатор проверяет, являются ли сравниваемые объекты одним и тем же объектом (то есть расположены ли они по одному и тому же адресу в памяти).

Но для некоторых объектов (малые целые числа, короткие строки), которые **кэшируются**, `is` тоже пройдет проверку

In [52]:
S1 = 'spam'
S2 = 'spam'
S1 == S2, S1 is S2

(True, True)

Операторы отношений к  вложенным структурам также применяются рекурсивно

In [53]:
L1 = [1, ('a', 3)]
L2 = [1, ('a', 2)]
L1 < L2, L1 == L2, L1 > L2 # Меньше, равно, больше: кортеж результатов

(False, False, True)

In [54]:
L1 = [1, ('a', 3)]
L2 = [('a', 2), 1]
L1 < L2, L1 == L2, L1 > L2 # Меньше, равно, больше: кортеж результатов

TypeError: '<' not supported between instances of 'int' and 'tuple'

In [55]:
[(1, 3), 50] < [(1, 40), 3]
# сравнивается слева направо, берется первый элемент и сравнивается
# до необходимой глубины

True

В общем случае Python сравнивает типы следующим образом:

* Числа сравниваются по величине.


* Строки сравниваются лексикографически, символ за символом (`'abc' < 'ac'`).


* При сравнении списков и кортежей сравниваются все компоненты слева направо.


* Словари сравниваются как отсортированные списки (ключ, значение). Словари в Python 3.0 не поддерживают операторы отношений, но они поддерживаются в версии 2.6 и ниже, при этом они сравниваются как отсортированные списки (ключ, значение).


* Попытка сравнить значения несопоставимых нечисловых типов (например, `1 < 'spam'`) в Python 3.0 вызывает ошибку. Зато такое сравнивание возможно в Python 2.6, однако при этом используется фиксированное и достаточно произвольно выбранное правило. То же относится и к операции сортировки, которая реализована на основе операции сравнения: коллекции значений нечисловых и несопоставимых типов в версии 3.0 отсортированы быть не могут.

### Сравнивание словарей в Python 3.0

В Python 3.0 поддержка операторов отношений в словарях была ликвидирована, потому что они оказываются слишком затратными, когда просто требуется узнать, равны ли словари (проверка на равенство в версии 3.0 выполняется по оптимизированному алгоритму, который по факту не сравнивает отсортированные списки пар ключ/значение).

Чтобы выяснить относительный порядок словарей в  версии  3.0, можно написать цикл и  вручную сравнить значения ключей или вручную создать отсортированные списки пар ключ/значение и сравнить их – для этого вполне достаточно будет задействовать метод словарей `items` и встроенную функцию `sorted`:

In [56]:
D1 = {'a': 1, 'b': 2}
D2 = {'a': 1, 'b': 3}
D1 == D2

False

In [57]:
D1 < D2

TypeError: '<' not supported between instances of 'dict' and 'dict'

In [58]:
list(D1.items())

[('a', 1), ('b', 2)]

In [59]:
sorted(D1.items())

[('a', 1), ('b', 2)]

In [60]:
sorted(D1.items()) < sorted(D2.items())

True

### Смысл понятий «истина» и «ложь» в языке Python

В языке Python, как в большинстве языков программирования, «ложь» представлена целочисленным значением `0`, а «истина» – целочисленным значением `1`.

Кроме того, **интерпретатор Python распознает любую пустую структуру данных как «ложь»**, а **любую непустую структуру данных – как «истину»**.

В более широком смысле понятия истины и лжи – это свойства, присущие всем объектам в Python, – каждый объект может быть либо «истиной», либо «ложью»:

* Числа, отличные от нуля, являются «истиной».
* Другие объекты являются «истиной», если они непустые.

In [61]:
for obj in ['spam', '', [], {}, 1, 0.0, None]:
    print(repr(obj), repr(True if obj else False), sep='\t')

'spam'	True
''	False
[]	False
{}	False
1	True
0.0	False
None	False


In [62]:
bool([[]])  # внешний список непустой - он содержит пустой список

True

### Объект `None`

В языке Python имеется также специальный объект с именем **`None`**, который всегда расценивается как «ложь».

Объект `None` – это единственный специальный тип данных в языке Python, который играет роль пустого заполнителя и во многом похож на указатель NULL в языке C.

Значение `None` не означает «неопределенный». То есть `None` – это не «ничто» (несмотря на свое имя!); это настоящий объект, занимающий определенную область памяти, с зарезервированным именем

### Тип `bool`

Логический тип `bool` просто усиливает понятия «истина» и «ложь» в языке Python.

Как мы узнали в главе 5, предопределенные имена `True` и `False` являются всего лишь разновидностями целых чисел `1` и `0`, как если бы этим двум зарезервированным именам предварительно присваивались значения 1 и 0.

Этот тип реализован так, что он действительно является лишь незначительным расширением к понятиям «истина» и «ложь», уже описанным, и предназначенным для того, чтобы сделать значения истинности более явными:

* При явном использовании слов `True` и `False` в операциях проверки на истинность они интерпретируются как «истина» и «ложь», которые в действительности являются специализированными версиями целых чисел 1 и 0.


* Результаты операций проверок также выводятся как слова `True` и `False`, а не как значения 1 и 0.

Кроме того, в языке Python имеется **встроенная функция `bool`**, которая может использоваться для проверки логического значения объекта

In [63]:
bool('spam')

True

In [64]:
bool([])

False

In [65]:
bool([[]])

True

## Иерархии типов данных в языке Python

>В языке Python все элементы являются объектами

<img src='./images/2_9_Hierarchy.png'>

**КОЛЛЕКЦИИ**:

* **Последовательности**
    * Неизменяемые
        * Строка (`str`)
        * Кортеж (`tuple)
        * Строки байтов (`bytes`)
    * Изменяемые
        * Список (`list`)
        * Массив байтов (`bytearray`)

* **Отображения**
    * Словарь
    
* **Множества**
    * Множество (`set`)
    * Фиксированное множество (`frozenset`)

**ЧИСЛА**:

* **Целые**
    * Целое (`int`)
    * Логическое (`bool`)

* **Вещественное** (`float`)
  
* **Комплексное** (`complex`)

* **Рациональное** (`Fractional`)

* **С фиксированной точностью** (`Decimal`)

**ВЫЗЫВАЕМЫЕ**:

* **Функции**
* **Генератор**
* **Класс**
* **Метод**

**Внутренние**:

* **Тип**
* **Код**
* **Кадр**
* **Диагностика**

**Прочие**:

* **Модуль**
* **Экземпляр**
* **Файл**
* **None**
* **Представление**

### Объекты типов

Фактически даже сами типы в языке Python являются разновидностью объектов: **объекты типов являются объектами типа `type`**

Вызов встроенной функции `type(X)` возвращает объект типа объекта `X`

Модуль `types`, входящий в  состав стандартной библиотеки, также предоставляет дополнительные имена типов, не являющиеся встроенными (например,типы функций) и предоставляет возможность проверять тип объекта с помощью функции `isinstance`.

In [66]:
type([1]) == type([]) # Сравнивание с типом другого списка

True

In [67]:
type([1]) == list # Сравнивание с именем типа

True

In [68]:
isinstance([1], list) # Список или объект класса, производного от list

True

In [69]:
import types  # В модуле types определены имена других типов

def f(): pass
type(f) == types.FunctionType

True

> Поскольку в современных версиях Python от типов можно порождать дочерние классы, рекомендуется не пренебрегать функцией `isinstance`

## Ловушки встроенных типов

### Операция присваивания создает ссылку, а не копию

In [70]:
L = [1, 2, 3]
M = ['X', L, 'Y']
M

['X', [1, 2, 3], 'Y']

In [71]:
L[1] = 0
M # Список M также изменяется

['X', [1, 0, 3], 'Y']

### Операция повторения добавляет один уровень вложенности

Операция повторения последовательности добавляет последовательность саму к себе заданное число раз. Это правда, но когда появляются вложенные изменяемые последовательности, эффект может не всегда получиться таким, как вы ожидаете.

Например, в  следующем примере переменной `X` присваивается список `L`, повторенный четырежды, тогда как переменной `Y` присваивается повторенный четырежды список, содержащий `L`

In [72]:
L = [4, 5, 6]
X = L * 4    # Все равно, что [4, 5, 6] + [4, 5, 6] + ...
Y = [L] * 4  # [L] + [L] + ... = [L, L,...]

In [73]:
X

[4, 5, 6, 4, 5, 6, 4, 5, 6, 4, 5, 6]

In [74]:
Y

[[4, 5, 6], [4, 5, 6], [4, 5, 6], [4, 5, 6]]

Так как во второй операции повторения `L` является вложенным списком, то в `Y` попадают ссылки на оригинальный список, связанный с именем `L`, вследствие чего начинают проявляться те же побочные эффекты, о  которых говорилось в предыдущем разделе:

In [75]:
L[1] = 0 # Воздействует на Y, но не на X

In [76]:
X

[4, 5, 6, 4, 5, 6, 4, 5, 6, 4, 5, 6]

In [77]:
Y

[[4, 0, 6], [4, 0, 6], [4, 0, 6], [4, 0, 6]]

Здесь можно применить то же решение, что и в предыдущем разделе, так как это в действительности всего лишь другой способ получить разделяемые ссылки на изменяемый объект. Если вы помните, операции повторения, конкатенации и извлечения среза создают только поверхностные копии объектов, что чаще всего и бывает необходимо.

### Избегайте создания циклических структур данных

На самом деле мы уже сталкивались с  этим понятием в предыдущем упражнении: если объект-коллекция содержит ссылку на себя, он называется циклическим объектом. Всякий раз, когда интерпретатор Python обнаруживает циклическую ссылку, он выводит `[...]`, чтобы не попасть в бесконечный цикл

In [78]:
L = ['grail']
L.append(L)
L

['grail', [...]]

Циклические структуры могут вызывать неожиданное зацикливание программного кода, если вы не все предусмотрели

### Неизменяемые типы не могут изменяться непосредственно

Наконец, вы не можете изменять неизменяемые объекты непосредственно.
Вместо этого создайте новый объект – с помощью операций извлечения среза, конкатенации и так далее, и присвойте, если это необходимо, первоначальной переменной:

In [79]:
T = (1, 2, 3)

In [80]:
T[2] = 4

TypeError: 'tuple' object does not support item assignment

In [81]:
T = T[:2] + (4,)
T

(1, 2, 4)