# Модель данных языка Python

Лекция основана на [официальной документации языка Python](https://docs.python.org/3/).

Все данные в Python абстрагируются при помощи **объектов** &mdash; базовых ячеек информации.

Каждый объект обладает *идентичностью* (не путайте с *идентификатором* - видом токенов), *типом* и *значением*.

**Идентичность** каждого объекта уникальна и не меняется в ходе программы. С её помощью можно отличать объекты друг от друга. Для этого используется оператор `is` и функция `id()`.

In [1]:
a = object() 
b = object()
c = a
print(id(a), id(b), id(c))
print(a is b)
print(a is c)

140190045999200 140190045998976 140190045999200
False
True


**Тип объекта** определяет, какие данные может содержать объект и какие доступны
операции над объектом. Как и идентичность, тип объекта не может меняться. Тип
объекта (который также является объектом) можно получить при помощи функции
`type()`.

In [2]:
a = 5
print(type(a))

<class 'int'>


**Значение** объекта может быть либо изменяемым (тогда объект называется
*мутабельным*), либо неизменяемым (тогда объект называется *иммутабельным*). 

Мутабельность объекта зависит от его типа: например, числа и строки являются
иммутабельными, а списки и словари &mdash; мутабельными.

Некоторые объекты могут содержать ссылки на другие объекты, такие объекты
называются *контейнерами*. Обычно под значением контейнера понимают не сами
ссылки на объекты, а значения этих объектов.

## Иерархия стандартных типов

Помимо типов, определяемых пользователем, язык Python имеет определенное
количество встроенных типов, доступных в каждой программе. Ниже представлены
некоторые из этих типов.

### NoneType

Тип `NoneType` включает в себя единственное значение `None`. Это
значение используется в случаях, когда нужно явно обозначить "отсутствие
значения" и является значением, возвращаемым функциями по умолчанию (если
функция не возвращает значения явно).

### Целочисленные типы

#### int

Значения типа `int` представляют собой целые числа в неограниченном диапазоне.
Самый простой способ создать объект типа `int` &mdash; целочисленный литерал.

In [3]:
my_int = 7
print(type(my_int))

<class 'int'>


#### bool

Тип `bool` включает в себя два значения: `True` и `False`, отражающие целые
числа 1 и 0 соответсвенно. Несмотря на то, что они могут быть использованы в
операциях с целыми числами, значения типа `bool` обычно отражают истинность или
ложность какого-либо условия.

In [7]:
cond = True
print(type(cond))
print(1 + True, type(1 + True))
print(2 * False, type(2 * False))

<class 'bool'>
2 <class 'int'>
0 <class 'int'>


### Рациональные и комплексные числа

Рациональные числа отражены типом `float`, создаваемые при помощи дробных литералов.

In [5]:
my_float = 3.14
print(type(my_float))

<class 'float'>


Комплексные числа отражены типом `complex` и создаются путем сложения других числовых и мнимых литералов.

In [6]:
my_complex = 42 + 3j
print(type(my_complex))

<class 'complex'>


### Последовательности

Последовательности представлены несколькими типами, отражающими конечные наборы
значений, индексируемые неотрицательными числами. Индексы последовательности
длины n содержат значения 0, 1, ..., n-1. Таким образом, первый элемент
последовательности имеет индекс 0, а последний &mdash; n-1.

Длину последовательности можно получить при помощи функции `len()`.

`i`-тый элемент последовательности `a` можно получить выражением `a[i]`.

In [9]:
my_list = [1, 2, 3] # один из видов последовательностей - список
print(type(my_list))
print(len(my_list))
print(my_list[0])

<class 'list'>
3
1


Для получения нескольких элементов последовательности используется *слайсинг*.
Слайсинг `[i:j]` создает новую последовательность того же типа, что и
оригинальная, и помещает в нее все элементы с индексом `k`, где `i <= k < j`.
Индексы в новой последовательности нумеруются заново с нуля.

In [20]:
a_lot_of_values = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
a_subset = a_lot_of_values[4:7] # будут выбраны элементы с индексами от 4 (включая) до 7 (не включая)
print(a_subset)
print(type(a_subset))

[4, 5, 6]
<class 'list'>


Слайсинг также поддерживает третий аргумент ("шаг") `[i:j:k]`, позволяющий брать только каждый k-тый элемент:

In [21]:
every_other_element = a_lot_of_values[0:10:2]
print(every_other_element)

[0, 2, 4, 6, 8]


Параметры слайсинга являются опциональными, при этом первый аргумент ("старт")
по умолчанию имеет значение `0`, что соответствует началу последовательности, а
второй аргумент ("стоп") &mdash; `n-1` (при длине последовательности `n` это
индекс последнего элемента).

Это позволяет переписать пример выше следующим образом:

In [22]:
every_other_element = a_lot_of_values[::2]
print(every_other_element)

[0, 2, 4, 6, 8]


Аргументы слайсинга также могут быть отрицательными.
Отрицательные "старт" и "стоп" трактуется как число элементов с конца последовательности:

In [24]:
print(a_lot_of_values[-1])      # выводим последний элемент
print(a_lot_of_values[-5:-2])   # выводим элементы с пятого по второй с конца (не включая правую границу).

9
[5, 6, 7]


На картинке ниже проиллюстрировано соответствие отрицательных индексов элементам массива.

![negative-indices](https://www.codingem.com/wp-content/uploads/2021/11/python-list-indexing.png)

Отрицательный "шаг" трактуется как проход по последовательности с конца:

In [28]:
print(a_lot_of_values[::-1])    # проход от конца до начала с шагом 1 (разворот последовательности)
print(a_lot_of_values[8:1:-2])  # проход от восьмого до первого элемента с шагом 2 

[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
[8, 6, 4, 2]


Тогда как все типы, описанные ранее, были только иммутабельными,
последовательности могут быть как мутабельными, так и иммутабельными.

#### Иммутабельные последовательности

Иммутабельные последовательности не могут быть изменены после создания, однако,
последовательности может содержать ссылки на другие объекты, которые в свою
очередь могут быть мутабельными. Таким образом, иммутабельность относится к
списку объектов, на которые ссылается последовательность, а не к их значениям.

##### Строки (str)

Строки представляют собой последовательность значений, отражающих символы
Unicode. При этом нет специального типа, отражающего одиночный символ &mdash;
каждое значение в строке представляет собой строку длины 1.

In [12]:
my_text = "hello world"
print(type(my_text))
print(len(my_text))
print(my_text[6])
print(type(my_text[6]))

<class 'str'>
11
w
<class 'str'>


##### Кортежи (tuple)

Элементами кортежей могут быть произвольные значения Python любых типов. Кортеж
образуется путем соединения двух или более значений запятыми. Для ясности можно
обернуть значения в скобки, хотя это необязательно. 

Кортеж из одного элемента можно создать, добавив к любому значению запятую. 
Для создания пустого кортежа достаточно пустых скобок (`()`)

In [18]:
tuple_of_2 = 1, 2
print("type:", type(tuple_of_2), "len:", len(tuple_of_2))

tuple_of_2_too = (1, 2)
print("type:", type(tuple_of_2_too), "len:", len(tuple_of_2_too))

singleton = 1,
print("type:", type(singleton), "len:", len(singleton))

empty = ()
print("type:", type(empty), "len:", len(empty))

type: <class 'tuple'> len: 2
type: <class 'tuple'> len: 2
type: <class 'tuple'> len: 1
type: <class 'tuple'> len: 0


Кортежи являются иммутабельными &mdash; из них нельзя удалять элементы или
добавлять в них новые. Тем не менее, сами значения кортежей могут быть
мутабельными.

In [29]:
my_tuple = (1, "abc", [1,2,3])  # кортеж my_tuple содержит список - мутабельную последовательность
print(my_tuple)

(1, 'abc', [1, 2, 3])


In [None]:
my_tuple[2] = 1                 # ошибка: кортеж нельзя изменить

In [30]:
my_tuple[2].append(4)           # сам список изменить можно
print(my_tuple)

(1, 'abc', [1, 2, 3, 4])


#### Мутабельные последовательности

Мутабельные последовательности могут быть изменены после создания.

Для нас интерес представляет только тип `list` &mdash; список произвольных
объектов Python.

Чтобы создать список, нужно обернуть список значений, разделенных запятыми,
квадратными скобками (`[]`). Для списков длины 1 или 0 специальный синтаксис не
нужен.

In [36]:
my_list1 = []
my_list2 = [1]
my_list3 = [1, 2, 3]
my_list4 = ["apple", True, [1, None]]   # значения списка могут быть разных типов (включая тип list!)

print(my_list3)
my_list3.append(4)                      # списки изменяются при помощи метода append()
print(my_list3)

[1, 2, 3]
[1, 2, 3, 4]


### Множества

Множества &mdash; тип данных, представляющий из себя неупорядоченный контейнер
уникальных иммутабельных элементов. Множества не дают возможности индексировать
свои элементы, но имеют длину и допускают проверку на наличие элемента в
множестве.

Существует два встроенных типа множеств: мутабельные (`set`) и иммутабельные
(`frozenset`).

In [33]:
my_set = {1, 2, 3}                  # мутабельное множество
print(my_set)

my_set.add(4)                       # добавление элемента в множество
print(my_set)

my_set_2 = set([1, 1, 1, 2, 2])     # построение множества из списка
print(my_set_2)

my_frozenset = frozenset([1, 2])    # иммутабельное множество
print(my_frozenset)

{1, 2, 3}
{1, 2, 3, 4}
{1, 2}
frozenset({1, 2})


### Отображения

Отображения включают в себя типы, отражающие набор объектов, индексируемых
произвольными ключами.

Существует один встроенный тип отображения: словарь `dict`.

Словари создаются при помощи фигурных скобок (`{...}`), но в отличие от
множеств, определение словаря включает в себя набор ключей (индексов) и
значений, разделенных двоеточиями:

In [38]:
my_dict = {"apples": 10, "oranges": 8}  # my_dict содержит два ключа
print(my_dict)
print(my_dict["apples"])
print(my_dict["oranges"])

{'apples': 10, 'oranges': 8}
10
8


Словари мутабельны: в них можно добавлять новые ключи, менять значения старых, а также удалять ключи полностью.

In [39]:
my_dict["apples"] = 11
my_dict["pears"] = 3
del my_dict["oranges"] # оператор del удаляет пару ключ-значение из словаря
print(my_dict)

{'apples': 11, 'pears': 3}


### Вызываемые объекты

Вызываемые объекты &mdash; это объекты, поддерживающие операцию *вызова*. К ним
относятся функции, методы, генераторы и еще несколько типов
объектов. Сегодня мы рассмотрим только функции и методы.

**Функция** &mdash; это объект, абстрагирующий какую-либо операцию. Функции (как
и все объекты вызываемых типов) могут как принимать какие-либо значения (они
называются *входными параметрами* или *аргументами*), так и возвращать (такие
значения называются *выходными параметрами* или просто *возвращаемыми
значениями*).

Функции делятся на пользовательские, создаваемые при помощи *определения
функции*, и встроенные в интерпретатор Python.

Мы уже сталкивались со встроенными функциями, когда использовали функции
`print()` (вывод на экран), `id()` (получение идентичности объекта) и `type()`
(получение типа объекта).

Определение функции состоит из ключевого слова `def`, идентификатора (имени)
функции, списка входных параметров в круглых скобках (может быть пустым), а
также двоеточего, после которого идет блок кода, в котором содержится набор
инструкций ("тело функции"). Эти инструкции исполняются каждый раз, когда
происходит вызов функции.

In [1]:
def greet():        # имя функции и список параметров (пустой, т.е. функция не принимает аргументов)
    print("hello world!")   # тело функции

После выполнения кода выше не происходит печати на экран! Мы только объявили
функцию с именем greet, но для ее выполнения требуется выполнить *вызов
функции*.

Вызов функции производится путем указания ее имени и передачи списка аргументов
между круглых скобок (если их нет - скобки должны быть пустыми).

In [2]:
greet() # вызов функции - после этой строки произойдет печать

hello world!


In [3]:
def add(a, b):   # функция add принимает два параметра: a и b
    res = a + b
    return res          # ключевое слово return позволяет вернуть значение из функции

c = add(1, 2)           # функция add вызвана с аргументами 1 и 2, 
                        # которые будут подставлены на место параметров a и b;
                        # возвращаемое значение записано в переменную c
print(c)

3


**Метод** &mdash; особый вид функции, привязанный к конкретному объекту. Список
доступных методов объекта определяется его типом и отображает набор операций,
которые можно осуществить над ним. Например, строки предоставляют методы
преобразования текста а списки &mdash; методы для мутации своих значений.

Для вызова метода требуется обратиться к объекту типа, определяющего этот метод,
передать имя метода через точку (`.`), а затем передать набор аргументов метода
в круглых скобках (как и в случае с функцией, он может быть пуст).

In [8]:
print("hello world".upper())    # метод строк upper() возвращает строку в верхнем регистре

a_list = [4,8,16]
a_list.append(32)               # метод списков append() добавляет значение в список
print(a_list)
print(a_list.index(16))         # метод списков index() возвращает индекс переданного элемента

HELLO WORLD
[4, 8, 16, 32]
2


Мы рассмотрим детали работы с функциями, методами и другими значениями вызываемых типов на дальнейших занятиях.

### Модули

Модули &mdash; базовые единицы организации кода на Python. Модули создаются
системой импорта модулей Python. О них мы поговорим на дальнейших занятиях.

### Классы и экземпляры класса

Пользователи языка могут создавать собственные типы данных, называемые
*классами*. 

Конкретные значения этих типов называются *экземплярами класса*. 

Об этих объектах мы поговорим на занятиях, посвященных объектно-ориентированному
программированию (ООП).