# Списки

В этой  лекции мы рассмотрим важный тип данных в Python: `списки`.

Он представляет собой последовательность объектов. Так же, как строка - это последовательность (то есть упорядоченная коллекция) символов, список - это последовательность произвольных объектов, называемых элементами. 

С помощью списков можно создать единый объект, содержащий множество других объектов. 

## Создание списка.

Списки создаются, помещением значений или выражений Python, разделенных запятыми в квадратные скобки.


In [1]:
my_list_1 = [1, 2, 3, 4]
type(my_list_1)

list

Заметьте, что хотя элементы списка являются `int`, тип списка - `list`. Фактически, любое выражение Python может быть внутри списка (включая другой список!).

In [2]:
my_list_2 = [1, 2.4, 'a string', ['a string in another list', 5]]
my_list_2

[1, 2.4, 'a string', ['a string in another list', 5]]

In [3]:
my_list_3 = [2+3, 5*3, 4**2]
my_list_3

[5, 15, 16]

Список `my_list_2` содержит int, float, string и другой список list. А третий список содержит выражения, которые вычисляются при создании списка.

Мы также можем создать список по преобразованию типов. Например, мы можем преобразовать строку в список символов.

In [4]:
my_str = 'A string.'
list(my_str)

['A', ' ', 's', 't', 'r', 'i', 'n', 'g', '.']

## Список операторов.

Операторы в списках ведут себя так же, как операторы для строк. Оператор `+` в списках означает конкатенацию списков.

In [5]:
[1, 2, 3] + [4, 5, 6]

[1, 2, 3, 4, 5, 6]

Оператор `*` в списках означает репликацию списка и конкатенацию.

In [6]:
[1, 2, 3] * 3

[1, 2, 3, 1, 2, 3, 1, 2, 3]

## Операторы проверки присутствия.

Операторы проверки присутствия в списке используются для определения того, находится ли элемент в списке. Используются два оператора:

|Действие|Оператор|
|---|---|
|присутствует в списке|in|
|отсутствует в списке|not in|

Результат работы операторов - True или False. Рассмотрим my_list_2 еще раз:

In [7]:
my_list_2 = [1, 2.4, 'a string', ['a string in another list', 5]]
1 in my_list_2

True

In [8]:
['a string in another list', 5] in my_list_2

True

In [9]:
'a string in another list' in my_list_2

False

In [10]:
7 not in my_list_2

True

## Индексирование списка.

Представьте, что мы хотим получить доступ к элементу в списке. 

Поскольку список упорядочен, мы можем запросить первый элемент, второй элемент, n-й элемент, последний элемент и т.д. Это делается с использованием обозначения скобок. 

Сначала мы пишем имя нашего списка, а затем в квадратных скобках записываем расположение (индекс) желаемого элемента:

In [11]:
my_list = [1, 2.4, 'a string', ['a string in another list', 5]]

my_list[1]

2.4

Заметьте, что индексирование в Python начинается с нуля. Это очень важно. (Историческая справка: [почему Python использует индексирование на основе 0](http://python-history.blogspot.com/2013/10/why-python-uses-0-based-indexing.html). )

## `Индексирование в Python начинается с нуля.`

Теперь, когда мы это знаем, давайте посмотрим на элементы в списке.

In [12]:
print(my_list[0])
print(my_list[1])
print(my_list[2])
print(my_list[3])

1
2.4
a string
['a string in another list', 5]


Мы также можем проиндексировать список, который находится внутри my_list, добавив еще один набор скобок.

In [13]:
my_list[3][0]

'a string in another list'

Итак, теперь у нас есть основы индексирования списков. Есть другие способы указать элементы в списке. Сейчас мы рассмотрим некоторые из них, но для этого нужно составить более простой список. Поэтому мы создадим список от нуля до десяти.

In [14]:
my_list = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

my_list[4]

4

Нам уже известно каким будет результат. Но также допускается использовать отрицательную индексацию! Это означает, что мы начинаем индексацию с последней записи, начиная с -1.

In [15]:
my_list[-1]

10

In [16]:
my_list[-3]

8

В этом примере прямые и обратные индексы элементов списка можно представить в виде таблицы:

|Элементы|0|1|2|3|4|5|6|7|8|9|10|
|---|---|---|---|---|---|---|---|---|---|---|---|
|прямые индексы|0|1|2|3|4|5|6|7|8|9|10|
|обратные индексы|-11|-10|-9|-8|-7|-6|-5|-4|-3|-2|-1|

## Нарезка списка.

А что, если мы хотим выделить несколько элементов в списке, это называется `нарезкой`? Для этого мы можем использовать двоеточие (`:`).

In [17]:
my_list[0:5]

[0, 1, 2, 3, 4]

Мы получили элементы от 0 до 4. При использовании индексации двоеточия my_list[i:j] мы получаем последовательность элементов от i до j-1, пропуская все остальные. 

Т.е. диапазон включает первый индекс и исключает последний. Если окончательный индекс среза больше длины последовательности, срез заканчивается на последнем элементе.

In [18]:
my_list[3:1000]

[3, 4, 5, 6, 7, 8, 9, 10]

Теперь мы также можем использовать отрицательные индексы с двоеточиями.

In [19]:
my_list[0:-3]

[0, 1, 2, 3, 4, 5, 6, 7]

Обратите внимание, что мы сместились к элементу с index = -4

Мы также можем указать шаг среза. Шаг следует после второго двоеточия. 

Например, если нам нужны только четные числа, мы могли бы сделать следующее.

In [20]:
my_list[0::2]

[0, 2, 4, 6, 8, 10]

Обратите внимание, что мы ничего не ввели для `end` значения среза. Если конец оставлен пустым, по умолчанию включается вся строка. 

Точно так же мы можем не указывать начальный индекс, так как по умолчанию он равен нулю.

In [21]:
my_list[::2]

[0, 2, 4, 6, 8, 10]

В целом схема индексации такова:

`my_list[start:end:stride]`

- Если двоеточий нет, возвращается один элемент.
- Если есть какие-либо двоеточия, мы разрезаем список, и список возвращается.
- Если есть одно двоеточие, stride предполагается равным 1.
- Если start не указано, предполагается, что он равен нулю.
- Если end не указан, интерпретируемый предполагает, что вам нужен весь список.
- Если stride не указано, предполагается, что он равен 1.

Мы даже можем использовать отрицательный шаг, что приведет к переворачиванию списка.

In [22]:
my_list[::-1]

[10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

Обратите внимание, что значение индексов «начало» и «конец» немного неоднозначно, когда у вас отрицательный шаг. Когда шаг отрицательный, мы все еще разрезаем от начала до конца, но затем меняем порядок. 

Рассмотрим еще несколько примеров:

In [23]:
print(my_list[2::2])
print(my_list[2:-1:2])
print(my_list[-2::-2])
print(my_list[-2:2:-2])
print(my_list[2:2:-2])

[2, 4, 6, 8, 10]
[2, 4, 6, 8]
[9, 7, 5, 3, 1]
[9, 7, 5, 3]
[]


Приходится много раздумывать, чтобы понять, что на самом деле представляют собой срезы. 

Совет: не используйте start, endи sliceвсе одновременно (даже если вы можете). Сначала сделайте шаг, а затем срез на отдельных линиях. 

Например, если бы нам нужны были только четные числа, но не первое и последнее (что делает вот это выражение `my_list[2:-1:2]`), мы бы сделали слудющее:

In [24]:
# Extract evens
evens = my_list[::2]

# Cut off end values
evens_without_end_values = evens[1:-1]

evens_without_end_values

[2, 4, 6, 8]

Это более подробный код, но его легче читать и понимать.

## Изменчивость.

Списки изменяемы. Это означает, что вы можете изменить их значения, не создавая новый список. (Вы не можете изменить тип данных или идентичность.) 

Давайте посмотрим на это на примере.

In [25]:
my_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
my_list[3] = 'four'

my_list

[1, 2, 3, 'four', 5, 6, 7, 8, 9, 10]

Другие типы данных, с которыми мы столкнулись до сих пор, int, float и str, неизменяемы. Вы не можете изменить их значения, не переназначив их. 

Чтобы увидеть это, мы воспользуемся функцией id(), которая сообщает нам, где в памяти хранится переменная (примечание: этот идентификатор уникален для интерпретатора Python, и его не следует рассматривать как фактический физический адрес в памяти.)

In [27]:
a = 689
print(id(a))

a = 690
print(id(a))

2654381553136
2654381553936


Итак, мы видим, что идентификатор `a`, целое число, изменился, когда мы попытались изменить его значение. Таким образом, мы фактически не изменили его значение; мы сделали новую переменную. Однако со списками дело обстоит иначе.

In [28]:
print(id(my_list))

my_list[0] = 'zero'
print(id(my_list))

2654381400256
2654381400256


Это все тот же список! Это очень важно учитывать при выполнении заданий на программирование.

## Ловушка: сглаживание.

`Псевдонимы` - это тонкая проблема, которая может возникнуть при назначении списков переменным. Давайте посмотрим на пример. 

Мы составим список, затем присвоим ему новую переменную (мы ошибочно будем думать как создание копии списка), а затем изменим значение записи в «скопированном» списке.

In [29]:
my_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
my_list_2 = my_list     # copy of my_list?
my_list_2[0] = 'a'

my_list_2

['a', 2, 3, 4, 5, 6, 7, 8, 9, 10]

Теперь давайте посмотрим на наш исходный список, чтобы увидеть, как он выглядит.

In [30]:
my_list

['a', 2, 3, 4, 5, 6, 7, 8, 9, 10]

Итак, мы видим, что присвоение списка переменной не копирует список! Вместо этого вы просто получаете новую ссылку на то же значение. Это может привести к появлению неприятной ошибки!

Есть способ избежать этой проблемы, используя фрагменты списка. 

Если не указаны и начальный индекс среза, и конечный индекс среза списка, срез является копией всего списка в новом фрагменте памяти.

In [31]:
my_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
my_list_2 = my_list[:]
my_list_2[0] = 'a'

my_list_2

['a', 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [32]:
my_list

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

Другой вариант - использовать тип данных, очень похожий на список, за исключением того, что он неизменяемый.