## Последовательности и массивы

Наряду с рассмотренными нами ранее типами данных, связанных с хранением отдельных числовых или логических (булевых) значений, в языке `Python` также существует возможность определения типов данных, связанных с хранением целого набора значений. Такие типы данных носят общее название – **последовательности** (sequences).

К последовательностям относятся следующие типы:
1. `list` – список;
2. `tuple` – кортеж;
3. `string` – строка;
4. `set` – множество;
5. `dict` – словарь;
6. `range` – диапазон;
7. и иные типы.

## I. Списки

Списком называется некоторая последовательность элементов, длина которой (число элементов последовательности) может меняться.

Список задаётся с помощью пары \[квадратных\] скобок, внутри которых через запятую перечисляются элементы списка:

In [None]:
import math

# список-компот, содержащий данные разных типов
compote = ['a', 3, True, ['b', 2], math.pi]
type(compote)


list

### Общие правила работы со списками

1. Пара квадратных скобок указывает интерпретатору, что объекты, заключенные в них, должны рассматриваться как элементы списка.
2. Элементы списка отделяются друг от друга запятыми (лучше с пробелами).
3. Элементами списка могут быть данные *любого* типа и в любых комбинациях.
4. Списки могут быть вложены один в другой.

Последние два обстоятельства крайне важны: в список может быть записана совершенно любая величина. Интерпретатор автоматически отслеживает тип данных, заносимых в список, и хранит для каждого элемента указатель на область памяти, где хранится каждый элемент списка.

Списки относятся к **изменяемому** (mutable) типу данных! Это означает, что содержимое списка и его длина могут быть изменены: в список могут быть добавлены новые элементы, могут быть убраны или заменены отдельные или все элементы и т. д.

Для обращения к элементу списка используется имя переменной, в которой хранится список, после которой в квадратных скобках указывается индекс нужного элемента. Индексация любой последовательности в `Python` является целочисленной и начинается *с нуля*, а выход за пределы диапазона индексов приведёт к выводу сообщения об ошибке. Например:

In [None]:
# знаем, что в списке всего 5 элементов, но попробуем вывести шесть
for i in range(6):
    print(f'элемент № {i}: {compote[i]}')


элемент № 0: a
элемент № 1: 3
элемент № 2: True
элемент № 3: ['b', 2]
элемент № 4: 3.141592653589793


IndexError: list index out of range

Для обращения к элементам вложенного списка необходимо сначала обратиться к элементу основного списка, а затем в "соседних" квадратных скобках указать индекс элемента вложенного списка. Например:

In [None]:
print(compote)
print(compote[3])
print(compote[3][1])


['a', 3, True, ['b', 2], 3.141592653589793]
['b', 2]
2


### Срезы

Для перебора элементов списка, равно как и любой последовательности, могут быть использованы **срезы** (slicing). Срез – это заданный диапазон индексов последовательности, имеющий начало, конец и шаг. Срезы задаются при обращении к элементам последовательности следующим образом:

~~~python
lst[idx_start:idx_end:step]
~~~

В этой записи:
* `idx_start` – начальный индекс для перебора элементов
* `idx_end`   – конечный индекс
* `step`      – шаг, с которым будут перебираться элементы

Например, выражение вида:
~~~python
lst[3:15:2]
~~~
означает, что в списке `lst` должны быть перебраны элементы с третьего по пятнадцатый, причём должен быть взят *каждый второй* элемент. 

**N.B.**: Еще раз напомним, что нумерация в `Python` начинается с нуля! Кроме того, как и в уже рассмотренной нами ранее конструкции `range()`, **конечный элемент последовательности не включается** – т. е. в примере `lst[3:15:2]` на печать будут выведены элементы под номерами 3, 5, 7, 9, 11 и 13 (см. примеры ниже). Будьте внимательны!

В записи `idx_start:idx_end:step` обязательным элементом является только *первое двоеточие* `:`, все остальные элементы *необязательны*. Разные комбинации чисел и двоеточий дают разные критерии перебора элементов. Например:

* `:`    – перебор *всех* элементов последовательности;
* `::2`  – перебор элементов последовательности с шагом 2 (через один);
* `:5:2` – перебор элементов с нулевого по пятый (**не включительно**) через один;
* `1::`  – перебор всех элементов, кроме нулевого – аналогично записи `1:`.

Обратите внимание, что во всех этих случаях элементы будут выводиться в порядке возрастания номера индекса (слева направо). Таким образом, отсутствующий `idx_start` считается по умолчанию равным нулю, отсутствующий `idx_end` – равным длине списка (количеству элементов в нем), а `step` – равным *плюс единице*.

##### Полезно о срезах:
В качестве удобного способа запоминания правил работы со срезами можно представить себе список не в виде набора ячеек, а в виде одного длинного жесткого пенала, в котором есть ставные перегородки, пронумерованные от нуля до `n`, равного количеству элементов в списке.

Например, рассмотрим следующий список: `lst = ['P', 'y', 't', 'h', 'o', 'n']`. Тогда в представлении пенала с перегородками он будет иметь следующий вид:
~~~
 +---+---+---+---+---+---+
 | P | y | t | h | o | n |   <-- элементы списка
 +---+---+---+---+---+---+
 0   1   2   3   4   5   6   <-- номера "перегородок" между ячейками
~~~
    
Индексы в срезах указывают на перегородки. Выражение `lst[:2]` будет, фактически, означать: "выведи элементы, заключенные между перегородками под номерами 0 и 2", что даст результат `['P', 'y']`, а выражение `lst[1:5:2]` – результат `['y', 'h']`. Последний пример можно интерпретировать так: при задании шага, не равного единице, мы получаем не один непрерывный срез, как в предыдущем примере, а несколько срезов длиной в одну ячейку. Фактически, это выражение можно представить так:

~~~python
[lst[1:2], lst[3:4]]
#              ↑ сдвижка края следующего среза на 2 перегородки вправо
~~~

Третьего элемента в этом списке (`lst[5:6]`) не будет, поскольку наш срез должен уложиться в диапазон от 1 до 5 перегородки.

In [None]:
print(compote)

# срез с первого по третий элемент
print(compote[1:3])

# чтобы включить третий элемент, увеличим конечный индекс на единицу
print(compote[1:4])


['a', 3, True, ['b', 2], 3.141592653589793]
[3, True]
[3, True, ['b', 2]]


`Python` поддерживает использование отрицательных номеров элементов последовательности. В этом случае индексы отсчитываются в направлении "справа налево" – от последнего элемента к первому. Так, например, запись `lst[-1]` эквивалентна к обращению к последнему элементу списка.

Продолжая приведенный выше пример:

~~~
 +---+---+---+---+---+---+
 | P | y | t | h | o | n |   <-- элементы списка
 +---+---+---+---+---+---+
-6  -5  -4  -3  -2  -1       <-- номера "перегородок" между ячейками
~~~

Интерпретировать отрицательные индексы следует как указание вывести $n$-ый элемент с конца.

In [None]:
print(compote)
print(compote[-1])
print(compote[-1] is compote[4], '\n')

print(compote[-3:-1]) # обратите внимание на порядок!


['a', 3, True, ['b', 2], 3.141592653589793]
3.141592653589793
True 

[True, ['b', 2]]


 Важно помнить, что при направлении обхода в прямом направлении (слева направо):
 
 `idx_start` $\le$ `idx_end`, `step` $>$ `0`.
 
 При обратном направлении обхода, справа налево: `idx_start` $\ge$ `idx_end`, `step` $<$ `0`.

In [None]:
print(compote)
print(compote[-3:-5])
print(compote[-3:-5:-1])

print(compote[-3:])  # подумайте, почему получается такой результат


['a', 3, True, ['b', 2], 3.141592653589793]
[]
[True, 3]
[True, ['b', 2], 3.141592653589793]


### Функции для работы со списками

##### Функция `len()`
Для получения полного *числа элементов* списка используется функция `len()` (от length – длина). Не путать с номером последнего элемента: `len` выводит именно количество позиций в списке. Также обратите внимание, что `len` *не* считает число элементов во вложенных последовательностях – только в самом списке:

In [None]:
print(f'Всего в списке compote {len(compote)} элементов\n')

# модифицируем первый пример
for i in range(len(compote)):
    print(f'элемент № {i}: {compote[i]}')

print()
print(len(compote[-2]))  # мы знаем, что предпоследний – вложенный список


Всего в списке compote 5 элементов

элемент № 0: a
элемент № 1: 3
элемент № 2: True
элемент № 3: ['b', 2]
элемент № 4: 3.141592653589793

2


##### Функция `enumerate()`
Действие выше можно произвести и с помощью полезной функции `enumerate()` (буквально, "пересчитай") вместо `range()`. Данная функция возвращает список из пар (кортежей) "индекс–значение" для всех элементов последовательности (это справедливо не только для списков).

Для ее правильного применения нужно после ключевого слова `for` указать не одну, а две переменные: в первую (например, `i`) будет записываться индекс, а во вторую (например, `el`) – значение элемента, соответствующего этому индексу.

In [None]:
for i, el in enumerate(compote):
    print(f'элемент № {i}: {el}')


элемент № 0: a
элемент № 1: 3
элемент № 2: True
элемент № 3: ['b', 2]
элемент № 4: 3.141592653589793


Проверить наличие того или иного элемента в списке можно с помощью оператора `in`. Это также справедливо для других типов последовательностей.

In [None]:
print(2 in compote)
print(True in compote)
print('b' in compote)


False
True
False


### Создание и изменение списков

Для создания списков может быть использован целый ряд инструментов языка `Python`.

##### 1. Создание пустого списка

In [None]:
list1 = []
print('list1 =', list1, '\nlen =', len(list1))


list1 = [] 
len = 0


##### 2. Создание списка путём явного задания набора элементов

Этот случай мы уже рассмотрели выше

In [None]:
# мы можем также указывать имена переменных в качестве элементов списка
list2 = ['a', 2, list1]
print(list2)


['a', 2, []]


##### 3. Расширение списка путём добавления в него новых элементов

In [None]:
list3 = ['b']
list3 += list2
print(list3)


['b', 'a', 2, []]


Обратите внимание, что новый элемент добавлен в список путём выполнения операции **конкатенации** `+` – в конец списка `list3` добавлен список `list2` (не наоборот!). Другой операцией, которая может быть применена к списку, является операция **повторения** `*`:

In [None]:
list4 = [5] * 5
print(list4)


[5, 5, 5, 5, 5]


То же можно делать с помощью срезов: вставить подсписок, удалить подсписок или заменить подсписок.

In [None]:
list5 = list3 + list4
print(list5)

# добавление подсписка
# в позицию с индексом 3 вставится 2 элемента, остальные сдвинутся
list5[3:3] = [10, 0]
print(list5)

# удаление подсписка
list5[5:7] = []
print(list5)

# замена подсписка
# обратите внимание на разницу между заменой и вставкой
list5[6:] = ['e', 'h', 'HELLO!', 771]
print(list5)


['b', 'a', 2, [], 5, 5, 5, 5, 5]
['b', 'a', 2, 10, 0, [], 5, 5, 5, 5, 5]
['b', 'a', 2, 10, 0, 5, 5, 5, 5]
['b', 'a', 2, 10, 0, 5, 'e', 'h', 'HELLO!', 771]


##### 4. Использование выражений-генераторов

Выражения, которые называются генераторами списка, или **list comprehensions**, имеют вид цикла, заключенного в квадратные скобки. В качестве наглядного примера:

~~~python
list = [k**2 for k in range(7) if k > 2]
~~~

Записанное выражение содержит следующие элементы:
* значения, которыми должны быть инициализированы элементы списка, – `k**2`;
* цикл `for` для итеративного задания элементов `k` в пределах от 0 до 7 (не включительно);
* условие `if` для определения условия, при котором элемент должен создаваться – это **необязательный аргумент**.

Использование этих двух-трёх составляющих позволяет создавать компактные и гибкие выражения для создания элементов списка:

In [None]:
list6 = [k**2 for k in range(7) if k > 2]
print(list6)

list7 = [k*9//2 for k in range(10)]
print(list7)


[9, 16, 25, 36]
[0, 4, 9, 13, 18, 22, 27, 31, 36, 40]


##### 5. Использование встроенных методов для работы со списками

Как уже обсуждалось на предыдущем занятии, каждый тип данных, реализованный в `Python`, является отдельным классом, в котором реализованы возможности не только хранения, но и обработки данных, записанных в переменные, с использованием методов класса.

Для получения полного списка атрибутов класса, описывающего тип `list`, можно выполнить команду `dir(list)`:

In [None]:
print(dir(list))

['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']


На самом деле, данная функция довольно редко используется ввиду развитости современных сред разработки `Python`. Так, в Pycharm можно вывести описание конкретной функции или класса путем нажатия горячих клавиш `Ctrl`+`b`. Кроме того, гораздо информативнее функция `help(<класс или функция>)`, которая выводит документацию к интересующей команде в виде уже упомянутого на первом занятии объекта docstring, с описанием всех параметров.

Из множества представленных выше атрибутов нас будут интересовать те, что начинаются с латинской буквы. Ниже кратко перечислим их назначение. Пусть `lst` – это некоторый список, `a` – некая переменная. Тогда:

1.  `lst.append(a)`      – добавить элемент `a` в конец списка (последним элементом);
2.  `lst.clear()`        – очистить список;
3.  `lst.copy()`         – создать копию списка;
4.  `lst.count(a)`       – сосчитать количество вхождений элемента `a` в список;
5.  `lst.extend(a)`      – встроить `a` в список. Отличие от `append` заключается в том, что если `a` – это некая последовательность, то ее элементы будут записаны не как вложенный список, а станут продолжением списка `lst`;
6.  `lst.index(a)`       – получить индекс первого вхождения элемента `a` в списке;
7.  `lst.insert(idx, a)` – вставить элемент `a` на место с индексом `idx`. Элемент, изначально находившийся в ячейке с индексом `idx`, при этом *не будет удален*, а сдвинется вправо;
8.  `lst.pop(idx)`       – удалить из списка элемент с индексом `idx` и передать извлеченное значение на выход;
9.  `lst.remove(a)`      – удалить первое вхождение элемента `a` из списка;
10. `lst.reverse()`      – обратить последовательность элементов в списке;
11. `lst.sort()`         – отсортировать элементы в списке.

###### **N.B.**
Мы уже несколько раз упомянули слова *функция* и *метод* выше и в предыдущих лекциях. О том, что такое функция, вы узнаете на лекции 7, а о методах – на занятиях по объектно-ориентированному программированию (лекции 11 и 12). Пока, для исключения путаницы, скажем лишь следующее:

* Функция – это некий набор действий, выполняемых *над* объектом (или несколькими объектами), который имеет свое определенное имя и не привязан ни к какому объекту. Это самостоятельная единица кода, которая получает некий объект в качестве аргумента (в круглых скобках) и возвращает некое значение. Например, функция `type(a)` получает объект `a` и выдает его тип. Функция `enumerate(lst)` получает последовательность `lst` и выдает набор кортежей с перечислением элементов и индексов последовательности. Наконец, функция `print()` принимает некоторый набор объектов (в том числе и пустой) и выдает их на печать в требуемом виде.
* Метод – это некий набор действий, *ассоциированный* с объектом, работающий с данными, содержащимися в этом объекте, и выполняемый "*на*" нем. Методы всегда пишутся через точку после объекта, к которому они применяются, как это показано в перечислении выше. При этом они также могут принимать аргументы (например, метод `lst.index(a)`), но не могут быть вызваны без объекта.

В отличие от функций, которым в качестве аргумента можно передать любой объект (это может выдать ошибку внутри самой функции, но в принципе не запрещено) методы могут применяться на объектах *только тех классов, в которых они определены*. Например, названный выше метод `.sort()` нельзя применить к строкам или кортежам – он определен только для списков. Убедитесь в этом на примере ниже.

In [None]:
a = [4, 7, 1365, 88, 356, 2]
print(a)
a.sort()
print(a)

# попробуем отсортировать строку
b = 'btuktlds,fyilf'
b.sort()

[4, 7, 1365, 88, 356, 2]
[2, 4, 7, 88, 356, 1365]


AttributeError: 'str' object has no attribute 'sort'

Как видите, действие `a.sort()` не потребовало переприсваивания переменной `a` нового значения: метод произвел действие над объектом `a` и изменил его, ничего не выведя на экран. Если мы попробуем вручную попросить интерпретатор вывести результат действия метода `sort`, получим ровно "ничего":

In [None]:
print(a.sort())

None


Наконец, рассмотрим примеры приведенных выше методов:

In [None]:
list8 = [k**2 for k in range(7) if k > 2]
print(list8)

list8 *= 2  # обратите внимание на результат этой операции!
print(list8, end='\n\n')

list8.append([2, 3])
list8.extend([2, 3])
print('append and extend:')
print(list8, end='\n\n')

list8.pop(2)
print('pop:')
print(list8, end='\n\n')

list8.reverse()
print('reverse:')
print(list8, end='\n\n')

list8.remove([2, 3])
list8.sort()
print('remove and sort:')
print(list8)


[9, 16, 25, 36]
[9, 16, 25, 36, 9, 16, 25, 36]

append and extend:
[9, 16, 25, 36, 9, 16, 25, 36, [2, 3], 2, 3]

pop:
[9, 16, 36, 9, 16, 25, 36, [2, 3], 2, 3]

reverse:
[3, 2, [2, 3], 36, 25, 16, 9, 36, 16, 9]

remove and sort:
[2, 3, 9, 9, 16, 16, 25, 36, 36]


##### 6. Удаление элементов списка
Для этого, кроме уже упомянутого выше среза, может быть использована команда `del` с указанием диапазона элементов списка, которые должны быть удалены из него. При этом удаленные значения на вывод не передаются, в отличие от команды `pop`.

In [None]:
print(list8)
del list8[:3]
print(list8)


[2, 3, 9, 9, 16, 16, 25, 36, 36]
[9, 16, 16, 25, 36, 36]


### Хранение и работа с данными в списках

Обращение к элементам списка по указателю обладает рядом преимуществ, обеспечивающих удобство при использовании списков для хранения данных совершенно различных типов (как в случае `compote`, рассмотренного нами выше). Это удобство, однако, требует выделения значительных вычислительных ресурсов компьютера (время работы процессора, объём памяти, выделяемый машиной для хранения данных), что приводит к медленной работе программ, использующих списки для обработки больших объёмов данных. Другим ограничением списков при работе с данными является неудобство организации хранения многомерных данных, приводящее к необходимости создания громоздкой системы вложенных друг в друга списков.

Для решения этих проблем функционал `Python` был расширен новым типом данных – массивами `NumPy` и словарями. Массивы будут обсуждаться нами на следующих занятиях, а со словарями вы познакомитесь чуть ниже.

## II. Кортежи

Кортежом называется последовательность элементов фиксированной длины. Основное отличие кортежа от списка заключается в его неизменяемости (immutable). Единожды созданный кортеж будет сохранять свою структуру и содержимое до конца выполнения программы. Единственное изменение, которое может быть внесено в кортеж, – добавление (конкатенация) другого кортежа.

Для создания кортежа используется синтаксис, аналогичный заданию списков, но с заменой квадратных скобок на круглые:

In [None]:
test_tuple1 = ('a', 3.0, False, [2.0, 'c'])
test_tuple2 = ('b', 2.5, True)
print(test_tuple1, ' + ', test_tuple2, ' =')
print(test_tuple1 + test_tuple2)


('a', 3.0, False, [2.0, 'c'])  +  ('b', 2.5, True)  =
('a', 3.0, False, [2.0, 'c'], 'b', 2.5, True)


Обращение к элементам кортежа, перебор его элементов осуществляется так же, как и в случае списков:

In [None]:
print(test_tuple1[1])
print(test_tuple1[:])
print(test_tuple1[::-2])


3.0
('a', 3.0, False, [2.0, 'c'])
([2.0, 'c'], 3.0)


В некоторых случаях кортежи удобны для хранения, например, координат частиц в системе.

Действие многих функций и методов для кортежей аналогично случаю списков.

In [None]:
# допустим, у нас есть такой набор координат трех точек:
test_tuple3 = ((0.1, 3.0), (4.0, -0.5), (-5.0, 0.9))

for i, el in enumerate(test_tuple3):
    print(f'coordinates of point no. {i}: {el}')


coordinates of point no. 0: (0.1, 3.0)
coordinates of point no. 1: (4.0, -0.5)
coordinates of point no. 2: (-5.0, 0.9)


## III. Строки

Строка – это неизменяемый тип данных, предназначенный для хранения последовательностей символов и позволяющий проводить операции лишь между строками.

Для создания переменной типа "строка" используется следующий синтаксис:

In [None]:
test_string1 = 'abcde'
type(test_string1)


str

Символы, заключенные в пару одинарных или двойных кавычек, воспринимаются интерпретатором как строка. Одинарные ('строка') кавычки считаются предпочтительнее (не путать с апострофами (\`не строка\`)), но в любом случае нельзя смешивать одинарные и двойные кавычки для ограничения одной строки (хотя допустимы вложенные конструкции):

In [None]:
a = 'это строка'
b = "это тоже строка"
c = 'и "это" строка!'
d = "а вот это не строка...'


SyntaxError: EOL while scanning string literal (724163984.py, line 4)

Поскольку строка относится к последовательностям, к каждому ее элементу можно обратиться по индексу:

In [None]:
print('строка: ', test_string1, '\nиндексы:', end=' ')
for i in range(len(test_string1)):
    print(i, sep='', end='')

print('\n\ntest_string1[2] =', test_string1[2])


строка:  abcde 
индексы: 01234

test_string1[2] = c


Как и в случае со списками, к данным типа "строка" могут быть применены операции конкатенации и повторения:

In [None]:
print(test_string1)

test_string2 = test_string1 + 'fgh'
print(test_string2)

test_string3 = test_string1 * 2
print(test_string3)


abcde
abcdefgh
abcdeabcde


Срезы тоже прекрасно работают со строками:

In [None]:
print(test_string2)
print(test_string2[1::3])


abcdefgh
beh


Еще одно напоминание, что строка – это **НЕ**изменяемый тип данных:

In [None]:
test_string3[6:] = 'eh_HELLO!'


TypeError: 'str' object does not support item assignment

Посмотрите на результат операции ниже и попробуйте ответить на вопрос, почему такой вариант возможен.

In [None]:
test_string3 += 'ohmystring'
print(test_string3)


abcdeabcdeohmystring


Для работы со строками в языке `Python` реализован богатый спектр функций. Мы оставляем ознакомление с методами обработки строк для самостоятельной работы. :)

## IV. Множества

Множеством называется последовательность *уникальных* неизменяемых элементов.

Для создания множества используется команда `set()` или пара фигурных скобок (не путать со словарем, который мы рассмотрим ниже):

In [None]:
test_set1 = set(['a', 5.0, 3.0])
test_set2 = {'c', True, False}

print(type(test_set1), type(test_set2))


<class 'set'> <class 'set'>


Обратите внимание, что множество – собрание именно *уникальных*, т. е. не повторяющихся элементов – преобразование последовательности во множество удаляет из него повторяющиеся элементы:

In [None]:
test_set3 = {'a', 'a', 'a', 2.0}
print(test_set3)


{2.0, 'a'}


Множества содержат данные в неупорядоченном виде, поэтому обращение к отдельным элементам множества, как мы делали это в случае списков, кортежей и строк, невозможно. Основная функция множеств, наряду с хранением уникальных наборов элементов, состоит в реализации операций алгебры множеств.

## V. Словари

Словарём называется тип данных, в котором неупорядоченные элементы идентифицируются не по числовому индексу от нуля до `len(d)`, как в списках, кортежах и строках, а по произвольному **ключу**. По этой причине их также называют ассоциативными массивами или хеш-таблицами. Словари являются изменяемыми, поэтому в них можно добавлять элементы, удалять и менять после создания словаря.

Для задания словаря используется следующий общий синтаксис:
~~~python
dict1 = {key1: value1, key2: value2, key3: value3}
~~~
где `keyN` – ключи, а `valueN` – значения, ассоциированные с этими ключами.

**N.B.**: начиная с версии `Python` 3.7, словари считаются упорядоченными последовательностями – т. е. порядок элементов в них сохраняется при добавлении новых.

"Житейский" пример словаря:

In [None]:
group_population = {'Б21-201': 19, 'Б21-203': 18,
                    'Б21-204': 13, 'Б21-206': 5,
                    'Б21-211': 19, 'Б21-221': 17}


Чтобы обратиться к элементу словаря, нужно, так же, как и для списков, указать идентификатор элемента в квадратных скобках. Только в этом случае идентификатором служит ключ:

In [None]:
group_population['Б21-211']


19

Можно также создать пустой словарь и добавлять в него элементы явно, с указанием ключа. Для этого нужно сначала инициализировать пустой словарь командой `dict()`.

In [None]:
electron_parameters = dict()
electron_parameters['mass'] = 9.1e-31     # кг
electron_parameters['charge'] = -1.6e-19  # Кл
electron_parameters['type'] = 'fermion'
electron_parameters['antiparticle'] = 'positron'

print(electron_parameters)


{'mass': 9.1e-31, 'charge': -1.6e-19, 'type': 'fermion', 'antiparticle': 'positron'}


Команду `dict()` можно использовать и так:

In [None]:
# явное задание "КЛЮЧ = ЗНАЧЕНИЕ"
electron_parameters1 = dict(mass = 9.1e-31, charge = -1.6e-19)
print(electron_parameters1)

# список из кортежей (ключ, значение)
electron_parameters2 = dict([('type', 'fermion'), ('antiparticle', 'positron')])
print(electron_parameters2)


{'mass': 9.1e-31, 'charge': -1.6e-19}
{'type': 'fermion', 'antiparticle': 'positron'}


Ключом в словаре может служить любой **НЕ**изменяемый тип данных: числа, строки, кортежи. Значения же могут быть абсолютно любые – даже списки.

В словаре несколько разных ключей могут иметь одинаковые значения. А вот нескольких одинаковых ключей быть не может:

In [None]:
# обратите внимание, что ключи здесь указаны без кавычек...
dict1 = dict(a = 14, b = 754, c = 64, d = 0, e = 'e')
print(dict1)

# ... а здесь с кавычками! Попробуйте это поменять и посмотреть, что будет
dict1['c'] = 14
print(dict1)

# ключа f в словаре еще нет
dict1['f'] = 'one'
print(dict1)

# а теперь есть
dict1['f'] = 'two'
print(dict1)


{'a': 14, 'b': 754, 'c': 64, 'd': 0, 'e': 'e'}
{'a': 14, 'b': 754, 'c': 14, 'd': 0, 'e': 'e'}
{'a': 14, 'b': 754, 'c': 14, 'd': 0, 'e': 'e', 'f': 'one'}
{'a': 14, 'b': 754, 'c': 14, 'd': 0, 'e': 'e', 'f': 'two'}


Приведем несколько полезных функций и методов при работе со словарем:

In [None]:
print(len(dict1))      # количество элементов в словаре

print(dict1.keys())    # список ключей в словаре
print(dict1.values())  # список значений
print(dict1.items())   # список из кортежей ключ-число

print('f' in dict1)    # проверка, есть ли КЛЮЧ `f` в словаре


6
dict_keys(['a', 'b', 'c', 'd', 'e', 'f'])
dict_values([14, 754, 14, 0, 'e', 'two'])
dict_items([('a', 14), ('b', 754), ('c', 14), ('d', 0), ('e', 'e'), ('f', 'two')])
True


На первый взгляд кажется, что единственное отличие словарей от списков – это способ обращения к отдельным элементам, но это не так. На самом деле данные в них хранятся по-разному и время работы с ними сильно отличается.

Рассмотрим пример, демонстрирующий это. Пусть у нас есть список `lst` из тысячи случайных целых чисел, которые могут повторяться. Необходимо проанализировать этот список и вывести на печать информацию о том, сколько раз в этом списке встречается каждое число.

Рекомендуем вам тщательно разобраться с тем, как работает данный пример.

In [None]:
from time import time
from random import randint

# создадим набор данных: тысячу случайных чисел от 1 до 100000
lst = []
for i in range(1000):
    lst.append(randint(1, 10_000))

    
# сначала сделаем проверку с помощью вспомогательного списка
print("Начат анализ с помощью вспомогательного списка")
start_time = time()

# вспомогательный список, в котором будет храниться
# информация о количестве вхождений в список lst
aux = []
for el in lst:                 # перебираем все элементы списка
    for i in range(len(aux)):  # перебираем вспомогательный список
        if el == aux[i][0]:    # встречался ли нам уже такой элемент?
            aux[i][1] += 1     # если да, то увеличиваем счетчик на 1
            break              # дальше листать вспомогательный список не надо
    else:
        aux.append([el, 1])    # если не встречался, то делаем новую запись

end_time = time()
print("Анализ списка закончен")
print("процедура заняла:", end_time-start_time)
for el in aux:
    if el[1] > 2:  # для компактности выведем элементы с частотой 3 и выше
        print(f"Количество вхождений {el[0]} равно {el[1]}")


print()


# теперь с помощью вспомогательного словаря
print("Начат анализ с помощью вспомогательного словаря")
start_time = time()

# вспомогательный словарь, в котором будет храниться
# информация о количестве вхождений в список lst
aux = {}
for el in lst:                 # перебираем все элементы списка
    if el in aux:              # встречался ли нам уже такой элемент?
        aux[el] += 1           # если да, то увеличиваем счетчик на 1
    else:
        aux[el] = 1            # если не встречался, то делаем новую запись

end_time = time()
print("Анализ списка закончен")
print("процедура заняла:", end_time-start_time)
for el in aux.items():
    if el[1] > 2:  # для компактности выведем элементы с частотой 3 и выше
        print(f"Количество вхождений {el[0]} равно {el[1]}")


Начат анализ с помощью вспомогательного списка
Анализ списка закончен
процедура заняла: 0.058719635009765625
Количество вхождений 1841 равно 3
Количество вхождений 8639 равно 3
Количество вхождений 849 равно 3

Начат анализ с помощью вспомогательного словаря
Анализ списка закончен
процедура заняла: 0.0003044605255126953
Количество вхождений 1841 равно 3
Количество вхождений 8639 равно 3
Количество вхождений 849 равно 3


## VI. Диапазон
Диапазон – последовательность целочисленных элементов.

С диапазонами мы уже встречались ранее: они задаются при помощи команды `range()`:

In [None]:
range1 = range(-5, 10)

print(range1)
type(range1)


range(-5, 10)


range

Помните, что диапазон – не список. Он не хранит каждый элемент последовательности, а лишь "формулу", по которой каждый элемент можно вычислить. Тем не менее, обращение к конкретному элементу диапазона происходит по индексу – так же, как и для обычных последовательностей, рассмотренных нами ранее:

In [None]:
print(range1[3])
print(range1[-3])

# подумайте, что означает результат данной строки
print(range1[-1::-2])


-2
7
range(9, -6, -2)


## Преобразование последовательностей

В заключение заметим, что последовательности могут преобразовываться от одного типа к другому.

Примеры преобразований:

In [None]:
test_dict1 = {'a': 123, 'b': 456, 'c': 789, 'd': '000'}

dict_to_list = list(test_dict1)
print(dict_to_list)

list_to_tuple = tuple(dict_to_list)
print(list_to_tuple)

tuple_to_string = str(list_to_tuple)
print('---' + tuple_to_string + '---')  # '---' напишем для наглядности


['a', 'b', 'c', 'd']
('a', 'b', 'c', 'd')
---('a', 'b', 'c', 'd')---


Обратите внимание, что после преобразования кортежа в строку последняя содержит также и технические символы: скобки, запятые и точки:

In [None]:
tuple_to_string[::2]

"(a,'' c,''"

## Алгоритмы сортировки

Однородные данные, хранящиеся в изменяемых последовательностях, могут быть отсортированы. Для этого могут быть использованы как встроенные (в класс) методы (например, `str.sort()`, реализованный в списках), так и внешние функции.

Примером такой внешней функции является функция `sorted()`. Её использование позволяет применять сортировку к более широкому (чем списки) числу последовательностей:

In [None]:
list10 = [16, 45, 15, 45, 67, 9, 23, 15, 16, 66, 19, 1]
sorted_list = sorted(set(list10))
string10 = 'a quick brown fox jumps over the lazy dog'
sorted_string = sorted(string10)

print(list10)
print(sorted_list)
print()
print(string10)
print(sorted_string)


[16, 45, 15, 45, 67, 9, 23, 15, 16, 66, 19, 1]
[1, 9, 15, 16, 19, 23, 45, 66, 67]

a quick brown fox jumps over the lazy dog
[' ', ' ', ' ', ' ', ' ', ' ', ' ', ' ', 'a', 'a', 'b', 'c', 'd', 'e', 'e', 'f', 'g', 'h', 'i', 'j', 'k', 'l', 'm', 'n', 'o', 'o', 'o', 'o', 'p', 'q', 'r', 'r', 's', 't', 'u', 'u', 'v', 'w', 'x', 'y', 'z']


Будьте внимательны при сортировке:
* Все прописные буквы идут левее всех строчных.
* В примере ниже `a0015` оказалось "меньше", чем `a1`! Строки сравниваются поэлементно: `0` имеет меньший ASCII-индекс, чем `1`, поэтому первый вариант оказывается "левее" при сортировке.
* Невозможно сравнивать элементы смешанных типов данных – это приведет к ошибке.

In [None]:
strange_list = ['a', 'b', 'b20', 'b1', 'a1', 'a10', 'a11', 'A',
                'A1', 'A110', 'B1', 'B100', 'C', 'a0015', 'b0005']
print(sorted(strange_list))

another_strange_list = ['a', 123, 'bbb', 56, (1, 234)]
sorted(another_strange_list)


['A', 'A1', 'A110', 'B1', 'B100', 'C', 'a', 'a0015', 'a1', 'a10', 'a11', 'b', 'b0005', 'b1', 'b20']


TypeError: '<' not supported between instances of 'int' and 'str'

## Фунции случайных чисел для работы с последовательностями

На предыдущем занятии мы рассмотрели функции, реализованные в модуле `Random` для работы со случайными числами. Наряду с ними, в модуле реализованы функции для работы с последовательностями.

Для подключения модуля, напомним, используется инструкция:

~~~python
import random
~~~

Ниже собраны некоторые из функций для работы с последовательностями

|Функция | Результат выполнения |
|:-|:-|
| `random.choice(a)` | случайный элемент последовательности `a` |
| `random.sample(a, n)` | список, содержащий случайный набор из `n` элементов последовательности `a` |
| `random.shuffle(a)` | функция не возвращает ничего, а элементы последовательности `a` перемешиваются cлучайным образом |

In [None]:
# выбор случайного элемента последовательности
import random

a = (2, 5, True, 'a')
b = random.choice(a)
print(b)


True


In [None]:
# выбор случайной последовательности элементов
import random

a = [2, 5, True, 'a']
b = random.sample(a, 2)
print(b)


[2, 'a']


In [None]:
# перемешивание элементов изменяемой последовательности
import random

a = [2, 5, True, 'a']
random.shuffle(a)
print(a)

# при попытке перемешать элементы неизменяемой (tuple)
# или неупорядоченной (set) последовательности интерпретатор выдаст ошибку
a = (2, 5, True, 'a')
random.shuffle(a)
print(a)

a = set([2, 5, True, 'a'])
random.shuffle(a)
print(a)


[True, 5, 2, 'a']


TypeError: 'tuple' object does not support item assignment