# Коллекции в Python

1. Список
1. Кортеж (immutable)
1. Множество
1. Словарь
1. Специализированные коллекции

## Список (List)

[Документация 1.](https://docs.python.org/3/tutorial/introduction.html#lists)

[Документация 2.](https://docs.python.org/3/tutorial/datastructures.html#more-on-lists)

In [1]:
# Объявление списка
list1 = []
list1

[]

In [2]:
list2 = [1,2,3,4]
list2

[1, 2, 3, 4]

In [3]:
# Традиционно в списках хранят элементы одного типа
# но Python также поддерживает хранение в списках
# элементов различных типов
list3 = [1, 2.5, True, "Строка"]
list3

[1, 2.5, True, 'Строка']

#### Индексирование списков (срезы, slices)

Очень похоже на индексирование строк.

Используется формат `список[начало:конец+1:шаг]`

In [4]:
str2 = list('строка')
str2

['с', 'т', 'р', 'о', 'к', 'а']

In [5]:
str2[0:2]

['с', 'т']

In [6]:
str2[1:2]

['т']

In [7]:
str2[:2]

['с', 'т']

In [8]:
# Отрицательное конечное значение
# означает что нужно убрать 
# заданное количество элементов
# начиная с конца списка
str2[:-1]

['с', 'т', 'р', 'о', 'к']

In [9]:
str2[2:]

['р', 'о', 'к', 'а']

In [10]:
str2[0:5:2]

['с', 'р', 'к']

In [11]:
str2[::2]

['с', 'р', 'к']

In [12]:
str2[::1]

['с', 'т', 'р', 'о', 'к', 'а']

In [13]:
# Отрицательный шаг 
# обходит список
# в обратном порядке
str2[::-1]

['а', 'к', 'о', 'р', 'т', 'с']

In [14]:
# Изменение значения элемента 
# или присваивание по индексу
# Списки в Python являются изменяемым (mutable) типов
print(str2[1])
str2[1] = '!!!'
print(str2[1])
str2

т
!!!


['с', '!!!', 'р', 'о', 'к', 'а']

In [15]:
# Присваивание по срезу
# Замена элементов
str2[1:3] = [100, 200]
str2

['с', 100, 200, 'о', 'к', 'а']

In [16]:
# Присваивание по срезу
# Замена и вставка элементов
str2[1:2] = [1000, 2000, 3000]
str2

['с', 1000, 2000, 3000, 200, 'о', 'к', 'а']

In [17]:
# Присваивание по срезу
# Только вставка элементов
# Элемент 111 становится пятым в списке
str2[5:5] = [111, 222, 333]
str2

['с', 1000, 2000, 3000, 200, 111, 222, 333, 'о', 'к', 'а']

##### Матрица

В Python нет отдельного типа данных для матриц, поэтому матрицы обычно объявляются в виде вложенных списков. Мы рассматриваем примеры для двухмерной матрицы, аналогичным образом можно использовать многомерные матрицы.

In [18]:
matrix1 = [[11, 12, 13], 
           [21, 22, 23], 
           [31, 32, 33]]
matrix1

[[11, 12, 13], [21, 22, 23], [31, 32, 33]]

In [19]:
# Можно получить отдельные элементы по индексам
# Вторая строка
matrix1[1]

[21, 22, 23]

In [20]:
# Второй элемент сторой строки
matrix1[1][1]

22

In [21]:
# Второй столбец
for i in range(3):
    print(matrix1[i][1])

12
22
32


In [22]:
# Присваивание
matrix1[1][1] = [100, 200, 300]
matrix1

[[11, 12, 13], [21, [100, 200, 300], 23], [31, 32, 33]]

In [23]:
matrix1[2][1:1] = [100, 200, 300]
matrix1

[[11, 12, 13], [21, [100, 200, 300], 23], [31, 100, 200, 300, 32, 33]]

Для работы с матрицами в современном Python используется библиотека [NumPy](https://numpy.org/).

#### Основные операции и методы списков 

In [24]:
# Добавление значений в хвост списка
list4 = []
for i in range(1, 11):
    list4.append(i)

list4

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

In [25]:
# Конкатенация списков
list5_1 = [1,2,3]
list5_2 = [4,5,6]
list5_3 = list5_1 + list5_2
list5_3

[1, 2, 3, 4, 5, 6]

In [26]:
[1,2,3] + [4,5,6]

[1, 2, 3, 4, 5, 6]

In [27]:
# Умножение (повторение) списков
list5_1 * 3

[1, 2, 3, 1, 2, 3, 1, 2, 3]

In [28]:
[1,2,3] * 3

[1, 2, 3, 1, 2, 3, 1, 2, 3]

In [29]:
# Длина списка
len(list5_1)

3

In [30]:
len(list5_3)

6

In [31]:
# Проверка наличия элемента
3 in [1,2,3]

True

In [32]:
4 in [1,2,3]

False

In [33]:
# Добавление элементов в конец списка
ext_list1 = [1,2,3]
ext_list1

[1, 2, 3]

In [34]:
ext_list1.extend([100,200,300])
ext_list1

[1, 2, 3, 100, 200, 300]

In [35]:
ext_list2 = [1,2,3]
ext_list2

[1, 2, 3]

In [36]:
ext_list2[len(ext_list2):] = [100,200,300]
ext_list2

[1, 2, 3, 100, 200, 300]

In [37]:
# Добавление элемента в заданную позицию
ins_list1 = [1,2,3]
ins_list1

[1, 2, 3]

In [38]:
ins_list1.insert(1,1000)
ins_list1

[1, 1000, 2, 3]

In [39]:
# Индекс элемента с заданным значением в списке
ind_list1 = [1000,1,2,3,4,1000,5,6,7,8,9,1000]

In [40]:
ind1 = ind_list1.index(1000)
'Первый раз элемент встречается в позиции {}'.format(ind1)

'Первый раз элемент встречается в позиции 0'

In [41]:
ind2 = ind_list1.index(1000, 1, 7)
'Между 1 и 7 позициями (начиная с 0) элемент встречается в позиции {}'.format(ind2)

'Между 1 и 7 позициями (начиная с 0) элемент встречается в позиции 5'

In [42]:
ind3 = ind_list1.index(1000, 8)
'После 8 позиции (начиная с 0) элемент встречается в позиции {}'.format(ind3)

'После 8 позиции (начиная с 0) элемент встречается в позиции 11'

In [43]:
# Количество элементов с заданным значением
cnt = ind_list1.count(1000)
'В списке элемент 1000 встречается {} раза'.format(cnt)

'В списке элемент 1000 встречается 3 раза'

In [44]:
# Изменение порядка следование элементов
rev_list1 = list('строка')
rev_list1

['с', 'т', 'р', 'о', 'к', 'а']

In [45]:
rev_list1.reverse()
rev_list1

['а', 'к', 'о', 'р', 'т', 'с']

In [46]:
# Создание копии списка
copy_list1 = [1,2,3]
copy_list1

[1, 2, 3]

In [47]:
copy_list2 = copy_list1.copy()
copy_list2

[1, 2, 3]

In [48]:
copy_list2[1] = 200
copy_list2

[1, 200, 3]

In [49]:
copy_list1

[1, 2, 3]

#### Сортировка списка

- Метод sort делает in-place сортировку
- Встроенная функция sorted создает новый список (рекомендуется к использованию)

In [50]:
sort_list1 = [1,6,3,2,7,5,4]
sort_list1

[1, 6, 3, 2, 7, 5, 4]

In [51]:
sort_list11 = sort_list1.copy()
sort_list11

[1, 6, 3, 2, 7, 5, 4]

In [52]:
sort_list1.sort()
sort_list1

[1, 2, 3, 4, 5, 6, 7]

In [53]:
sorted(sort_list11)

[1, 2, 3, 4, 5, 6, 7]

In [54]:
sort_list2 = list('ЙЦУКЕНГФЫВАПРОЛДЖ')
sort_list2

['Й',
 'Ц',
 'У',
 'К',
 'Е',
 'Н',
 'Г',
 'Ф',
 'Ы',
 'В',
 'А',
 'П',
 'Р',
 'О',
 'Л',
 'Д',
 'Ж']

In [55]:
sort_list21 = sort_list2.copy()
sort_list21

['Й',
 'Ц',
 'У',
 'К',
 'Е',
 'Н',
 'Г',
 'Ф',
 'Ы',
 'В',
 'А',
 'П',
 'Р',
 'О',
 'Л',
 'Д',
 'Ж']

In [56]:
sort_list2.sort(key=str.lower)
sort_list2

['А',
 'В',
 'Г',
 'Д',
 'Е',
 'Ж',
 'Й',
 'К',
 'Л',
 'Н',
 'О',
 'П',
 'Р',
 'У',
 'Ф',
 'Ц',
 'Ы']

In [57]:
sort_list2.sort(key=str.lower, reverse=True)
sort_list2

['Ы',
 'Ц',
 'Ф',
 'У',
 'Р',
 'П',
 'О',
 'Н',
 'Л',
 'К',
 'Й',
 'Ж',
 'Е',
 'Д',
 'Г',
 'В',
 'А']

In [58]:
sorted(sort_list21, key=str.lower)

['А',
 'В',
 'Г',
 'Д',
 'Е',
 'Ж',
 'Й',
 'К',
 'Л',
 'Н',
 'О',
 'П',
 'Р',
 'У',
 'Ф',
 'Ц',
 'Ы']

In [59]:
sorted(sort_list21, key=str.lower, reverse=True)

['Ы',
 'Ц',
 'Ф',
 'У',
 'Р',
 'П',
 'О',
 'Н',
 'Л',
 'К',
 'Й',
 'Ж',
 'Е',
 'Д',
 'Г',
 'В',
 'А']

#### Удаление элементов

1. Присвоение срезу пустого списка
1. Использование команды del
1. Использование метода clear()
1. Использование метода remove()

In [60]:
del_list1 = [1,2,3,4,5]
del_list1

[1, 2, 3, 4, 5]

In [61]:
del_list1[1:2] = []
del_list1

[1, 3, 4, 5]

In [62]:
del_list1[1:3] = []
del_list1

[1, 5]

In [63]:
del_list1[0:100] = []
del_list1

[]

In [64]:
del_list2 = [1,2,3,4,5]
del_list2

[1, 2, 3, 4, 5]

In [65]:
del_list2[0:] = []
del_list2

[]

In [66]:
del_list3 = [1,2,3,4,5]
del_list3

[1, 2, 3, 4, 5]

In [67]:
del_list3[:] = []
del_list3

[]

In [68]:
del_list4 = [1,2,3,4,5]
del_list4

[1, 2, 3, 4, 5]

In [69]:
del del_list4[1]
del_list4

[1, 3, 4, 5]

In [70]:
del del_list4[1:3]
del_list4

[1, 5]

In [71]:
# Полная очистка списка
del_list5 = [1,2,3,4,5]
del_list5

[1, 2, 3, 4, 5]

In [72]:
del del_list5[:]
del_list5

[]

In [73]:
del_list6 = [1,2,3,4,5]
del_list6

[1, 2, 3, 4, 5]

In [74]:
del_list6.clear()
del_list6

[]

In [75]:
# Удаление элемента с заданным значением
rmv_list1 = [100,200,200,300]
rmv_list1

[100, 200, 200, 300]

In [76]:
rmv_list1.remove(200)
rmv_list1

[100, 200, 300]

In [77]:
x = 500

try:
    rmv_list1.remove(x)
except ValueError:
    print('элемент {} не найден'.format(x))

элемент 500 не найден


#### Список в режиме стека

Использование метода pop(номер извлекаемого элемента). Элемент с указанным номером удаляется из списка и возвращается в качестве результата функции.

Если номер извлекаемого элемента не указан, то возвращается последний элемент в списке.

In [78]:
stack1 = [1,2,3]
stack1

[1, 2, 3]

In [79]:
stack1.append(4)
stack1

[1, 2, 3, 4]

In [80]:
while len(stack1) > 0:
    top = stack1.pop()
    print('Из стека извлечен элемент {}. Остаток стека {}.'.format(top, stack1))

Из стека извлечен элемент 4. Остаток стека [1, 2, 3].
Из стека извлечен элемент 3. Остаток стека [1, 2].
Из стека извлечен элемент 2. Остаток стека [1].
Из стека извлечен элемент 1. Остаток стека [].


#### Список в режиме очереди

In [81]:
queue1 = [1,2,3]
queue1

[1, 2, 3]

In [82]:
queue1.append(4)
queue1

[1, 2, 3, 4]

In [83]:
while len(queue1) > 0:
    top = queue1.pop(0)
    print('Из очереди извлечен элемент {}. Остаток очереди {}.'.format(top, queue1))

Из очереди извлечен элемент 1. Остаток очереди [2, 3, 4].
Из очереди извлечен элемент 2. Остаток очереди [3, 4].
Из очереди извлечен элемент 3. Остаток очереди [4].
Из очереди извлечен элемент 4. Остаток очереди [].


## Кортеж (Tuple)

[Документация.](https://docs.python.org/3/tutorial/datastructures.html#tuples-and-sequences)

В классических функциональных языках и списки и кортежи являются неизменяемыми (immutable) структурами. Списки хранят значения одного типа, а кортежи значения различных типов.

В Python списки являются изменяемыми (mutable) структурами, реализуют доступ по элементам и срезам и, фактически, выполняют функции массивов (в Java существует похожий тип ArrayList). В Python списки, как и кортежи, могут хранить информацию различных типов. В Python кортежи являются неизменяемыми (immutable) структурами, поэтому могут использоваться как ключи в словарях. 

Если проводить аналогии с реляционной таблицей, то список - это таблица (последовательность строк), а кортеж - это запись, соответствующая одной строке. Возможна такая структура данных как список вложенных кортежей.

Кортежи могут вложенными, то есть элементом кортежа может быть другой кортеж.

Для объявления кортежей в Python используются круглые скобки, но они необязательны.

In [84]:
tuple1 = 1, 2.34, True, 'string1'
tuple1

(1, 2.34, True, 'string1')

In [85]:
type(tuple1)

tuple

In [86]:
type(tuple1), tuple1

(tuple, (1, 2.34, True, 'string1'))

In [87]:
empty_tuple = ()
type(empty_tuple), empty_tuple

(tuple, ())

In [88]:
tuple2 = (1, 2.34, True, 'string1')
type(tuple2), tuple2

(tuple, (1, 2.34, True, 'string1'))

In [89]:
int1 = (123)
type(int1), int1

(int, 123)

In [90]:
tuple4 = (123,)
type(tuple4), tuple4

(tuple, (123,))

#### Преобразование из списков и в списки

In [91]:
list4_1 = [1,2,3]
tuple4_1 = tuple(list4_1)
type(tuple4_1), tuple4_1

(tuple, (1, 2, 3))

In [92]:
tuple4_2 = 1,2,3
type(tuple4_2), tuple4_2

(tuple, (1, 2, 3))

In [93]:
list4_2 = list(tuple4_2)
type(list4_2), list4_2

(list, [1, 2, 3])

#### Доступ к элементам

Поддерживается доступ по индексам и срезам, а также разыменование кортежей.

In [94]:
tuple1[1]

2.34

In [95]:
tuple1[1:4]

(2.34, True, 'string1')

In [96]:
i,f,b,s = tuple1

In [97]:
i

1

In [98]:
f

2.34

In [99]:
b

True

In [100]:
s

'string1'

In [101]:
i1,_,_,s1 = tuple1
i1,s1

(1, 'string1')

#### Основные операции и методы кортежей 

Поддерживается большинство операций и методов списков, которые не предполагают in-place действий.

In [102]:
1 in tuple1

True

In [103]:
2 in tuple1

False

In [104]:
tuple1 + tuple2

(1, 2.34, True, 'string1', 1, 2.34, True, 'string1')

In [105]:
tuple1 * 3

(1, 2.34, True, 'string1', 1, 2.34, True, 'string1', 1, 2.34, True, 'string1')

In [106]:
# TypeError: can only concatenate tuple (not "str") to tuple
# tuple1 + '123'

In [107]:
tuple1 + ('123',)

(1, 2.34, True, 'string1', '123')

In [108]:
# Кортежи являются неизменяемым типом 

#AttributeError: 'tuple' object has no attribute 'append'
#tuple1.append(123)

In [109]:
id(tuple1)

1883466013568

In [110]:
# Адрес изменился, так как кортежи - неизменяемый тип
id(tuple1 + ('123',))

1883465377408

In [111]:
mut_list = [1,2,3]
id(mut_list)

1883466203840

In [112]:
mut_list.append(4)
mut_list

[1, 2, 3, 4]

In [113]:
# Адрес не изменился, так как списки - изменяемый тип
id(mut_list)

1883466203840

In [114]:
# Индекс элемента с заданным значением в кортеже
ind_tuple1 = (1000,1,2,3,4,1000,5,6,7,8,9,1000)
type(ind_tuple1), ind_tuple1

(tuple, (1000, 1, 2, 3, 4, 1000, 5, 6, 7, 8, 9, 1000))

In [115]:
ind1 = ind_tuple1.index(1000)
'Первый раз элемент встречается в позиции {}'.format(ind1)

'Первый раз элемент встречается в позиции 0'

In [116]:
ind2 = ind_tuple1.index(1000, 1, 7)
'Между 1 и 7 позициями (начиная с 0) элемент встречается в позиции {}'.format(ind2)

'Между 1 и 7 позициями (начиная с 0) элемент встречается в позиции 5'

In [117]:
ind3 = ind_tuple1.index(1000, 8)
'После 8 позиции (начиная с 0) элемент встречается в позиции {}'.format(ind3)

'После 8 позиции (начиная с 0) элемент встречается в позиции 11'

In [118]:
# Количество элементов с заданным значением
cnt = ind_tuple1.count(1000)
'В кортеже элемент 1000 встречается {} раза'.format(cnt)

'В кортеже элемент 1000 встречается 3 раза'

In [119]:
len(ind_tuple1)

12

In [120]:
sort_tuple1 = tuple('ЙЦУКЕНГФЫВАПРОЛДЖ')
type(sort_tuple1), sort_tuple1

(tuple,
 ('Й',
  'Ц',
  'У',
  'К',
  'Е',
  'Н',
  'Г',
  'Ф',
  'Ы',
  'В',
  'А',
  'П',
  'Р',
  'О',
  'Л',
  'Д',
  'Ж'))

In [121]:
# in-place сортировка нерименима

# AttributeError: 'tuple' object has no attribute 'sort'
# sort_tuple1.sort(key=str.lower)

In [122]:
type(sort_tuple1), sort_tuple1

(tuple,
 ('Й',
  'Ц',
  'У',
  'К',
  'Е',
  'Н',
  'Г',
  'Ф',
  'Ы',
  'В',
  'А',
  'П',
  'Р',
  'О',
  'Л',
  'Д',
  'Ж'))

In [123]:
sort_tuple1_1 = sorted(sort_tuple1, key=str.lower, reverse=True)
type(sort_tuple1_1), sort_tuple1_1

(list,
 ['Ы',
  'Ц',
  'Ф',
  'У',
  'Р',
  'П',
  'О',
  'Н',
  'Л',
  'К',
  'Й',
  'Ж',
  'Е',
  'Д',
  'Г',
  'В',
  'А'])

## Множество (Set)

[Документация.](https://docs.python.org/3/tutorial/datastructures.html#sets)

Содержит только уникальные элементы.

Может использоваться для исключения дубликатов из списка.

In [124]:
set1 = {1,2,3,4,2,3}
type(set1), set1

(set, {1, 2, 3, 4})

In [125]:
set_list1 = [1,2,3,4,2,3]
type(set_list1), set_list1

(list, [1, 2, 3, 4, 2, 3])

In [126]:
set2 = set(set_list1)
type(set2), set2

(set, {1, 2, 3, 4})

In [127]:
class Num:
    
    def __init__(self, n):
        self.__n = n
        
    def __str__(self):
        return str(self.__n)
    
    def __repr__(self):
        return self.__str__()

In [128]:
set_list2 = [Num(1),Num(2),Num(3),Num(4),Num(2),Num(3)]

In [129]:
# Для объектов уникальность определяется по id
set3 = set(set_list2)
type(set3), set3

(set, {1, 2, 2, 3, 3, 4})

In [130]:
set([1,2,3]) == set([1,2,3])

True

In [131]:
set([Num(1),Num(2),Num(3)]) == set([Num(1),Num(2),Num(3)])

False

In [132]:
n1, n2, n3 = Num(1), Num(2), Num(3)
set([n1,n2,n3]) == set([n1,n2,n3])

True

#### Основные операции и методы множеств 

In [133]:
1 in set1

True

In [134]:
100 in set1

False

In [135]:
for i in set1:
    print(i)

1
2
3
4


In [136]:
s1 = set([1,2,3,4])
s2 = set([1,2,5,6])
s1, s2

({1, 2, 3, 4}, {1, 2, 5, 6})

In [137]:
# Разность
s1 - s2

{3, 4}

In [138]:
s2 - s1

{5, 6}

In [139]:
# Объединение множеств
s1 | s2

{1, 2, 3, 4, 5, 6}

In [140]:
# Пересечение множеств
s1 & s2

{1, 2}

In [141]:
# Симметрическая разность
s1 ^ s2

{3, 4, 5, 6}

In [142]:
# Добавление элемента в множество
print(s1)
s1.add(1000)
print(s1)

{1, 2, 3, 4}
{1, 2, 3, 4, 1000}


## Словарь (Dictionary)

[Документация.](https://docs.python.org/3/tutorial/datastructures.html#dictionaries)

Список пар ключ-значение. Ключи должны быть уникальны. Поддерживается большинство возможностей списков с учетом специфики ключ-значение.

Список можно считать частным случаем словаря, в котором роль ключа выполняет индекс элемента.

In [143]:
d1 = {1:100, 2:200, 3:300}
type(d1), d1

(dict, {1: 100, 2: 200, 3: 300})

In [144]:
# Ключи должны быть уникальны
d2 = {1:100, 1:200, 3:300, 333:333}
d2

{1: 200, 3: 300, 333: 333}

In [145]:
d1['key1'] = 'value1'
d1

{1: 100, 2: 200, 3: 300, 'key1': 'value1'}

In [146]:
type(d1.keys()), d1.keys()

(dict_keys, dict_keys([1, 2, 3, 'key1']))

In [147]:
type(d1.values()), d1.values()

(dict_values, dict_values([100, 200, 300, 'value1']))

In [148]:
type(d1.items()), d1.items()

(dict_items, dict_items([(1, 100), (2, 200), (3, 300), ('key1', 'value1')]))

In [149]:
for k,v in d1.items():
    print(k, '-->', v)

1 --> 100
2 --> 200
3 --> 300
key1 --> value1


In [150]:
# Не работает для словарей, используется метод update 
    
# TypeError: unsupported operand type(s) for +: 'dict' and 'dict'
# d1 + d2

In [151]:
d1.update(d2)
d1

{1: 200, 2: 200, 3: 300, 'key1': 'value1', 333: 333}

In [152]:
d1['key1'] = 'value2'
d1

{1: 200, 2: 200, 3: 300, 'key1': 'value2', 333: 333}

In [153]:
len(d1)

5

In [154]:
try:
    del d1['key1']
    print(d1, len(d1))
except KeyError as err:
    print('Не найден ключ {}'.format(err))

{1: 200, 2: 200, 3: 300, 333: 333} 4


In [155]:
try:
    del d1['key1']
    print(d1, len(d1))
except KeyError as err:
    print('Не найден ключ {}'.format(err))

Не найден ключ 'key1'


In [156]:
d1

{1: 200, 2: 200, 3: 300, 333: 333}

In [157]:
# Получение значения с использованием метода get
get1 = None
get1 = d1.get(1)
get1

200

In [158]:
print(d1.get(11111))

None


In [159]:
# Получение значения с удалением с использованием метода pop
print(d1.pop(1))
d1

200


{2: 200, 3: 300, 333: 333}

## Специализированные коллекции

В Python также предусмотрены специализированные коллекции, для решения отдельных задач.

[Документация.](https://docs.python.org/3/library/collections.html)

[Статья на русском языке с описанием коллекций.](https://pythonworld.ru/moduli/modul-collections.html)