# Структуры

В этом ноутбуке рассмотрим основные структуры данных в Python: кортежи (tuples) и списки (lists). Именно с помощью этих структур можно эффективно оперировать многомерными численными и текстовыми данными, хранить их и преобразовывать. Освоение этих структур позволит вам в будущем более комфортно оперировать с комплексными таблицами и датасетами, решать более сложные задачи и осуществлять более комплексный анализ.

## Порядок работы с ноутбуком

Внимательно прочтите содержимое ячеек сверху вниз. Перед выполнением ячейки с кодом попробуйте заранее предугадать, что она выведет, а затем проверить себя. Внимательно изучите вывод каждой ячейки (или ошибку, которую она выводит). Если в ячейке есть ввод данных пользователем и ветвление, разными вводами добейтесь всех возможных выводов. Не бойтесь экспериментировать и пробовать "поломать" содержимое ячейки, проверив код на прочность — через такие эксперименты проще понять, что делать можно, а что нельзя.

В конце этого и каждого последующего ноутбука находятся упражнения для самостоятельного решения. Вы можете переходить сразу к ним, если знаете про все перечисленные ниже

## Ключевые понятия:
- Упорядоченные коллекции
- Списки и их создание
- Инструкция `del` и метод `.append()`
- Изменяющие список методы и возвращающие значение
- Особенности присваивания и копирования списков, функция `id()`
- Кортежи. Множественное присваивание
- Функции преобразования типов `str()`, `list()` и `tuple()`


## Строки как упорядоченные коллекции
В прошлом ноутбуке мы рассмотрели работу со строками. Напомним синтаксис для **индексации** и **срезов**:

In [None]:
major = 'Астрометрия'
k = 8
print(major[0]) # показать первый символ
print(major[k]) # показать k-тый символ
print(major[-1]) # показать последний символ
print(major[-k]) # показать -k-тый символ

In [None]:
print(major[0:5]) # элементы с первого по пятый
print(major[:5]) # аналогично, опускаем индекс первого элемента
print(major[3:6]) # элементы с четвертого по шестой
print(major[-6:-2]) # элементы с 6 с конца до 2 с конца
print(major[-2:]) # элементы с 2 с конца до конца, опускаем индекс последнего элемента

In [None]:
print(major[::2]) # каждый нечетный элемент
print(major[1::2]) # каждый четный элемент
print(major[::-1]) # развернуть строку задом наперед

Индексация помогает вытащить из строки один или несколько её элементов. Однако, заменить элементы в строке таким образом не получится, поскольку строка является **неизменяемым** (immutable) типом данных:

In [None]:
major = 'Астрометрия'
major[0] = 'а' # ошибка TypeError!

Необходимо создавать новую строку. Есть ли такие коллекции, которые можно менять *на месте*?

## Списки, их создание и методы
Список (`list`) — это один из ключевых типов данных в Python. Мы немного упоминали его, когда говорили про тип объекта, возвращаемый строковым методом `.split()`, разбивающим строку по разделителю.

Он **изменяемый** (mutable), и может содержать внутри себя любые типы данных, в том числе и другие списки.

Создать список можно, перечислив его элементы в квадратных скобках:

In [None]:
numbers = [True, 'два', 3] # разный тип данных внутри

print(numbers[0]) # аналогичная индексация
print(numbers[-1])
print(numbers[1:])
print(numbers[::-1])

Изменять элементы внутри списка можно по индексу:

In [None]:
numbers = [True, 'два', 3] 
numbers[1] = 2
numbers

Удалять элементы из списка можно инструкцией `del`:

In [None]:
numbers = [True, 'два', 3]
del numbers[1]
numbers

Добавление элемента в конец списка осуществляется списочным методом `.append()`. Обратите внимание, что для этого не нужно создавать новый список.

Например, так можно считать у пользователя список из 5 чисел:

In [None]:
numbers = [] # создаем пустой список
for i in range(5): # 
    numbers.append(int(input())) # добавляем элемент, если он ненулевой
print(numbers)

## Основные операции и методы коллекций. Методы списков

Как и в случае строк, у списков есть богатый набор методов и функций работы с ними.

В этой таблице приведены операции, которые работают как со строками, так и со списками (и любыми другими упорядоченными коллекциями):

| Метод (коллекция не меняется)| Описание                                                                   | Пример (показывается вывод)         |
|------------------------------|----------------------------------------------------------------------------|-------------------------------------|
| `x in s`                     | Проверка вхождения элемента `x` в список `s`                               | `5 in [3, 6, 5]` → `True`           |
| `x not in s`                 | Проверка отсутствия элемента `x` в списке `s`                              | `5 not in [3, 6, 5]` → `False`      |
| `x + s`                      | Вернуть новый список, объединив списки `x` и `s`                           | `[1, 3] + [5, 6]` → `[1, 3, 5, 6]`  |
| `s * n (или n * s)`          | Вернуть новый список из `n` списков `s` подряд                             | `[1, 3] * 3` → `[1, 3, 1, 3, 1, 3]` |
| `len(s)`                     | Вернуть количество элементов в списке `s`                                  | `len([0, 5, 3, 1])` → `4`           |
| `min(s)`                     | Вернуть наименьший элемент в списке `s`                                    | `min([0, 5, 3, 1])` → `0`           |
| `max(s)`                     | Вернуть наибольший элемент в списке `s`                                    | `max(['a', 'b', 'd', 'c'])` → `'d'` |
| `sorted(s, reverse=False)`   | Вернуть отсортированный список (`reverse=True` для сортировки по убыванию) | `sorted([3, 1, 2])` → `[1, 2, 3]`   |
| `s.index(x[, start[, end]])` | Вернуть индекс первого вхождения элемента `x` в список `s`                 | `[1, 2, 3].index(2)` → `1`          |
| `s.count(x)`                 | Вернуть количество раз, которое элемент `x` встречается внутри списка      | `[1, 2, 2, 3].count(2)` → `2`       |
| `s.copy()`                   | Вернуть копию списка                                                       | `[1, 2, 3].copy()` → `[1, 2, 3]`    |

А здесь приведены уникальные для списков методы, которые меняют сам список на месте:

| Метод (изменяет список)       | Описание                                                                   | Пример (показывается содержание списка) |
|-------------------------------|----------------------------------------------------------------------------|-----------------------------------------|
| `s.append(x)`                 | Добавить `x` в конец списка `s`                                            | `[1, 2].append(3)` → `[1, 2, 3]`        |
| `s.clear()`                   | Очистить список                                                            | `[1, 2, 3].clear()` → `[]`              |
| `s.extend(t) или s += t`      | Расширить список, добавив в его конец элементы из `t`                      | `[1, 2].extend([3, 4])` → `[1, 2, 3, 4]`|
| `s.insert(i, x)`              | Вставить `x` в список, чтобы его индекс был `i`                            | `[1, 3].insert(1, 2)` → `[1, 2, 3]`     |
| `s.pop(i)`                    | Убрать из `s` и вывести элемент по индексу `i` (последний по-умолчанию)    | `[1, 2, 3].pop()` →  `[1, 2, 3]`        |
| `s.remove(x)`                 | Убрать первое вхождение элемента `x`                                       | `[1, 2, 3].remove(2)` → `[1, 3]`        |
| `s.reverse()`                 | Инвертировать список                                                       | `[1, 2, 3].reverse()` → `[3, 2, 1]`     |
| `s.sort(reverse=False)`       | Отсортировать список (по-умолчанию по возрастанию)                         | `[3, 1, 2].sort()` → `[1, 2, 3]`        |

## Особенности присваивания и копирования изменяемых типов, функция `id()`

Мы уже рассмотрели как минимум 5 типов данных: `int`, `float`, `bool`, `str` и `list`.

Вообще, при создании переменной в неё записывается не сколько сами данные, сколько ссылка на участок памяти. Разным переменным присваиваются разные уникальные ссылки-идентификаторы, которые не сохраняются от запуска к запуску.  

При перезаписывании переменной новым **значением**, идентификатор тоже меняется. 

Однако, оператор присваивания `=` при создании новой переменной **не создает новый идентификатор, а использует тот же самый.**. Эта связь

Посмотреть такой идентификатор для любого объекта Python можно с помощью функции `id()`. Посмотрим, как работает идентификаторы для неизменяемых типов:

In [None]:
x = 5
width = 40
print(f"{"Исходный идентификатор x:":{width}} {id(x)}")
x = '5' # попробуйте заменить '5' на 5 и посмотреть на изменения
print(f"{"Идентификатор x после перезаписи данных:":{width}} {id(x)}") # идентификатор изменился, потому что указывает на другой участок памяти
y = x
print(f"{"Идентификатор y = x:":{width}} {id(y)}") # а тут не поменялся, потому что y указывает на x
x = 6 # однако, перезапись исходной переменной уже ломает эту связь
print(f"{"Идентификатор x после перезаписи x:":{width}} {id(x)}") # поменялся
print(f"{"Идентификатор y после перезаписи x:":{width}} {id(y)}") # не изменился

Другая ситуация с изменяемым типом `list`. 

Операция присваивания `=` **со значением справа** заменит идентификатор в любом случае.

Методы, изменяющие список, **не изменят его идентификатор**. 

При присваивании одной переменной к другой (когда и слева, и справа от `=` стоят переменные), присваиваются не значения, а ссылки на память. Поэтому изменение одной переменной влечет за собой изменение другой:

In [None]:
x = [1, 2, 3]
width = 40
print(f"{"Исходный идентификатор x:":{width}} {id(x)}")
x = [1, 2, 3]
print(f"{"Идентификатор x после перезаписи данных:":{width}} {id(x)}") # идентификатор изменился, потому что указывает на другой участок памяти
y = x
print(f"{"Идентификатор y = x:":{width}} {id(y)}") # а тут не поменялся, потому что y указывает на x
print("Добавляем к списку x 4 через .append")
x.append(4) # изменим исходный список
print("Содержание x:", x)
print(f"{"Идентификатор x после перезаписи x:":{width}} {id(x)}") # идентификатор не изменился
print(f"{"Идентификатор y после перезаписи x:":{width}} {id(y)}") # идентификатор переменной y тоже не поменялся
print("Содержание y:", y) # содержание переменной y уже другое!
print("Добавляем к списку y 5 через .append")
y.append(5) # аналогичная история с y. x и y стали буквально синонимами
print("Содержание x:", x)
print(f"{"Идентификатор x после перезаписи x:":{width}} {id(x)}") # идентификатор не изменился
print(f"{"Идентификатор y после перезаписи x:":{width}} {id(y)}") # идентификатор переменной y тоже не поменялся
print("Содержание y:", y) # содержание переменной y уже другое!

Как тогда создать копию списка `x`, "отвязанную" от исходного списка? Тут и приходит на помощь метод `x.copy()`:

In [None]:
x = [1, 2, 3]
y = x.copy()
x.append(4)
y.append(5)
print("x =", x)
print("y =", y)
print(f"{"id(x) =":} {id(x)}") # 
print(f"{"id(y) =":} {id(y)}") # 

Ещё один вариант — использовать полный срез `x[:]`:

In [None]:
x = [1, 2, 3]
y = x[:]
x.append(4)
y.append(5)
print("x =", x)
print("y =", y)
print(f"{"id(x) =":} {id(x)}") # 
print(f"{"id(y) =":} {id(y)}") # 

**Внимание:** будьте аккуратны с созданием и копированием двумерных массивов — они копируются только **поверхностно**, создавая новый идентификатор для внешнего списка, но не создавая для внутреннего.

In [None]:
x = [[1, 0, 0], [0, 1, 0], [0, 0, 1]]
y = x.copy()
z = x[:][:]
x[0][0] = 5
print("x =", x)
print("y =", y)
print("z =", y)

Для настоящей копии используйте циклы или циклоподобные выражения:

In [None]:
x = [[1, 0, 0], [0, 1, 0], [0, 0, 1]]
y = []
for elem in x:
    y.append(elem.copy())

x[0][0] = 5
print("x =", x)
print("y =", y)

## Кортежи (tuple). Множественное присваивание

Если нужна гибкость списка в возможности записи в него любых данных, но при этом изменение списка на месте будет только мешать, на помощь приходят **кортежи** (tuple). Задаются они аналогично спискам, заменяя квадратные скобки на круглые:

In [None]:
data = (219.9021, -60.83, "α Cen") # Кортеж из экваториальных координат (RA, Dec) Альфы Центавра в десятичных градусах и её имени
print(f"Звезда {data[2]} находится по координатам RA: {data[0]}°, DEC: {data[1]}°")

Изменять кортежи запрещено также, как и строки:

In [None]:
data[2] = "Альфа Центавра" # ошибка TypeError!

Кортежи как есть используются реже, чем списки, в основном для данных, которые не хочется случайно изменить в ходе работы с программой. 

Однако, неявно кортежи очень удобно использовать для **множественного присваивания**. Например, вот так можно провести замену значений двух переменных, не используя дополнительную:

In [None]:
a = 1
b = 2
(a, b) = (b, a) # скобки тут не обязательны
print(a, b)

Более того, для этого даже скобки использовать не обязательно. Главное — не забыть про запятую:

In [None]:
a = 1
b = 2
a, b = b, a
print(a, b)

Из-за необязательности скобок для создания кортежа из одного элемента запятая является обязательной:

In [None]:
a = 2
b = (2) # тут скобки считаются как часть математического выражения, вернув целое число
c = (2,) # а тут — как часть определения кортежа
print(type(a))
print(type(b))
print(type(c))

Все функции и методы, определенные для упорядоченных коллекций, типа `len()`, `+`, `.index()`, работают и для кортежей.

## Функции преобразования типов `str()`, `list()`, `tuple()`

С помощью функции преобразования типов можно превращать строки, списки и кортежи друг в друга:

In [None]:
stroka = 'Привет!'
spisok = ["М", "И", "Р"]
kortezh = ("М", "И", "Р")

print(list(stroka))
print(tuple(stroka))

print(str(spisok)) # обратите внимание, что вывелось не "МИР". Как его вывести с помощью .join()?
print(tuple(spisok))

print(str(kortezh)) # и тут тоже
print(list(kortezh))

**Для дополнительного чтения**

* Раздел 3 из учебника Яндекса: <https://education.yandex.ru/handbook/python>
* Официальная документация: <https://docs.python.org/3/tutorial/datastructures.html>.



## Упражнения

Задания 1-4 делайте по порядку, используя один и тот же список.
1.  Создайте список `planets` из названий 4 планет, задаваемых пользователем. После задания выведите список инструкцией `print()`. Пример: ввод `Земля<ENTER>Венера<ENTER>Меркурий<ENTER>Марс<ENTER>`, вывод `["Земля", "Венера", "Меркурий", "Марс"]`
2.  Отсортируйте список `planets` из предыдущего задания в лексикографическом порядке по возрастанию. Выведите каждую планету после её порядкового номера, начиная с единицы. Пример: для `["Земля", "Венера", "Меркурий", "Марс"]` вывод `1. Венера\n2. Земля\n3. Марс\n4. Меркурий`
3. Для отсортированного списка `planets` поменяйте местами первый и последний элемент. Выведите все планеты в одну строку. Пример: для `["Венера", "Земля", "Марс", "Меркурий"]` вывод `МеркурийЗемляМарсВенера`
4. Считайте у пользователя новую планету и вставьте её на второе место в измененный в предыдущем задании список. Выведите содержимое списка в виде строки «ЗаБоРчИкОм». Пример: для ввода `Юпитер`, вывод `МеРкУрИйЮпИтЕрЗеМлЯмАрСвЕнЕрА`

5. Считайте у пользователя целое неотрицательное число `n`. Создайте единичную матрицу n×n в виде двумерного списка. Выведите её с помощью `print()`. Пример: для n = 2 вывод `[[1, 0], [0, 1]]`.
6. Считайте у пользователя целое неотрицательное число `n`. Создайте список из всех целых неотрицательных делителей этого числа по возрастанию. Пример: для `n = 60` вывод `[1, 2, 3, 4, 5, 6, 10, 12, 15, 20, 30, 60]`
7. Считайте у пользователя целое неотрицательное число `n`. Создайте список из кортежей вида `(простое число, степень)` с подсчетом количества различных простых чисел в разложении этого числа. Порядок кортежей в списке неважен. Пример: для `n = 60` вывод `[(2, 2), (3, 1), (5, 1)]`
8. Считайте у пользователя строку. Создайте список из кортежей вида `(символ, количество)` с подсчетом количества различных символов в этой строке. Порядок кортежей в списке неважен. Пример: ввод `Привет, мир!`, вывод `[("П", 1), ('р', 2), ('и', 2), ('в', 1), ('е', 1), ('т', 1), (',', 1), (' ', 1), ('м', 1), ('!', 1)]`