# Коллекции

Надо хранить много объектов. Как хранить - зависит от того, что хотим с ними делать. 

| Пример | Название | Тип | Пустая коллекция | Обращение к элементу | Неизменяемое | Примечание | 
|-----|-----|----|-----|-----|----|-----|
| `[4, 'hello', 3.14]` | список | list() | `[]` | `a[i]` | изменяемое |  | 
|  `(4, 'hello', 3.14)` | кортеж | tuple() | `()` | `a[i]` | НЕизменяемое |  | 
| `'hello'` | строка | str() | `''` | `a[i]` | НЕизменяемое | только символы | 
| `{'name': 'Alex', 'age': 18}` | словарь | dict() | `{}` | `a['age']` | изменяемое | ключ - значение  | 
| `{124, 'qaz', 3.14}` | множество | set() |  |  | изменяемое |  | 


## Концепция коллекции "список"

Большая коробка (list) поделена на 5 ячеек (element).

Каждая ячейка имеет свой **номер (index)** от 0 до 4.

В ячейки положили мячи.

```python
a = [3, 4, 2, 0, 1]
```

![Коробка с мячами](https://stepik.org/media/attachments/lesson/417606/array1.png)

В каждую ячейку можно положить **число** мячей.

`a[3] = 2` - в ячейку с **номером** 3 положить **число** 2 (в ячейке теперь 2 мяча).

```python
a[0] = 7
a[2] = 0
a[3] = 2
```

![Положили мячи](https://stepik.org/media/attachments/lesson/417606/array2.png)


### Обращение к одному элементу списка

```python
a[3] = a[0] + 2
```
Как работает:

* сначала вычислили выражение справа от `=`:
    * **прочитали** чему равно `a[0]`, получили 7
    * **вычислили** чему равно `a[0] + 2` - это `7 + 2`
* потом **записали** результат в `a[3]`

![Положили мячи](https://stepik.org/media/attachments/lesson/417606/array2.png)


### Отрицательные индексы

Можно считать номер ячейки сзади. Начинаем с -1.

```python
a = [3, 4, 2, 0 1]
```

![Коробка с мячами](https://stepik.org/media/attachments/lesson/417606/array1.png)

* `a[-1]` - последняя ячейка
* `a[-2]` - ячейка еще раньше

### Печать списка и одного элемента

Печать любой коллекции показывает как можно создать эту коллекцию.

In [1]:
z = [-7, 11, 23, 5]
print(z[2])         # это число 23
print(z)            # это весь список

23
[-7, 11, 23, 5]


**В списке могут храниться объекты разных типов** Потому что в списке хранятся ссылки на объекты.

## Строки

### Создание строки

Строки можно написать в:

* `'abc'` - одинарных кавычках
* `"abc"` - двойных кавычках
* `'''abc'''` или `"""abc"""` - по 3 кавычки, можно писать много строк:

```python
''' Эта длинная строка,
напишем ее продолжение на другой строке.
И еще одну строку.
'''
```

* `""" В таких кавычках пишут документацию (help)"""`

### Пустая строка

`''` или `""` - это пустая строка.

### Чтение строки

`s = input()`

### Печать строки

`print('Hello, world!')`

### Сложение и умножение строк

In [3]:
s1 = 'abc'
s2 = 'qazwsx'
s1 + s2

'abcqazwsx'

In [4]:
'abc' * 4

'abcabcabcabc'

### len - длина (сколько элементов в коллекции)

In [13]:
len('hello')

5

### in - оператор принадлежности

In [5]:
'el' in 'hello'

True

In [6]:
'z' in 'Python'

False

### Проверка пустая строка или нет

In [9]:
s = 'hello'
# чтобы ответить, что холодильник НЕ пустой, не обязательно пересчитывать все продукты в нем
if len(s) > 0:
    print('НЕ пустая строка')
else:
    print('пустая строка')

НЕ пустая строка


In [11]:
# str -> bool
if s:
    print('НЕ пустая строка')
else:
    print('пустая строка')

НЕ пустая строка


### for

In [12]:
s = 'hello'
for c in s:
    print(c)

h
e
l
l
o


### slice - часть строки или списка

![строка и индексы](https://stepik.org/media/attachments/lesson/418189/string_slicing.png)

* **s[от:до]** - часть строки (или списка) от (включая) до (НЕ включая)
* **s[от:до:шаг]** - часть строки (или списка) от (включая) до (НЕ включая), +шаг



```python
s = 'Monty Python'
```
| Код | Равен | Что делает |
|----|----|--------|
| `s[9]` | `'h'` | 1 символ с **начала** строки с номером 9 |
| `s[-3]` | `'h'` | 1 символ с **конца** строки с номером -3 |
| `s[6:10]` | `'Pyth'` | часть строки от 6 до 10 (БЕЗ 10, последний символ `s[9]`) |
| `s[-12:-7]` | `'Monty'` | часть строки от -12 до -7 (БЕЗ -7, последний символ `s[-8]`) |
| `s[1:11:2]` | `'ot yh'` | от 1 (включая) до 11 (не включая), с шагом 2 (каждый раз индекс +2) |
| `s[11:1:-2]` | `'nhy t'` | от 11 (включая) до 1 (не включая), с шагом -2 (каждый раз индекс -2) |
| `s[:5]` | `'Monty'` | от **начала** ( часть *от* - пустая) до 5 |
| `s[6:]` | `'Python'` | от 6 до **конца** ( часть *до* - пустая) |
| `s[:]` | `'Monty Python'` | от **начала** до **конца** (копия строки) |
| `s[::-1]` | `'nohtyP ytnoM'` | от **конца** до **начала** с шагом -1 (строка с последней буквы до первой) |


## Общие операции списка и строки

Строка отличаются от списка: 

* Строки нельзя изменить. Список можно изменить.
* В строке только символы. В списке могут быть разные типы: числа, строки, другие списки и объекты.

| Что делаем | список list | строка str | 
|----|----|----|
| создать | `a = [3, -7, 19]` | `s = 'Myanmar'` |
| 1 элемент | `a[0]` это 3 | `s[0]` это `'M'` |
| 1 последний элемент | `a[-1]` это 19 | `s[-1]` это `'r'` |
| срез | `a[1:]` это `[-7, 19]` | `s[1:]` это `'yanmar'` |
| печать | `print(a)` будет `[3, -7, 19]` | `print(s)` будет `Myanmar` |
| **изменить** | `a[0] = 66`, список стал `[66, -7, 19]` | `s[0] = 'm'` **нельзя изменить строку** |
| какой тип? | `type(a)` равен `list` | `type(s)` равен `str` | 
| длина **len** | `len(a)` равен 3 | `len(s)` равен 7 | 
| a + b | `[1, 2, 3] + [10, 5]` получим `[1, 2, 3, 10, 5]` | `s + ' ' + 'Russia'` получим `'Myanmar Russia'` | 
| `a * 3` | `[10, 7] * 3` получим `[10, 7, 10, 7, 10, 7]` | `'hi'*3` получим `'hihihi'` | 


In [16]:
s = 'hello'
s[0] = 'H'

TypeError: 'str' object does not support item assignment

In [17]:
'el' in 'hello'

True

In [14]:
[3, 'hello'] in [4, 16, 3, 'hello', -12.45]

False

In [15]:
16 in [4, 16, 3, 'hello', -12.45]

True

In [117]:
'hello' in  [4, 16, 3, 'hello', -12.45]

True

In [122]:
min( [4, 16, 3,  -12.45])
sum( [4, 16, 3,  -12.45])

10.55

In [123]:
s = 'hello'
s.index('l')

2

In [127]:
s.count('l')

2

## Методы неизменяемых последовательностей

| Операция | Результат |
|--|----|
| x in s | True если хоть один элемент s равен x, иначе False |
| x not in s | False если хоть один элемент s равен x, иначе True |
| s + t | конкатенация s и t |
| s \* n <br/> n \* s | сложить s n раз |
| s\[i\] | элемент номер i |
| s\[i:j\] | срез от i до j \[i,j\) |
| s\[i:j:k\] | срез от i до j \[i,j\) с шагом k |
| len\(s\) | длина s     |
| min\(s\) | минимальный элемент s |    
| max\(s\) | максимальный элемент s    | 
| s.index\(x\)<br/>s.index\(x,i\)<br/>s.index\(x,i,j\) | номер первого вхождения х<br/>с индексом от i<br/>до j \[i,j\) |
| s.count\(x\) | сколько раз х встречается в s |


## Методы изменяемых последовательностей

| Операция | Результат |
|--|----|
| s\[i\] = x | Элемент с номером i последовательности s заменить на x     |
| s\[i:j\] = t | срез s от i до j заменить содержимым итерабельного \(можно перебирать элементы\) объекта t    | 
| del s\[i:j\] | s\[i:j\] = \[\]    | 
| s\[i:j:k\] = t | срез s\[i:j:k\] заменить элементами из t |
| del s\[i:j:k\] | удалить элементы среза s\[i:j:k\] из последовательности  |
| s.append\(x\) | добавить x в конец последовательности \(s\[len\(s\):len\(s\)\] = \[x\]\) |    
| s.clear\(\) | удалить все элементы из s \(del s\[:\]\) |
| s.copy\(\) | создать shallow copy посделовательности s \(s\[:\]\) |
| s.extend\(t\) <br/> s += t | добавить к последовательности s содержимое последовательности t \(s\[len\(s\):len\(s\)\] = t\) | 
| s *= n | добавить в s его содержимое n раз |
| s.insert\(i, x\) | вставить x в s на место с индексом i \(s\[i:i\] = \[x\]\) |    
| s.pop\(\)<br/>s.pop\(i\) | вернуть последний элемент \(с номером i\) и удалить его из последовательности  |
| s.remove\(x\) | удалить первое вхождение х в s (если нет, ValueError exception)|
| s.reverse\(\) | последовательность в обратном порядке |


## Перебираем элементы последовательности

Перебираем только элементы:
```python
for x in s:
    print(x)
```

Перебираем и элементы, и их номера:
```python
for i, x in enumerate(s):
    print(i, x)
```

## Список (list)

Списки в Python - упорядоченные изменяемые коллекции объектов произвольных типов (почти как массив в других языках, но типы элементов могут отличаться).

Все методы неизменяемых и изменяемых последовательностей + метод **sort**.

Все методы списка (в ipython или тетради): **dir**(list) или **help**(list)

Help по 1 методу (например, append): list.append<b>?</b>
```


In [21]:
list.append?

[1;31mSignature:[0m [0mlist[0m[1;33m.[0m[0mappend[0m[1;33m([0m[0mself[0m[1;33m,[0m [0mobject[0m[1;33m,[0m [1;33m/[0m[1;33m)[0m[1;33m[0m[1;33m[0m[0m
[1;31mDocstring:[0m Append object to the end of the list.
[1;31mType:[0m      method_descriptor

In [128]:
help(list.append)

Help on method_descriptor:

append(self, object, /)
    Append object to the end of the list.



### Создание списка

Пустой список:
```python
a1 = []
a2 = list()
```
Список с данными:
```python
a = ['apple', 'banana', 'wildberry']
b = [12, 34, -5, 16]
c = [12, 'apple', [3.14, 9.81], 'orange' ]
d = list('hello')
numbers = list(map(int, input().split()))
```

In [129]:
d = list('hello')
d

['h', 'e', 'l', 'l', 'o']

### Изменяем список


Оба примера сделают новый список


In [23]:
[1, 2, 3] + [4, 5]

[1, 2, 3, 4, 5]

In [24]:
[1, 2] * 3

[1, 2, 1, 2, 1, 2]

#### Разница между append и extend

Все эти методы изменяют уже существующий список, а не создают новый.


In [130]:
a = [1, 2, 3]
a.append(7)
a.append([4, 5])
a

[1, 2, 3, 7, [4, 5]]

In [26]:
b = [1, 2, 3]
b.extend([4, 5])
b

[1, 2, 3, 4, 5]

In [131]:
# краткая форма extend
b2 = [1, 2, 3]
b2 += [4, 5]
b2

[1, 2, 3, 4, 5]

In [134]:
b2 += 'hello'
b2

[1, 2, 3, 4, 5, 'h', 'e', 'l', 'l', 'o', 'h', 'e', 'l', 'l', 'o']

In [137]:
[1, 2] + 3

TypeError: can only concatenate list (not "int") to list

#### Разница между append и +

Конкатенация (+) создает новый объект, а метод append нет. Поэтому append работает быстрее.

a.append(x) в конец работает как a\[len(a):\] = \[x\]

a\[:0\] = \[x\] - добавить в начало списка. Работают так же быстро, как append.


#### insert и pop - вставить и удалить

In [50]:
a = [1, 2, 3, 4, 5]
a.append(10)
print(a)
a.insert(1, 'hello')
print(a)
x = a.pop()
print(f'{a=}, {x=}')
a.pop(1)
print(a)

[1, 2, 3, 4, 5, 10]
[1, 'hello', 2, 3, 4, 5, 10]
a=[1, 'hello', 2, 3, 4, 5], x=10
[1, 2, 3, 4, 5]


#### Изменение списка с помощью slice (удаление)

* **del** элемент
* **del** часть списка
* **del** переменная


In [35]:
# удаляем один элемент
a = [-1, 1, 66.25, 333, 333, 1234.5]
del a[0]
a

[1, 66.25, 333, 333, 1234.5]

In [36]:
# удаляем срез
del a[2:4]
a

[1, 66.25, 1234.5]

In [37]:
# удалим ВСЕ ЭЛЕМЕНТЫ из списка а, (можно было так: a.clear() или a = [])
del a[:]
a

[]

#### Изменение списка с помощью slice (удаление и вставка)

Размеры вставляемой и удаляемой частей могут не совпадать. 1) del, 2) insert

In [38]:
a = [1, 2, 3, 4, 5]
a[2:4] = [10, 11, 12, 13]
a

[1, 2, 10, 11, 12, 13, 5]

### Проверить, что список пустой

`bool(a)` возвращает False, если a пустой список. Иначе он возвращает True.


In [42]:
a = [1, 2, 3]
if a:
    print('NON-empty list')
else:
    print('Empty list')


NON-empty list


In [141]:
b = []
if not b:
    print('Empty')
else:
    print('NON-empty list')

Empty


### Чтение списка

In [57]:
words = input().split()
words

 123 qa hello


['123', 'qa', 'hello']

In [58]:
numbers = list(map(float, input().split()))
numbers

 3.14 -7.1 123


[3.14, -7.1, 123.0]

### Печать списка

In [142]:
a = [7, 12, -3]
print(a)

[7, 12, -3]


In [145]:
print(*a)
print(7, 12, -3)

7 12 -3
7 12 -3


In [144]:
for x in a:
    print(x, end=' ')

7 12 -3 

## Изменяемый объект в виде значения по умолчанию

Мы хотим в функцию передать список. Если список не задали, создать пустой список.

In [146]:
def func(x = 0, a = []):
    a.append(x)
    print(a)

In [147]:
func(15, [1, 2, 3])

[1, 2, 3, 15]


In [148]:
func(21)

[21]


In [149]:
func(777)

[21, 777]


Как правильно? None

In [150]:
def func(x = 0, a = None):
    # a = a or []
    if a is None:
        a = []
    a.append(x)
    print(a)

func(15, [1, 2, 3])
func(21)
func(777)

[1, 2, 3, 15]
[21]
[777]


`None` - неизменяемый объект.

`a or []` работает так:
* если а - непустой список, то он в выражении будет True и выражение с or дальше вычисляться не будет, значение `a or []` равно `a`.
* если `a` это `None`, то `None` в логическом выражении будет False и выражение будет выполняться дальше, значение `a or []` равно `[]`


## List comprehensions

Общий вид как сделать список:

```python
[выражение for переменная in последовательность]
или
[выражение for переменная in последовательность if условие]
```

Как сделать список, написав меньше кода?

In [63]:
# квадраты чисел от 1 до 10
a = []
for x in range(1, 11):
    a.append(x*x)
a

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

In [64]:
b = [x*x for x in range(1, 11)]
b

[1, 4, 9, 16, 25, 36, 49, 64, 81, 100]

In [151]:
# оставить только четные числа
a = [-23, 46, 2, 31, -4, 18]

b3 = []
for x in a:
    if x % 2 == 0:
        b3.append(abs(x))

b = [x for x in a if x % 2 == 0]

b2 = [abs(x) for x in a if x % 2 == 0]
print(a)
print(b3)
print(b)
print(b2)

[-23, 46, 2, 31, -4, 18]
[46, 2, -4, 18]
[46, 2, -4, 18]
[46, 2, 4, 18]


![image.png](attachment:255d6e9d-780e-4122-be10-b3aa6c8b6d91.png)

## Список из списков

Матрица. Использовать numpy - работает быстрее. Здесь материал для общего развития.

In [69]:
m = [[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]
m

[[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]

In [70]:
print(m)

[[1, 2, 3, 4], [5, 6, 7, 8], [9, 10, 11, 12]]


In [71]:
m[1][3]

8

In [72]:
m[1][3] = 100

In [73]:
m

[[1, 2, 3, 4], [5, 6, 7, 100], [9, 10, 11, 12]]

In [74]:
z = [0]*5
z

[0, 0, 0, 0, 0]

In [75]:
z[1] = 7
z

[0, 7, 0, 0, 0]

In [76]:
mz = [[0]*5 ] * 3
mz

[[0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0]]

In [77]:
mz[1][3] = 777
mz

[[0, 0, 0, 777, 0], [0, 0, 0, 777, 0], [0, 0, 0, 777, 0]]

In [78]:
matrix = [[0]*5 for i in range(3)]
matrix

[[0, 0, 0, 0, 0], [0, 0, 0, 0, 0], [0, 0, 0, 0, 0]]

In [79]:
matrix[1][3] = 888
matrix

[[0, 0, 0, 0, 0], [0, 0, 0, 888, 0], [0, 0, 0, 0, 0]]

## Кортеж (tuple)

**Кортеж** - неизменяемый список.

### Создание кортежа

Пустой кортеж:
```python
a1 = ()
a2 = tuple()
```

Непустой кортеж:
```python
a = (7, 3.4, 'abc', [1, 2, 3])
b = 7, 3.4, 'abc', [1, 2, 3]    # скобки не обязательны
` x
```


### Распаковка кортежа

**кортеж = последовательность** происходит распаковка элементов последовательности в кортеж

```python
x, y = map(int, input().split())
```
или
```python
x, y = y, x
```

Когда из функции возвращают "много значений", то возвращают один кортеж

In [80]:
def min2time(mm):
    h = mm // 60
    m = mm % 60
    return h, m

## Строки - особые методы

*   Проверки (строка непустая и _все_ символы удовлетворяют критерию):
    * str.**isalnum**()
    * str.**isalpha**()
    * str.**isdecimal**()
    * str.**isdigit**()
    * str.**isidentifier**()
    * str.**islower**()
    * str.**isnumeric**()
    * str.**isprintable**()
    * str.**isspace**()
    * str.**istitle**()
    * str.**isupper**()

*   Большие и маленькие буквы:
    * str.**capitalize**()
    * str.**casefold**()
    * str.**swapcase**()
    * str.**title**()
    * str.**upper**()
    * str.**lower**()
    
*   Выравнивание:
    * str.**center**()
    * str.**ljust**()
    * str.**rjust**()

*   Убрать символы (пробелы)
    * str.**lstrip**()
    * str.**rstrip**()
    * str.**strip**()


In [82]:
'   spacious   '.strip()

'spacious'

In [83]:
'www.example.com'.strip('cmowz.')

'example'

In [84]:
comment_string = '#....... Section 3.2.1 Issue #32 .......'
comment_string.strip('.#! ')

'Section 3.2.1 Issue #32'

* Из табуляций в пробелы
    * str.**expandtabs**()


In [85]:
'01\t012\t0123\t01234'.expandtabs()

'01      012     0123    01234'

In [86]:
'01\t012\t0123\t01234'.expandtabs(4)

'01  012 0123    01234'

*   Кодировка:
    * str.**encode**(encoding="utf-8")

*   Шифрование:
    * str.**maketrans**()
    * str.**translate**(table)

*   Форматирование:
    * str.**format**()
    * str.**format_map**()

*   Проверки (подстрока в строке)
    * str.**count**(sub) - сколько раз входит (без пересечений)
    * **in** - поиск подстроки в строке
    * str.**endswith**(sub) - str оканчивается на sub
    * str.**startswith**(sub) - 

*   **Индекс** начала подстроки в строке, (иначе проверяем как 'el' in 'Hello')
    * str.**find**(sub\[, start\[, end\]\]) - возвращает -1, если подстроки нет
    * str.**index**(sub\[, start\[, end\]\]) - кидает ValueError, если подстроки нет
    * str.**rfind**(sub\[, start\[, end\]\])
    * str.**rindex**(sub\[, start\[, end\]\])

*   Поиск и замена:
    * str.**replace**(old, new, \[count\])

In [87]:
'AAAAAA'.replace('AA', 'B')

'BBB'

In [88]:
S = 'xxxxSPAMxxxxSPAMxxxx'
S.replace('SPAM', 'EGGS')    # Заменить все найденные подстроки

'xxxxEGGSxxxxEGGSxxxx'

In [89]:
S.replace('SPAM', 'EGGS', 1) # Заменить одну подстроку

'xxxxEGGSxxxxSPAMxxxx'

*   Разделение и склейка
    * str.**partition**() - разделить на 3 части - до, разделитель, после
    * str.**rpartition**()
    * str.**rsplit**()
    * str.**split**(sep=None, maxsplit=-1) - разделить по sep на много частей
    * str.**join**(iterable)
    * str.**splitlines**()


In [90]:
'1,2,3'.split(',')

['1', '2', '3']

In [91]:
'1,2,3'.split(',', maxsplit=1)

['1', '2,3']

In [92]:
'1,2,,3,'.split(',')

['1', '2', '', '3', '']

In [93]:
a = ['hi', 'ha', 'ho']
'-'.join(a)

'hi-ha-ho'

In [95]:
text = '''это первая строка текста.
Это вторая строка текста.
Какой длинный текст'''
text.splitlines()

['это первая строка текста.',
 'Это вторая строка текста.',
 'Какой длинный текст']

In [96]:
'ab c\n\nde fg\rkl\r\n'.splitlines()

['ab c', '', 'de fg', 'kl']

In [97]:
'ab c\n\nde fg\rkl\r\n'.splitlines(keepends=True)

['ab c\n', '\n', 'de fg\r', 'kl\r\n']

### Пример: замена домена в емейле на mipt.ru

In [100]:
def mipt_email(email):
    """ Заменяет домен почты на mipt.ru"""
    name, at, host = email.partition('@')
    print(f'{name=}, {at=}, {host=}')
    if at == '@':
        res = name + '@mipt.ru'
    else:
        res = email
    return res

print(mipt_email('tatyderb@gmail.com'))
print(mipt_email('tatyderb+ryazan@physteh.edu'))
print(mipt_email('ta.tyd.erb@ya.ru'))
print(mipt_email('hello'))

name='tatyderb', at='@', host='gmail.com'
tatyderb@mipt.ru
name='tatyderb+ryazan', at='@', host='physteh.edu'
tatyderb+ryazan@mipt.ru
name='ta.tyd.erb', at='@', host='ya.ru'
ta.tyd.erb@mipt.ru
name='hello', at='', host=''
hello


### Пример: проверка, что IP адрес правильный

In [105]:
# 192.168.1.3
def is_valid_ip(text):
    a = list(map(int, text.split('.')))
    print(a)
    if len(a) != 4:
        return False
    for x in a:
        if x < 0 or x > 255:
            return False
    return True

ip = '192.168.1.3'
print(ip, is_valid_ip(ip))
ip = '255.255.255.0'
print(ip, is_valid_ip(ip))
ip = '192.168.13'
print(ip, is_valid_ip(ip))
ip = '192.268.1.3'
print(ip, is_valid_ip(ip))


[192, 168, 1, 3]
192.168.1.3 True
[255, 255, 255, 0]
255.255.255.0 True
[192, 168, 13]
192.168.13 False
[192, 268, 1, 3]
192.268.1.3 False


# Сортировка

## Сравниваем числа и строки

Чтобы отсортировать объекты, для них нужно знать какой из них больше, какой меньше.

**Числа** сравнивают как числа:
```python
3 > 1
-3.5 < 5.24
-1 < 1.5
```

**Строки** сравнивают, как слова в словаре. Какое слово в словаре идет раньше, то и меньше. 

Сравнивают по символам, начиная с первого. Нет символа меньше любого символа.
```python
'Abc' < 'abc'
'ABC' < 'C' < 'Pascal' < 'Python'
```

## Сравниваем коллекции

**Списки (list)** и кортежи (tuple) сравнивают по элементам.
```python
(1, 2, 3)              < (1, 2, 4)
[1, 2, 3]              < [1, 2, 4]
(1, 2, 3, 4)           < (1, 2, 4)
(1, 2)                 < (1, 2, -1)
(1, 2, 3)             == (1.0, 2.0, 3.0)
(1, 2, ('aa', 'ab'))   < (1, 2, ('abc', 'a'), 4)
```
Сравним `(1, 2, ('aa', 'ab'))` и `(1, 2, ('abc', 'a'), 4)`

* 1 == 1, берем следующий.
* 2 == 2, берем следующий
* сравниваем `('aa', 'ab')` и `('abc', 'a')` - это tuple, сравниваем по элементам
    * сравниваем `'aa'` и `'abc'`
        * `a==a`
        * `a < b` значит `'aa' < 'abc'`
    * значит `('aa', 'ab') < ('abc', 'a')`
* значит `(1, 2, ('aa', 'ab'))  < (1, 2, ('abc', 'a'), 4)`    


## Функции sort и sorted

Для сортировки используют стандартные функции **sort** (сортировка списка) 
и **sorted** (сортировка последовательности).

* список.**sort**(key=None, reverse=False) - стабильная сортировка самого списка
* **sorted**(iterable, key=None, reverse=False) - из iterable создается новый отсортированный список, старый остается без изменения.

*iterable* - все, что можно перебрать через for. Это list, str, map, tuple и другие.

По умолчанию используются стандартные операторы сравнения и сортирует **по возрастанию**.

Для сортировки по убыванию нужно **reverse=True**. По умолчанию `reverse=False` и сортировка по убыванию.

```python
a = [3, 6, 8, 2, 78, 1, 23, 45, 9]

b = sorted(a)  # создали новый список b
print(a)       # [3, 6, 8, 2, 78, 1, 23, 45, 9] старый список без изменения
print(b)       # [1, 2, 3, 6, 8, 9, 23, 45, 78] печатаем новый список

a.sort()       # отсортировали список a
print(a)       # [1, 2, 3, 6, 8, 9, 23, 45, 78] отсортировали старый список
```


## key=функция - как сравнивать объекты

* **список.sort(key=None, reverse=False)** - стабильная сортировка самого списка
* **sorted(iterable, key=None, reverse=False)** - из iterable создается новый отсортированный список, старый остается без изменения.

Параметр **key=функция** - как сравнивать объекты.

Функция **abs(x)** возвращает $|x|$. Это встроенная функция, как `len()`. Для нее не нужно `import`.

Отсортируем числа по возрастанию *модуля* числа:

```python
a = [3, 6, -8, 2, -78, 1, 23, -45, 9]

b = sorted(a, key=abs)
print(a)       # [3, 6, -8, 2, -78, 1, 23, -45, 9]
print(b)       # [1, 2, 3, 6, -8, 9, 23, -45, -78]

a.sort(key=abs)
print(a)       # [1, 2, 3, 6, -8, 9, 23, -45, -78]
```


In [154]:
a = [3, 6, -8, 2, -78, 1, 23, -45, 9]
sorted(a, reverse=True)

[23, 9, 6, 3, 2, 1, -8, -45, -78]

## Отсортируем строки по длине

Отсортируем строки по длине. Длину строки вычисляет функция **len(s)**.

```python
text = ['ccc', 'aaaa', 'd', 'bb']   # ['ccc', 'aaaa', 'd', 'bb']
print sorted(text, key=len)         # ['d', 'bb', 'ccc', 'aaaa']
```
Как это работает?

Функция должна принимать 1 аргумент (value) и возвращать 1 значение (proxy value).

Как сортируем с ключевой функцией:

* по списку value вычисляем список proxy value
* сортируем список proxy value
* по отсортированным proxy value ставим на место value.

![](https://stepik.org/media/attachments/lesson/496941/sorted-key.png)


## Сортировка строк без учета регистра

Отсортируем список строк БЕЗ учета регистра. Для этого будем сортировать строки, которые приведены к нижнему регистру.

Приводит к нижнему регистру метод **lower** класса **str**. Пишем полное имя функции **str.lower**.


In [109]:
strs = ['aa', 'BB', 'zz', 'CC']
print(sorted(strs))                  # ['BB', 'CC', 'aa', 'zz'] (case sensitive)
print(sorted(strs, key=str.lower))   # ['aa', 'BB', 'CC', 'zz']


['BB', 'CC', 'aa', 'zz']
['aa', 'BB', 'CC', 'zz']


## Сортировка разнотипных объектов

Сравнивать данные разных типов нельзя. Получим ошибку.
```
>>> 3 < "5"
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: '<' not supported between instances of 'int' and 'str'
```
Значит, сортировать их тоже нельзя.

Есть
```python
a = ["1.3", 7.5, "5", 4, "2.4", 1]
```
Что делать? Сделаем их одинаковым типом `float`.
```python
a = [float("1.3"), float(7.5), float("5"), float(4), float("2.4"), float(1)]
```
можно это сделать при сортировке:
```python
sorted(["1.3", 7.5, "5", 4, "2.4", 1], key=float)
```


In [110]:
sorted(["1.3", 7.5, "5", 4, "2.4", 1], key=float)

[1, '1.3', '2.4', 4, '5', 7.5]

## Напишем свою функцию сравнения

Есть список строк. Нужно отсортировать строки по **последней букве**.

Функции "взять последнюю букву" нет. Надо написать ее самим. key function должна брать 1 строку и возвращать 1 значение, по которому будем сортировать. У нас функция должна вернуть последнюю букву.


In [111]:
strs = ['xc', 'zb', 'yd' ,'wa']

# возвращает последний символ строки
def last_letter(s):
    return s[-1]

# сортирует список строк только по последним буквам
b = sorted(strs, key=last_letter)  ## ['wa', 'zb', 'xc', 'yd']
b

['wa', 'zb', 'xc', 'yd']

## Сортируем по росту и весу

Даны рост (см) и вес (кг) каждого человека. Отсортируем людей.


In [112]:
a = [(166, 55.2), (157, 55.2), (170, 55.2), (175, 90), (166, 73), (180, 73)]
print(a)

b = sorted(a)
print(b)    # [(157, 55.2), (166, 55.2), (166, 73), (170, 55.2), (175, 90), (180, 73)]


[(166, 55.2), (157, 55.2), (170, 55.2), (175, 90), (166, 73), (180, 73)]
[(157, 55.2), (166, 55.2), (166, 73), (170, 55.2), (175, 90), (180, 73)]


Вспомним, как сравниваются составные объекты. Сначала первые элементы, потом вторые и дальше. У нас сначала рост. Если рост одинаковый, то сравниваем вес.

Хотим сравнить только по весу. Как? Напишем функцию, которая будет брать 1 человека и возвращать 1 число вес человека. Отсортируем список с этой функцией.


In [113]:
def weight(t):
    # h, w = t
    h = t[0]
    w = t[1]
    return w  # или return t[1]

b = sorted(a, key=weight)
print(b)


[(166, 55.2), (157, 55.2), (170, 55.2), (166, 73), (180, 73), (175, 90)]


**Стабильная сортировка** - при одинаковых сравниваемых значениях, взаимное расположение элементов остается тем же.

То есть если в списке а при **одинаковом весе** 55.2 был сначала человек (166, 55.2), потом (157, 55.2), потом (170, 55.2). То в отсортированном массиве их **взаимный порядок не изменится**.

Заметим, что люди с одинаковым весом идут в том же порядке, что и в списке до сортировки: при весе 55.2 сначала 166, потом 157. При весе 73 сначала 166, потом 180.

Сортировка в питоне стабильная, то есть равные по одному признаку элементы будут идти в том же порядке, что и до сортировки.


## Сортировка по убыванию веса

Отсортируем по весу по убыванию. Не будем использовать `reverse = True`, сделаем это через функцию.


In [114]:
def weight_decr(t):
    h, w = t
    return -w  # или return -t[1]

b = sorted(a, key=weight_decr)
print(b)


[(175, 90), (166, 73), (180, 73), (166, 55.2), (157, 55.2), (170, 55.2)]


## Сложный критерий

Отсортируем по весу (по возрастанию), а при равном весе - по росту (по возрастанию).

Для этого в функции, которая возвращает proxy values вернём 1 tuple, в котором все критерии сортировки (вес, рост).


In [115]:
def wh1(t):
    h, w = t
    return (w, h)  # обязательно возвратить tuple, главное вес, потом рост

b = sorted(a, key=wh1)
print(b)


[(157, 55.2), (166, 55.2), (170, 55.2), (166, 73), (180, 73), (175, 90)]


## По возрастанию и убыванию

Как отсортировать **по возрастанию** веса и при равном весе **по убыванию** роста?


In [116]:
def wh2(t):
    h, w = t
    return (w, -h)  # обязательно возвратить tuple, главное вес, потом рост

b = sorted(a, key=wh2)
print(b)


[(170, 55.2), (166, 55.2), (157, 55.2), (180, 73), (166, 73), (175, 90)]
