# Погружение в структуры данных

## Список

Как только мы начинаем выходить за рамки написания простейших программ у нас возниает потребность в хранении коллекций или наборов данных. Для этого в языке Python предусмотрены 2 очень мощных по своим возможностям типа данных: списки и словари.




**Список** в Python — это упорядоченная изменяемая коллекция объектов произвольных типов.




В этом определении важна каждое слово. Мы будем к нему возвращаться по мере иллюстрации возможностей и свойств списков.



* Когда мы называем список коллекцией, мы имеем в виду, что в одном списке может храниться множество объектов (например, чисел или строковых величин) 


* Говоря о том, что списки представляют собой упорядоченные коллекции, мы обращаем внимание на то, что каждый элемент в списке имеет свой порядковый номер.


* Упоминание об изменяемости списков означает, что в процессе исполнения кода можно изменять состав элементов списка и последовательность их расположения.


* Выражение «произвольных типов» означает, что в списке могут храниться данные, относящиеся к любым типам из тех, с которыми работает Python. *То есть это могут быть также другие списки и словари*


Нам пригодится http://pythontutor.com/visualize.html#mode=edit



### Создание списков

In [4]:
my_list = list()
my_list1 = []

my_list == my_list1


True

In [5]:
list('список')

['с', 'п', 'и', 'с', 'о', 'к']

In [6]:
b = []
b.append('список') #команда append нужна для того, чтобы добавить в конец списка какое-то значение
print(b)


['список']


Метод **split**

Используется для того, чтобы создать список из строки.



In [7]:
animals = 'кошка,собака,хомяк,морская свинка,попугай,лошадь'.split(',')
animals

['кошка', 'собака', 'хомяк', 'морская свинка', 'попугай', 'лошадь']

![](https://lms.skillfactory.ru/asset-v1:SkillFactory+PY-22+10_APR+type@asset+block@use_split.png)

In [9]:
#Метод join

','.join(animals)


'кошка,собака,хомяк,морская свинка,попугай,лошадь'

### Индексы

Индексация в питоне начинается с 0. Будьте внимательны!

In [12]:
print(animals)
print(animals[0])
print(animals[1])
print(animals[2])

['кошка', 'собака', 'хомяк', 'морская свинка', 'попугай', 'лошадь']
кошка
собака
хомяк


Ещё мы можем обращаться к списку с помощью отрицательных индексов.
Тогда список будет читаться с конца, справа налево 

In [13]:
print(animals[-1])
print(animals[-2])

лошадь
попугай


### Задание найти фрукты 


In [15]:

mixed = ['греча', 'банан', 'фасоль', 'рис', 'апельсин']

mixed

['греча', 'банан', 'фасоль', 'рис', 'апельсин']

### Метод index() 
Находим индекс **первого** элемента с определенным значением.

In [16]:
mixed.index('рис')

3

Если индексов много, то используем цикл и функцию enumerate

In [19]:
mixed = ['греча', 'банан', 'фасоль', 'рис', 'апельсин', 'банан']
[index for index, value in enumerate(mixed) if value == 'банан']




[1, 5]

## Срезы

Инструмент для выделения промежутков/диапозонов внутри списка. Оба индекса указываются в квадратных скобках, между индексами ставится двоеточие.

In [24]:
print(mixed[0])
print(mixed[3])

греча
рис


In [23]:
mixed[0:3]

['греча', 'банан', 'фасоль']

list[START:STOP:STEP] - берёт срез от номера START, до STOP **не включая его**, с шагом STEP. По умолчанию START = 0, STOP = длине объекта, STEP = 1. Соответственно, какие-нибудь (а возможно, и все) параметры могут быть опущены.

In [25]:
mixed[0::2]

['греча', 'фасоль', 'апельсин']

Также все эти параметры могут быть и отрицательными:

In [26]:
mixed[::-1]

['банан', 'апельсин', 'рис', 'фасоль', 'банан', 'греча']

### Методы работы со списками

### Метод Append

Используя метод append, мы можем добавить новое значение к уже существующему списку. Для этого нужно:

* указать имя списка;

* поставить точку;

* после точки написать зарезервированное слово append;

* в скобках указать значение, которое следует добавить к списку.


In [35]:
my_list = [1, 2, 3, 4, 5]
my_list.append(100500)
print(my_list)

[1, 2, 3, 4, 5, 100500]


In [None]:
# Использование append для создания списка с нуля
squares = []
for x in range(10):
    squares.append(x ** 2)



In [36]:
my_list.append([1, 45, 6])
my_list

[1, 2, 3, 4, 5, 100500, [1, 45, 6]]

### Метод Extend

нужен если мы прибавляем список к списку и хотим избежать наслаивания

In [37]:
my_list.extend([1, 45, 6])
my_list

[1, 2, 3, 4, 5, 100500, [1, 45, 6], 1, 45, 6]

Метод Remove

Избавляемся от первого элемента списка с указанным значением

In [38]:
my_list.remove([1, 45, 6])
my_list

[1, 2, 3, 4, 5, 100500, 1, 45, 6]

### Сортировка элементов списка

In [39]:
my_list.sort()
print(my_list)

[1, 1, 2, 3, 4, 5, 6, 45, 100500]


In [41]:
[1, 1, 2, 3, 4, '5', 6, 45, 100500].sort()

TypeError: '<' not supported between instances of 'str' and 'int'

In [42]:
fruits = ['банан', 'дыня', 'апельсин', 'груша', 'вишня']
fruits.sort(reverse = False)
print(my_list)

[1, 1, 2, 3, 4, 5, 6, 45, 100500]


### Min / Max / Sum

In [44]:
print(min(my_list))
print(max(my_list))
print(sum(my_list))

1
100500
100567


### Генераторы списков

Для достижения этих задач в Python используется несколько мощных конструкций, позволяющих создавать краткий, но ёмкий и эффективный код. Одна из таких конструкций — это генераторы списков (list comprehensions). Генератор списка позволяет создать список и заполнить его данными, используя всего одну строку кода. Выглядит это приблизительно так:

In [45]:
my_list = [x for x in range(1, 25, 2)]

my_list

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23]

Генераторы списков - это гибрид цикла for и списка. Очень мощная конструкция, которая используется чаще, чем map и filter

In [None]:
squares = [x ** 2 for x in range(10)] 

# равно по смыслу 

squares = []
for x in range(10):
    squares.append(x ** 2)

In [47]:
my_list = [x for x in range(10, 100) if x%3 == 0 and x%5 == 0]
my_list


[15, 30, 45, 60, 75, 90]

In [48]:
powers = [x**y for x in range(1, 10) for y in [2,10]]
powers



[1,
 1,
 4,
 1024,
 9,
 59049,
 16,
 1048576,
 25,
 9765625,
 36,
 60466176,
 49,
 282475249,
 64,
 1073741824,
 81,
 3486784401]

In [None]:
a = [x*y for x in range(1, 10) for y in range(1,10)]
a

## Словарь

Список хорош, когда он один. Но зачастую у нас возникает необходимость хранить несколько связанных списков. 
Например, номера телефонов и имена покупателей. Или название продуктов и их стоимость. В python есть особый тип данных для хранения такой информации в удобной форме - словарь

Отличается словарь они от списков тем, что элементом словаря является не одно, а два значения. Первое называется ключом, второе — значением. 

In [52]:
my_dict = {'Банан': '16 рублей'}

my_dict = {'Банан': '16 рублей', 'Яблоко': '28 рублей'}

#Обращаемся к элементу с помощью ключа

print(my_dict['Яблоко'])

28 рублей


In [54]:
#Так же словарь можно создать с помощью функции dict

d = dict(short='dict', long='dictionary')
d

{'short': 'dict', 'long': 'dictionary'}

### Генератор словарей

In [55]:
d = {a: a ** 2 for a in range(7)}
d

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36}

In [57]:
print(d[1])
print(my_dict['Огурец'])

1


KeyError: 'огурец'

### Метод setdefault

Нужен для того, чтобы работать с пропущенными или несозданнами ключами

In [58]:
products = ['Яблоко', 'Банан', 'Огурец']

for product in products:
    print(my_dict[product])

28 рублей
16 рублей


KeyError: 'Огурец'

In [59]:
# можно сделать так

for product in products:
    if product in my_dict:
        print(my_dict[product])
    else:
        print('Этого не было в списке')
        


28 рублей
16 рублей
Этого не было в списке


In [60]:
# но быстрее будет так

for product in products:
    my_dict.setdefault(product, 'Новый продукт')
    print(my_dict[product])

28 рублей
16 рублей
Новый продукт


In [61]:
#Переборы в словарях

employee_base = {'Мария Никитина': 'менеджер', 'Егор Савичев': 'разработчик',
                 'Александр Пахомов': 'дизайнер', 'Алина Егорова': 'разработчик',
                 'Руслан Башаров': 'верстальщик'}

for employee in employee_base:
    print(employee)

Мария Никитина
Егор Савичев
Александр Пахомов
Алина Егорова
Руслан Башаров


In [64]:
for key in employee_base:
    print(employee_base[key])

менеджер
разработчик
дизайнер
разработчик
верстальщик


In [65]:
employee_base.items()

dict_items([('Мария Никитина', 'менеджер'), ('Егор Савичев', 'разработчик'), ('Александр Пахомов', 'дизайнер'), ('Алина Егорова', 'разработчик'), ('Руслан Башаров', 'верстальщик')])

In [67]:
for key, value in employee_base.items():
    print(key, value)

Мария Никитина менеджер
Егор Савичев разработчик
Александр Пахомов дизайнер
Алина Егорова разработчик
Руслан Башаров верстальщик


In [69]:
for key in employee_base.keys():
    print(key)

Мария Никитина
Егор Савичев
Александр Пахомов
Алина Егорова
Руслан Башаров


In [77]:
prices = {'apple': 0.40, 'orange': 0.35, 'banana': 0.25}
        
prices.update({'banana' : 1})
prices

{'apple': 0.4, 'orange': 0.35, 'banana': 1}

### Вложенные списки


In [85]:

a = [[1, 2, 3], [4, 5, 6]]

a[0][0]

1

In [86]:
for i in a:
    for k in i:
        print(k*5)

5
10
15
20
25
30


### Вложенные словари

In [87]:
# Часто встречается при работе с конфигурационными файлами, JSON схемами и не только

config = {
    "server": {
        "host": "127.0.0.1",
        "port": "22"
    },
    "configuration": {
        "ssh": {
            "access": "true",
            "login": "some",
            "password": "some"
        }
    }
}



In [89]:
for key, value in config.items():
    print(key, value)
    

server {'host': '127.0.0.1', 'port': '22'}
configuration {'ssh': {'access': 'true', 'login': 'some', 'password': 'some'}}


In [90]:
config['configuration']['ssh']['login']

'some'

Списки внутри словарей

In [94]:
config = {
    "server": {
        "host": "127.0.0.1",
        "port": "22"
    },
    "configuration": {
        "ssh": {
            "access": "true",
            "login": "some",
            "password": "some"
        }
    },
    "methods": [{'available': 'GET'}, {'forbidden': ['DELETE', 'POST']}]
}

config['methods'][1]['forbidden']

['DELETE', 'POST']

### Реальный пример работы со словарями и списками 



In [79]:
response = {'response': [{'id': 42565717,
   'name': 'Python',
   'screen_name': 'club42565717',
   'is_closed': 0,
   'type': 'group',
   'members_count': 37319,
   'activity': 'Открытая группа',
   'photo_50': 'https://sun9-127.userapi.com/c845524/v845524906/1a71c2/A2r_4JtmiLQ.jpg?ava=1',
   'photo_100': 'https://sun9-58.userapi.com/c845524/v845524906/1a71c1/2fBtsS0k8XY.jpg?ava=1',
   'photo_200': 'https://sun9-50.userapi.com/c845524/v845524906/1a71c0/Kfo-eQIn0DU.jpg?ava=1'},
  {'id': 3183750,
   'name': 'Веб программист - PHP, JS, Python, Java, HTML 5',
   'screen_name': 'php2all',
   'is_closed': 0,
   'type': 'page',
   'members_count': 117833,
   'activity': 'Программирование',
   'photo_50': 'https://sun9-54.userapi.com/c626421/v626421613/941/HSj4ylRsk8k.jpg?ava=1',
   'photo_100': 'https://sun9-5.userapi.com/c626421/v626421613/940/yKaZLxGShkY.jpg?ava=1',
   'photo_200': 'https://sun9-49.userapi.com/c626421/v626421613/93f/2EygT_FJKWg.jpg?ava=1'}]}

In [80]:
response['response']

[{'id': 42565717,
  'name': 'Python',
  'screen_name': 'club42565717',
  'is_closed': 0,
  'type': 'group',
  'members_count': 37319,
  'activity': 'Открытая группа',
  'photo_50': 'https://sun9-127.userapi.com/c845524/v845524906/1a71c2/A2r_4JtmiLQ.jpg?ava=1',
  'photo_100': 'https://sun9-58.userapi.com/c845524/v845524906/1a71c1/2fBtsS0k8XY.jpg?ava=1',
  'photo_200': 'https://sun9-50.userapi.com/c845524/v845524906/1a71c0/Kfo-eQIn0DU.jpg?ava=1'},
 {'id': 3183750,
  'name': 'Веб программист - PHP, JS, Python, Java, HTML 5',
  'screen_name': 'php2all',
  'is_closed': 0,
  'type': 'page',
  'members_count': 117833,
  'activity': 'Программирование',
  'photo_50': 'https://sun9-54.userapi.com/c626421/v626421613/941/HSj4ylRsk8k.jpg?ava=1',
  'photo_100': 'https://sun9-5.userapi.com/c626421/v626421613/940/yKaZLxGShkY.jpg?ava=1',
  'photo_200': 'https://sun9-49.userapi.com/c626421/v626421613/93f/2EygT_FJKWg.jpg?ava=1'}]

In [83]:

def get_info(elem):
    
    groupId = elem['id']
    name = elem['name']
    members_count = elem['members_count']
    activity = elem['activity']
    
    return (groupId, name, members_count, activity)
    
data = list(zip(*map(get_info, response['response'])))
data

[(42565717, 3183750),
 ('Python', 'Веб программист - PHP, JS, Python, Java, HTML 5'),
 (37319, 117833),
 ('Открытая группа', 'Программирование')]