<h1><center>Погружение в структуры данных</center></h1>

## Список

Как только мы начинаем выходить за рамки написания простейших программ у нас возниает потребность в хранении коллекций или наборов данных. Для этого в языке Python предусмотрены 2 очень мощных по своим возможностям типа данных: списки и словари.




**Список** в Python — это упорядоченная изменяемая коллекция объектов произвольных типов.




В этом определении важна каждое слово. Мы будем к нему возвращаться по мере иллюстрации возможностей и свойств списков.



* Когда мы называем список коллекцией, мы имеем в виду, что в одном списке может храниться множество объектов (например, чисел или строковых величин) 


* Говоря о том, что списки представляют собой упорядоченные коллекции, мы обращаем внимание на то, что каждый элемент в списке имеет свой порядковый номер.


* Упоминание об изменяемости списков означает, что в процессе исполнения кода можно изменять состав элементов списка и последовательность их расположения.


* Выражение «произвольных типов» означает, что в списке могут храниться данные, относящиеся к любым типам из тех, с которыми работает Python. *То есть это могут быть также другие списки и словари*


Нам пригодится http://pythontutor.com/visualize.html#mode=edit



<h2><center>Создание списков</center></h2>

In [1]:
my_list = list()
my_list1 = []
print(my_list)
my_list == my_list1


[]


True

In [2]:
list('список')

['с', 'п', 'и', 'с', 'о', 'к']

In [3]:
b = []
b.append('список') #команда append нужна для того, чтобы добавить в конец списка какое-то значение
print(b)


['список']


Списки, кортежи и строки являются примерами последовательностей. Но что такое последовательности и что в них такого особенного?

Основные возможности – это проверка принадлежности (т.е. выражения **“in”** и **“not in”**) и оператор индексирования, позволяющий получить напрямую некоторый элемент последовательности. Также последовательности предоставляют операцию получения вырезки, которая позволяет получить вырезку последовательности, т.е. её фрагмент.

In [29]:
'а' in b

False

In [31]:
'список' in b

True

In [33]:
list('список')[0]

'с'

In [34]:
list('список')[0:3]

['с', 'п', 'и']

Списки хорошо сочетаются с циклами

In [None]:
a = [1, 5, 76, 12, 123, 333, 5, 6,7]

for i in a:
#     new = 'Груз весит ' + str(i) +  ' килограмм'
    if i<100:
        new = 'Груз весит {} килограмм'.format(i)
    else:
        print('Груз слишком большой')
        break

    print(new.upper())

<h2><center>Методы  списков</center></h2>

**list.append(x)**

Добавляет элемент в конец списка. Эквивалентно a[len(a):] = [x].

**list.extend(iterable)**

Расширяет список добавлением всех элементов из итерации. Эквивалентно a[len(a):] = iterable.

**list.insert(i, x)**

Вставляет элемент в заданную позицию. Первый аргумент - это индекс элемента, перед которым происходит вставка, так a.insert(0, x) вставляет впереди списка, а a.insert(len(a), x) эквивалентно a.append(x).

**list.remove(x)**

Удаляет первый элемент из списка, чье значение равно x. Возникает ошибка, если такого элемента нет.

**list.pop([i])**

Удаляет элемент в заданной позиции в списке и возвращает его. 
Если индекс не указан, a.pop() удаляет и возвращает последний элемент в списке. 
(Квадратные скобки вокруг i в сигнатуре метода означают, что параметр необязательный, а не то, что вы должны вводить квадратные скобки в том месте. Вы часто увидите такую нотацию в Справке по библиотеке Python.)

**list.index(x[, start[, end]])**

Возвращает индекс (отсчет с нуля) первого элемента в списке, чье значение равно x. Возникает ValueError (docs.python.org/3/library/exceptions.html#ValueError), если такого элемента нет.

Необязательные аргументы start и end интерпретируются как запись среза и используются как ограничитель для поиска в конкретной последовательности списка. Возвращаемый индекс вычисляется относительно начала полной последовательности, а не от аргумента start.

**list.count(x)**

Возвращает какое число раз x добавлен в список.



Метод **split**

Используется для того, чтобы создать список из строки.



In [5]:
animals = 'кошка,собака,хомяк,морская свинка,попугай,лошадь'.split(',')
animals

['кошка', 'собака', 'хомяк', 'морская свинка', 'попугай', 'лошадь']

![](https://lms.skillfactory.ru/asset-v1:SkillFactory+PY-22+10_APR+type@asset+block@use_split.png)

In [6]:
#Метод join

','.join(animals)


'кошка,собака,хомяк,морская свинка,попугай,лошадь'

In [7]:
url = 'https://github.com/alnagaev/reni_land/blob/master/'
url.split('https://')[1]


'github.com/alnagaev/reni_land/blob/master/'

### Индексы

Индексация в питоне начинается с 0. Будьте внимательны!

In [8]:
print(animals)
print(animals[0])
print(animals[1])
print(animals[2])



['кошка', 'собака', 'хомяк', 'морская свинка', 'попугай', 'лошадь']
кошка
собака
хомяк


Ещё мы можем обращаться к списку с помощью отрицательных индексов.
Тогда список будет читаться с конца, справа налево 

In [9]:
print(animals[-1])
print(animals[-2])

лошадь
попугай


### Задание найти фрукты 


In [10]:

mixed = ['греча', 'банан', 'фасоль', 'рис', 'апельсин']

mixed

['греча', 'банан', 'фасоль', 'рис', 'апельсин']

### Метод index() 
Находим индекс **первого** элемента с определенным значением.

In [11]:
mixed.index('рис')

3

Если индексов много, то используем цикл и функцию enumerate

In [12]:
mixed = ['греча', 'банан', 'фасоль', 'рис', 'апельсин', 'банан']
# [index for index, value in enumerate(mixed) if value == 'банан']

for index, value in enumerate(mixed):
    if value == 'банан':
        print(index)

1
5


## Срезы

Инструмент для выделения промежутков/диапозонов внутри списка. Оба индекса указываются в квадратных скобках, между индексами ставится двоеточие.

In [13]:
print(mixed[0])
print(mixed[3])

греча
рис


In [14]:
print(mixed[0:3])
print(mixed[3])

['греча', 'банан', 'фасоль']
рис


#### list[START:STOP:STEP] - берёт срез от номера START, до STOP **не включая его**, с шагом STEP. По умолчанию START = 0, STOP = длине объекта, STEP = 1. Соответственно, какие-нибудь (а возможно, и все) параметры могут быть опущены.

In [15]:
mixed[::2]

['греча', 'фасоль', 'апельсин']

Также все эти параметры могут быть и отрицательными:

In [16]:
mixed[::-1]

['банан', 'апельсин', 'рис', 'фасоль', 'банан', 'греча']

### Иллюстрация методов работыы со списками

### Метод Append

Используя метод append, мы можем добавить новое значение к уже существующему списку. Для этого нужно:

* указать имя списка;

* поставить точку;

* после точки написать зарезервированное слово append;

* в скобках указать значение, которое следует добавить к списку.


In [17]:
my_list = [1, 2, 3, 4, 5]
my_list.append(100500)
print(my_list)

[1, 2, 3, 4, 5, 100500]


In [18]:
# Использование append для создания списка с нуля
squares = []
for x in range(10):
    squares.append(x ** 2)

    
squares


[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [19]:
for i in range(5, 10, 2):
    print(i)

5
7
9


In [20]:
my_list.append([1, 45, 6])
my_list

[1, 2, 3, 4, 5, 100500, [1, 45, 6]]

### Задача на создание списка уникальных значений

In [39]:
import random
randomized = [random.randint(0,5) for i in range(10)]
filtered = []

for i in randomized:
    if i not in filtered:
        filtered.append(i)
    

filtered
        

[3, 2, 5, 1]

**Множества: Для любопытных**
    
Множества – это неупорядоченные наборы простых объектов. Они необходимы тогда, когда присутствие объекта в наборе важнее порядка или того, сколько раз данный объект там встречается.

Используя множества, можно осуществлять проверку принадлежности, определять, является ли данное множество подмножеством другого множества, находить пересечения множеств и так далее.

https://pythontutor.ru/lessons/sets/

In [66]:
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket)   

{'orange', 'pear', 'banana', 'apple'}


### Метод Extend

нужен если мы прибавляем список к списку и хотим избежать наслаивания

In [22]:
my_list.extend([1, 45, 6])
my_list

[1, 2, 3, 4, 5, 100500, [1, 45, 6], 1, 45, 6]

### Метод Remove

Избавляемся от первого элемента списка с указанным значением

In [23]:
my_list.remove(100500)
my_list

[1, 2, 3, 4, 5, [1, 45, 6], 1, 45, 6]

### Метод Insert

In [24]:
List = ['Mathematics', 'chemistry', 1997, 2000] 
# Insert at index 2 value 10087 
List.insert(2,10087)      
print(List) 

['Mathematics', 'chemistry', 10087, 1997, 2000]


### Сортировка элементов списка

In [54]:
randomized = [random.randint(0,5) for i in range(10)]


In [55]:
randomized.sort()
randomized

[0, 0, 0, 1, 1, 1, 2, 3, 3, 4]

In [58]:
sorted(randomized)

[0, 0, 0, 1, 1, 1, 2, 3, 3, 4]

In [None]:
fruits = ['a', 'A', 'a']
fruits.sort()
print(fruits)

In [65]:
#а ещё списки могут быть вложены друг в друга представим, очень часто такое встречается в данных, полученных из REST API

array_of_arrays = [[1, 2, 3], [4, 5 ,6], [71, 2, 5]]
new_list = []

for i in array_of_arrays:
    summ = 0
    for j in i:
        summ = summ + j
    new_list.append(summ)
    
print(new_list)
    

[6, 15, 78]


### Copy
возвращает копию списка

https://stackoverflow.com/questions/2612802/how-to-clone-or-copy-a-list

In [60]:
r = [1, 2, [{'f':5, 'g':6}, 5]]
f = r
t = r.copy()
print(f' id r: {id(r)} \n id f: {id(f)} \n id t: {id(t)}')

 id r: 140360041522832 
 id f: 140360041522832 
 id t: 140360006178928


In [68]:


# Палиндром - слово или фраза, которые одинаково читаются слева направо и справа налево.
  
list1 = [1, 2, 3, 2, 1] 
  
# создаем копию списка 
list2 = list1.copy()   
  
# разворачиваем копию 
list2.reverse()  
  
# compare reversed and original list  
if list1 == list2: 
    print("Palindrome")  
else: 
    print("Not Palindrome")  


Palindrome


### Min / Max / Sum

In [None]:
my_list = [1, 2, 3, 4, 5]
print(min(my_list))
print(max(my_list))
print(sum(my_list))

### Генераторы списков

Для достижения этих задач в Python используется несколько мощных конструкций, позволяющих создавать краткий, но ёмкий и эффективный код. Одна из таких конструкций — это генераторы списков (list comprehensions). Генератор списка позволяет создать список и заполнить его данными, используя всего одну строку кода. Выглядит это приблизительно так:

In [None]:
my_list = [x for x in range(10)]

my_list

Генераторы списков - это гибрид цикла for и списка. Очень мощная конструкция, которая используется чаще, чем map и filter

In [None]:
squares = [x ** 2 for x in my_list] 

# равно по смыслу 

squares

for x in range(10):
    squares.append(x ** 2)

In [None]:
my_list = [x for x in range(10, 100) if x%3 == 0 and x%5 == 0]
my_list


In [61]:
powers = [x**y for x in range(1, 10) for y in [2,10]]
powers



[1,
 1,
 4,
 1024,
 9,
 59049,
 16,
 1048576,
 25,
 9765625,
 36,
 60466176,
 49,
 282475249,
 64,
 1073741824,
 81,
 3486784401]

In [63]:
a =[3,4,2,8,1,4]
b = sorted(a) 
b

[1, 2, 3, 4, 4, 8]

### Функция Zip

In [69]:

#Эта функция ещё более специализирована, чем enumerate.
#Zip используется для перебора сразу нескольких объектов одновременно.

one_iterable = [2, 1, 3, 4, 7, 11]
another_iterable = ['P', 'y', 't', 'h', 'o', 'n']
third_list = [2, 6, 3, 4]
list(zip(one_iterable, another_iterable, third_list))
# for n, letter in zip(one_iterable, another_iterable):
#     print(letter, n)


#По сравнению с enumerate, последняя функция удобна, когда нужна индексация во время цикла.
#Если нужно обрабатывать несколько объектов одновременно, zip предпочтительнее enumerate.

[(2, 'P', 2), (1, 'y', 6), (3, 't', 3), (4, 'h', 4)]

## Словарь

Список хорош, когда он один. Но зачастую у нас возникает необходимость хранить несколько связанных списков. 
Например, номера телефонов и имена покупателей. Или название продуктов и их стоимость. В python есть особый тип данных для хранения такой информации в удобной форме - словарь

Словари иногда встречаются в других языках как "ассоциативные записи" или "ассоциативные массивы". В отличие от последовательностей, которые индексируются диапазоном чисел, словари индексируются по ключам, которые могут быть любым неизменяемым типом; строки и числа всегда могут быть ключами. Кортежи могут быть использованы как ключи, если они содержат только строки, числа или кортежи; если кортеж включает какой-либо изменяемый объект, прямо или косвенно, он не может быть использован в качестве ключа. Вы не можете использовать списки как ключи, поскольку списки могут быть изменены на месте с помощью присваивания по индексу, срезу или такими методами как append() и extend(). Впрочем, использовать кортежи в качестве ключей словаря я вам не советую. Лучше всего в отношении словарей следовать правилам языка **JSON**

https://ru.wikipedia.org/wiki/JSON

In [71]:
test_dict = {'Банан': '16 рублей', 'Яблоко': '28 рублей', 'k': '15 рублей'}

#Обращаемся к элементу с помощью ключа

print(test_dict['Яблоко'])

28 рублей


In [75]:
print(test_dict.get('Апельсин')) # надежный метод получения значения
print(test_dict['Апельсин'])# ненадежный метод


None


KeyError: 'Апельсин'

In [None]:
#Так же словарь можно создать с помощью функции dict

d = dict(short='dict', long='dictionary')
d

### Генератор словарей

In [None]:
d = {a: a ** 2 for a in range(7)}
d

In [None]:
r = [1, 2, 3 , 4, 5]
t = ['a', 'b', 'c', 'd', 'e']

print(list(zip(r,t)))
dict(zip(t,r))



### Метод setdefault

Нужен для того, чтобы работать с пропущенными или несозданнами ключами

In [76]:
products = ['Яблоко', 'Банан', 'Огурец', 'k']
products


['Яблоко', 'Банан', 'Огурец', 'k']

In [78]:
test_dict

{'Банан': '16 рублей', 'Яблоко': '28 рублей', 'k': '15 рублей'}

In [79]:
# можно сделать так

for product in products:
    if product in my_dict:
        print(my_dict[product])
    else:
        print('Этого не было в списке')
        


28 рублей
16 рублей
Этого не было в списке
15 рублей


In [84]:
# но быстрее будет так

for product in products:
    test_dict.setdefault(product, '20 рублей')
    print(test_dict[product])

28 рублей
16 рублей
20 рублей
15 рублей


In [87]:
#Переборы в словарях

employee_base = {'Мария Никитина': 'менеджер', 'Егор Савичев': 'разработчик',
                 'Александр Пахомов': 'дизайнер', 'Алина Егорова': 'разработчик',
                 'Руслан Башаров': 'верстальщик'}

for employee in employee_base:
    print(employee)

Мария Никитина
Егор Савичев
Александр Пахомов
Алина Егорова
Руслан Башаров


In [88]:
example_1 = {'Мария Никитина': 'менеджер', 'Мария Никитина': 'разработчик'}
example_1

{'Мария Никитина': 'разработчик'}

In [89]:
for key in employee_base:
    print(employee_base[key])

менеджер
разработчик
дизайнер
разработчик
верстальщик


In [90]:
employee_base.items()

dict_items([('Мария Никитина', 'менеджер'), ('Егор Савичев', 'разработчик'), ('Александр Пахомов', 'дизайнер'), ('Алина Егорова', 'разработчик'), ('Руслан Башаров', 'верстальщик')])

In [91]:
for key, value in employee_base.items():
    print(key, value.upper())

Мария Никитина МЕНЕДЖЕР
Егор Савичев РАЗРАБОТЧИК
Александр Пахомов ДИЗАЙНЕР
Алина Егорова РАЗРАБОТЧИК
Руслан Башаров ВЕРСТАЛЬЩИК


In [92]:
for key in employee_base.keys():
    print(key)

Мария Никитина
Егор Савичев
Александр Пахомов
Алина Егорова
Руслан Башаров


In [None]:
prices = {'apple': 0.40, 'orange': 0.35, 'banana': 0.25}
        
prices.update(banana = 1)
prices

### Вложенные словари

In [None]:
# Часто встречается при работе с конфигурационными файлами, JSON схемами и не только

config = {
    "server": {
        "host": "127.0.0.1",
        "port": "22"
    },
    "configuration": {
        "ssh": {
            "access": "true",
            "login": "some",
            "password": "some"
        }
    }
}



In [None]:
for key, value in config.items():
    print(key, value)
    

In [None]:
config['configuration']['ssh']['login']

Списки внутри словарей

In [None]:
config = {
    "server": {
        "host": "127.0.0.1",
        "port": "22"
    },
    "configuration": {
        "ssh": {
            "access": "true",
            "login": "some",
            "password": "some"
        }
    },
    "methods": [{'available': 'GET'}, {'forbidden': ['DELETE', 'POST']}]
}

config['methods'][1]['forbidden'][1]

### Реальный пример работы со словарями и списками 



In [None]:
response = {'response': [{'id': 42565717,
   'name': 'Python',
   'screen_name': 'club42565717',
   'is_closed': 0,
   'type': 'group',
   'members_count': 37319,
   'activity': 'Открытая группа',
   'photo_50': 'https://sun9-127.userapi.com/c845524/v845524906/1a71c2/A2r_4JtmiLQ.jpg?ava=1',
   'photo_100': 'https://sun9-58.userapi.com/c845524/v845524906/1a71c1/2fBtsS0k8XY.jpg?ava=1',
   'photo_200': 'https://sun9-50.userapi.com/c845524/v845524906/1a71c0/Kfo-eQIn0DU.jpg?ava=1'},
                         
  {'id': 3183750,
   'name': 'Веб программист - PHP, JS, Python, Java, HTML 5',
   'screen_name': 'php2all',
   'is_closed': 0,
   'type': 'page',
   'members_count': 117833,
   'activity': 'Программирование',
   'photo_50': 'https://sun9-54.userapi.com/c626421/v626421613/941/HSj4ylRsk8k.jpg?ava=1',
   'photo_100': 'https://sun9-5.userapi.com/c626421/v626421613/940/yKaZLxGShkY.jpg?ava=1',
   'photo_200': 'https://sun9-49.userapi.com/c626421/v626421613/93f/2EygT_FJKWg.jpg?ava=1'}]}

In [None]:
response['response']

In [27]:

def get_info(elem):
    
    groupId = elem['id']
    name = elem['name']
    members_count = elem['members_count']
    activity = elem['activity']
    
    return (groupId, name, members_count, activity)
    
data = list(zip(*map(get_info, response['response'])))
data

NameError: name 'response' is not defined