<h1>Коллекции в Python</h1>

С одной разновидностью коллекций в Python мы уже познакомились - это списки. Но существуют и другие структуры данных, позволяющие объединять различные элементы.

<h2>Кортежи (tuple)<h2/>

Кортежи - это последовательности элементов, похожие на списки, но в отличие от списков неизменяемые (immutable). Кортежи задаются с помощью круглых скобок (но они необязательны) через запятую (обязательно, даже если элемент всего один), либо с помощью ключевого слова tuple, передав ему в скобки итерируемый элемент:

In [None]:
tuple_1 = (1, 2, 3)
tuple_2 = tuple([4, 5, 6])
tuple_3 = tuple("789")

print(tuple_1, tuple_2, tuple_3)

(1, 2, 3) (4, 5, 6) ('7', '8', '9')


In [None]:
tuple_4 = (1)
tuple_5 = (1, )
tuple_6 = 1,
tuple_7 = 1, 2, 3
print(tuple_4, tuple_5, tuple_6, tuple_7)

1 (1,) (1,) (1, 2, 3)


In [None]:
print(tuple(1))

TypeError: 'int' object is not iterable

Зачем нужна такая структура данных? Во-первых, то, что кортеж является неизменяемым, гарантирует вам, что ваши данные случайным образом не изменятся при каких-то манипуляциях. А значит, в кортеже лучше хранить то, что меняться не должно, а в списке - то, что планируется изменять.

Во-вторых, операции с кортежами выполняются быстрее, чем операции со списками.

In [None]:
tuple_1 = (1, 2, 3)
list_1 = [4, 5, 6]

In [None]:
list_1[0] = 0
list_1

[0, 5, 6]

In [None]:
tuple_1[0] = 0
tuple_1

TypeError: 'tuple' object does not support item assignment

Операции с кортежами дублируют операции со списками, за исключением тех операций, которые изменяют списки (append, extend):

In [None]:
len(tuple_1)

3

In [None]:
tuple_2 = (4, 5, 6)
tuple_3 = tuple_1 + tuple_2
tuple_3

(1, 2, 3, 4, 5, 6)

In [None]:
tuple_fruits = ('apple', 'banana', 'watermelon', 'grapes', 'banana')
tuple_fruits.index('banana')

1

In [None]:
tuple_fruits.count('banana')

2

Так как кортеж неизменяем, число элементов в нем тоже фиксировано. Поэтому, кортежи можно упаковывать и распаковывать следующим образом:

In [None]:
a, b, c = tuple_1
print(a, b, c)

1 2 3


In [None]:
a, b, c, d = tuple_1
print(a, b, c, d)

ValueError: not enough values to unpack (expected 4, got 3)

In [None]:
packed_tuple = a, b, c
packed_tuple

(1, 2, 3)

In [None]:
print(packed_tuple == tuple_1)

True


Задача. Сгруппируйте элементы кортежа в кортежи по два элемента (длина кортежа четная)

In [None]:
my_tuple = (1, 2, 3, 5, 6, 34, 8, 2)

grouped_tuple = tuple(my_tuple[i : i + 2] for i in range(0, len(my_tuple), 2))
grouped_tuple

((1, 2), (3, 5), (6, 34), (8, 2))

Задача. Дан кортеж, найдите индексы всех вхождений введенного элемента в кортеж.

In [None]:
my_tuple = (1, 2, 3, 34, 5, 8, 6, 2, 34, 8, 2)
element_to_search = int(input())

# ваш код
index = []
counter = 0

for x in my_tuple:
  if element_to_search == x:
    index.append(counter)
  counter += 1

print(index)

2
[1, 7, 10]


In [None]:
index_enum = []

for i, x in enumerate(my_tuple):
  if element_to_search == x:
    index_enum.append(i)

index_enum

[1, 7, 10]

Задача. Разделите кортеж на два: один с элементами с четными индексами в исходном кортеже, другой с нечетными

In [None]:
my_tuple = (1, 2, 3, 34, 5, 8, 6, 2, 34, 8, 2)

# ваш код

even_indexes = my_tuple[::2]
not_even_indexes = my_tuple[1::2]

even_indexes, not_even_indexes

((1, 3, 5, 6, 34, 2), (2, 34, 8, 2, 8))

Задача. Найдите сумму элементов кортежа.


In [None]:
my_tuple = (1, 2, 3, 34, 5, 8, 6, 2, 34, 8, 2)

# ваш код
tuple_sum = sum(my_tuple)
tuple_sum

105

<h2>Множества (set)</h2>

Множества в Python - это коллекции, содержащие уникальные элементы. Элементы множеств неупорядочены, поэтому индексирование не поддерживается. Множества могут содержать элементы разных типов. Задаются фигурными скобками {}, либо с помощью ключевого слова set. Если передать в качестве аргумента set() список или кортеж, все повторяющиеся элементы будут удалены.

In [27]:
set_1 = {}
set_2 = set()
set_3 = {1, 2, 3}
set_4 = set([4, 5, 6])
set_5 = set((6, 7, 8))

print(set_1, set_2, set_3, set_4, set_5)

{} set() {1, 2, 3} {4, 5, 6} {8, 6, 7}


In [28]:
set_1 = {1, 1, 1, 2}
set_1

{1, 2}

In [29]:
set_of_tuples = {(1, 2), (2, 3), (3, 4), (4, 1), (1, 2)}
set_of_tuples

{(1, 2), (2, 3), (3, 4), (4, 1)}

In [30]:
set_of_tuples[0]

TypeError: 'set' object is not subscriptable

Задача. Объедините два кортежа так, чтобы в результирующем кортеже были только уникальные элементы

In [31]:
tuple_1 = (1, 2, 3)
tuple_2 = (2, 3, 4)

unique_tuple = tuple(set(tuple_1 + tuple_2))
print(unique_tuple)

(1, 2, 3, 4)


Задача. Дан кортеж, преобразуйте его так, чтобы в нем остались только уникальные элементы.


In [32]:
my_tuple = (1, 2, 3, 5, 3, 3, 6, 7, 7)

#ваш код:
tuple(set(my_tuple))

(1, 2, 3, 5, 6, 7)

Для множеств существуют следующие уникальные методы:



1.   add() - добавляет элемент в множество
2.   remove() - удаляет элемент
3. clear() - удаляет все элементы множества
4.   union() - возвращает объединение множеств (заменяется на |)
5.   intersection() - возвращает пересечение множеств (заменяется на &)
6. difference() - возвращает разницу между множествами (заменяется на -)
7. symmetric_difference() - симметричная разница, исключает общие для двух множеств элементы, объединяя множества (заменяется на ^)





In [33]:
set_1 = {'apple', 'banana', 'watermelon', 'grapes', 'dates', 'pear'}
set_2 = {'banana', 'melon', 'grapefruit', 'grapes'}

In [34]:
set_2.add('orange')
set_2.add('lemon')
set_2

{'banana', 'grapefruit', 'grapes', 'lemon', 'melon', 'orange'}

In [35]:
set_2.remove('grapefruit')
set_2

{'banana', 'grapes', 'lemon', 'melon', 'orange'}

In [36]:
set_2.remove('dates')
set_2

KeyError: 'dates'

In [37]:
united_set = set_1.union(set_2)
united_set

{'apple',
 'banana',
 'dates',
 'grapes',
 'lemon',
 'melon',
 'orange',
 'pear',
 'watermelon'}

In [38]:
united_set_2 = set_1 | set_2
united_set

{'apple',
 'banana',
 'dates',
 'grapes',
 'lemon',
 'melon',
 'orange',
 'pear',
 'watermelon'}

In [39]:
intersected_set = set_1.intersection(set_2)
intersected_set

{'banana', 'grapes'}

In [40]:
print(set_1 & set_2)

{'grapes', 'banana'}


In [42]:
difference_set = set_1.difference(set_2)
difference_set

{'apple', 'dates', 'pear', 'watermelon'}

In [43]:
print(set_1 - set_2)

{'apple', 'dates', 'watermelon', 'pear'}


In [44]:
print(set_2 - set_1)

{'lemon', 'melon', 'orange'}


In [45]:
symm_difference_set = set_1.symmetric_difference(set_2)
symm_difference_set

{'apple', 'dates', 'lemon', 'melon', 'orange', 'pear', 'watermelon'}

In [46]:
print(set_1 ^ set_2)

{'melon', 'lemon', 'pear', 'apple', 'orange', 'dates', 'watermelon'}


In [47]:
print(set_2 ^ set_1)

{'apple', 'lemon', 'pear', 'melon', 'orange', 'dates', 'watermelon'}


Задача. Найти общие элементы в двух кортежах.

In [48]:
tuple_1 = (1, 2, 3, 4, 5, 5)
tuple_2 = (2, 5, 6, 7, 8, 9, 1, 9)

common_elements = tuple(set(tuple_1) & set(tuple_2))
common_elements

(1, 2, 5)

А еще множества можно сравнивать:


1.   issubset() или <= - показывает, является ли одно множество подмножеством другого
2. < - показывает, все ли элементы данного сета входят в другой сет
3.   issuperset() или >= - показывает, включает ли данное множество другое множество
4. ">" - Показывает, все ли элементы второго сета входят в первый
5. == - показывает, равны ли множества



In [51]:
set_1 = {'lemon', 'melon', 'orange'}
set_2 = {'lemon', 'orange', 'melon'}
set_3 = {'lemon', 'orange', 'melon', 'lime'}
set_4 = {'lemon', 'orange'}

In [52]:
set_1 == set_2

True

In [53]:
set_4.issubset(set_2)

True

In [54]:
set_2.issubset(set_4)

False

In [55]:
set_1 > set_2

False

In [56]:
set_1 >= set_2

True

In [57]:
set_1.issubset(set_2)

True

In [58]:
set_3.issuperset(set_1)

True

In [59]:
set_1 > set_4

True

Задача. Дан массив, проверьте, все ли его элементы уникальны.

In [60]:
my_list = [1, 2, 3, 45, 3, 7, 8, 232, 4, 6]

is_unique = len(my_list) == len(set(my_list))
is_unique

False

Задача. Даны два списка. Проверьте, что значения в этих двух списках не пересекаются.

In [67]:
list_1 = [1, 2, 3, 4]
list_2 = [5, 6, 7, 8]

# ваш код
do_not_intersect = len(set(list_1) & set(list_2)) == 0

do_not_intersect_2 = len(set(list_1) | set(list_2)) == len(list_1) + len(list_2)

do_not_intersect, do_not_intersect_2

(True, True)

Задача. Дано множество чисел. Удалите из него все четные числа.

In [68]:
my_set = {1, 2, 3, 45, 39, 7, 8, 232, 4, 6}

# ваш код
my_new_set = {x for x in my_set if x%2 != 0}
my_new_set

{1, 3, 7, 39, 45}

Задача. У вас есть список тех, кто любит пиццу, и тех, кто любит мороженое. Вычислите тех, кто любит пиццу, но не любит мороженое.

In [69]:
ice_cream_lovers = {"Маша", "Саша", "Даша", "Паша"}
pizza_lovers = {"Даша", "Наташа", "Паша", "Глаша", "Простокваша"}

# ваш код

result = pizza_lovers - ice_cream_lovers
result

{'Глаша', 'Наташа', 'Простокваша'}

Задача. Теперь найдите тех, кто любит и то, и другое.

In [70]:
result = pizza_lovers & ice_cream_lovers
result

{'Даша', 'Паша'}

Задача. Дан список друзей трех человек. Найдите тех, с кем общаются все трое.

In [71]:
masha_friends = {"Саша", "Даша", "Паша", "Глаша"}
dasha_friends = {"Наташа", "Паша", "Глаша"}
sasha_friends = {"Паша", "Глаша", "Простокваша"}

# ваш код
result = masha_friends & dasha_friends & sasha_friends

result

{'Глаша', 'Паша'}

Задача. Определите, у кого больше всего друзей.

In [74]:
friend_list = [
    {"Саша", "Даша", "Паша", "Глаша"},
    {"Наташа", "Паша", "Глаша"},
    {"Паша", "Глаша", "Простокваша"},
]

names = ["masha", "dasha", "sasha"]

friends_number = [len(list_x) for list_x in friend_list]
max_friens_number = max(friends_number)

index_max_fr_number = friends_number.index(max_friens_number)
names[index_max_fr_number]

'masha'

<h2>Словари (dict)</h2>
Словарь - это коллекция, которая содержит пары ключ-значение. Ключи обыязательно должны быть уникальными! Значения могут быть любыми.

In [75]:
friends_dict = {
    "Маша": ["Саша", "Даша", "Паша", "Глаша"],
    "Даша": ["Наташа", "Паша", "Глаша"],
    "Саша": ["Паша", "Глаша", "Простокваша"]
}

friends_dict

{'Маша': ['Саша', 'Даша', 'Паша', 'Глаша'],
 'Даша': ['Наташа', 'Паша', 'Глаша'],
 'Саша': ['Паша', 'Глаша', 'Простокваша']}

In [76]:
friends_dict["Даша"]

['Наташа', 'Паша', 'Глаша']

In [77]:
friends_dict[0]

KeyError: 0

Добавление нового элемента:

In [78]:
friends_dict["Паша"] = ["Глаша", "Даша", "Наташа"]
friends_dict

{'Маша': ['Саша', 'Даша', 'Паша', 'Глаша'],
 'Даша': ['Наташа', 'Паша', 'Глаша'],
 'Саша': ['Паша', 'Глаша', 'Простокваша'],
 'Паша': ['Глаша', 'Даша', 'Наташа']}

In [79]:
friends_dict["Паша"].append("Простокваша")
friends_dict

{'Маша': ['Саша', 'Даша', 'Паша', 'Глаша'],
 'Даша': ['Наташа', 'Паша', 'Глаша'],
 'Саша': ['Паша', 'Глаша', 'Простокваша'],
 'Паша': ['Глаша', 'Даша', 'Наташа', 'Простокваша']}

Удаление ключа из словаря:

In [80]:
del friends_dict["Паша"]
friends_dict

{'Маша': ['Саша', 'Даша', 'Паша', 'Глаша'],
 'Даша': ['Наташа', 'Паша', 'Глаша'],
 'Саша': ['Паша', 'Глаша', 'Простокваша']}

Также, к элементам словаря можно обращаться с помощью метода get(). Первым обязательным аргументом этого метода будет ключ, а вторым (необязательным) - то, что метод вернет, если данного ключа в словаре нет.

In [81]:
a = friends_dict.get("Маша")
print(a)

['Саша', 'Даша', 'Паша', 'Глаша']


In [82]:
a = friends_dict.get("Паша", "Not found")
print(a)

Not found


In [83]:
a = friends_dict.get("Паша")
print(a)

None


Словари можно обновлять другими словарями:

In [84]:
new_friends_dict = {
    'Паша': ['Глаша', 'Даша', 'Наташа', 'Простокваша'],
    'Глаша': ['Наташа', 'Паша'],
}

friends_dict.update(new_friends_dict)
friends_dict

{'Маша': ['Саша', 'Даша', 'Паша', 'Глаша'],
 'Даша': ['Наташа', 'Паша', 'Глаша'],
 'Саша': ['Паша', 'Глаша', 'Простокваша'],
 'Паша': ['Глаша', 'Даша', 'Наташа', 'Простокваша'],
 'Глаша': ['Наташа', 'Паша']}

Еще один способ удалить запись из словаря по ключу - метод pop(). Он возвращает удаленную запись, словарь при этом изменяется:

In [85]:
deleted_value = friends_dict.pop("Паша")
deleted_value

['Глаша', 'Даша', 'Наташа', 'Простокваша']

In [86]:
friends_dict

{'Маша': ['Саша', 'Даша', 'Паша', 'Глаша'],
 'Даша': ['Наташа', 'Паша', 'Глаша'],
 'Саша': ['Паша', 'Глаша', 'Простокваша'],
 'Глаша': ['Наташа', 'Паша']}

In [87]:
friends_dict['маша'] = ["Паша"]
friends_dict

{'Маша': ['Саша', 'Даша', 'Паша', 'Глаша'],
 'Даша': ['Наташа', 'Паша', 'Глаша'],
 'Саша': ['Паша', 'Глаша', 'Простокваша'],
 'Глаша': ['Наташа', 'Паша'],
 'маша': ['Паша']}

Метод keys() возвращает все ключи данного словаря:

In [90]:
list(friends_dict.keys())

['Маша', 'Даша', 'Саша', 'Глаша', 'маша']

Аналогично, метод values() возвращает все значения без ключей:

In [91]:
list(friends_dict.values())

[['Саша', 'Даша', 'Паша', 'Глаша'],
 ['Наташа', 'Паша', 'Глаша'],
 ['Паша', 'Глаша', 'Простокваша'],
 ['Наташа', 'Паша'],
 ['Паша']]

Метод items() возвращает список кортежей "ключ-значение":

In [92]:
list(friends_dict.items())

[('Маша', ['Саша', 'Даша', 'Паша', 'Глаша']),
 ('Даша', ['Наташа', 'Паша', 'Глаша']),
 ('Саша', ['Паша', 'Глаша', 'Простокваша']),
 ('Глаша', ['Наташа', 'Паша']),
 ('маша', ['Паша'])]

Словари удобно создавать с помощью dictionary comprehension:

In [93]:
d1 = {str(x): x % 2 == 0 for x in range(5)}
print(d1)

{'0': True, '1': False, '2': True, '3': False, '4': True}


Фонетически представительный текст для работы с последующими задачами:

In [None]:
import string

text = 'Был тихий серый вечер. Дул ветер, слабый и теплый. Небо было покрыто тучами, сквозь которые иногда прорывались лучи заходящего солнца. Наш автобус номер 7 шел на запад. Мы все ехали в великий старый город, электрические огни которого были видны далеко впереди. По центральному радио передавали легкую музыку. Хор ребят исполнял песенку "Золото осени". Я невольно прислушивался к разговорам в автобусе. Сосед–моряк, не раз бывавший за границей, рассказывал о различных странах, о музеях, о газетах. В них защищают всеобщее равенство, говорят о нужде и судьбе обыкновенных рабочих. Тема была мне знакома: у нас достаточно много пишут о внешних связях, необходимых для механизации в объединениях заводов. Впереди меня двое ученых говорили о предстоящей конференции: "Наша лаборатория семь лет отдала эксперименту по проверке этой формулы. Нам было неизвестно значение функции сопротивления, особенно при высоком давлении над поверхностью жидкости. Опыты показали, что оно равно десяти в пятой степени условных единиц". "Странно, - ответил его товарищ, - а наш преподаватель Тревогин в лекции называл другую цифру. Очевидно, это вызывается неравномерным размещением плотности составляющих. Я думаю, теперь надо изучить соотношение длины и объема." Их разговор был совсем непонятным для меня. Я обратил внимание на женщину, которая уже не в первый раз сажала на сиденье своего малыша. Рыжий мальчик, которому было года три, отворачивался, вырывался, показывал маме розовый язык. Я решил, что мама сейчас рассердится. Но она, стараясь сохранять строгий вид, не могла не улыбаться. Было видно, что она очень любит своего сына, считает, что лучше нет детей на свете: он самый умный, самый милый, самый веселый. Юный шалун мог позволить себе многое. Я отыскал в дорожной сумке книгу о животных, которую купил для дочки, вынул ее, открыл. На первой странице по голубому небу летели голуби. "Дядя, это кто?" - спросил малыш, заглядывая на следующую страницу. "Это кит". "а ты знаешь, сколько килограммов он весит? сто? Сколько сантиметров в секунду он проплывает? Двадцать? Кит сильный? Он есть мясо? А мед? Кто его нарисовал? Художник?" Вопросы следовали одни за другим. Мы привлекли внимание пассажиров. Все с улыбкой следили за нами. Наконец мама сказала: "Шурочка, душа моя, уже поздно, скоро ночь. Здесь нельзя шуметь. Пойдем спать. Сядь сюда". Сначала Шура сопротивлялся, тащил маму в сторону. Потом затих, держа в руке желтого песика. Его дыхание было чуть слышно. Я выключил лампочку дневного света. Вид спящего ребенка вызвал во мне воспоминания о моем детстве. тогда беда ходила рядом, и даже необходимый для жизни хлеб выдавали граммами. Потом вспомнил об учебе в вузе, о первых годах на фабрике. Там я понял о себе главное: кроме интересной работы, мне мало что нужно в жизни. Так, задумавшись, я не заметил, как заснул. Город - цель нашего пути - был еще не близко.'
text = text.translate(str.maketrans("", "", string.punctuation)).lower()

text

'был тихий серый вечер дул ветер слабый и теплый небо было покрыто тучами сквозь которые иногда прорывались лучи заходящего солнца наш автобус номер 7 шел на запад мы все ехали в великий старый город электрические огни которого были видны далеко впереди по центральному радио передавали легкую музыку хор ребят исполнял песенку золото осени я невольно прислушивался к разговорам в автобусе сосед–моряк не раз бывавший за границей рассказывал о различных странах о музеях о газетах в них защищают всеобщее равенство говорят о нужде и судьбе обыкновенных рабочих тема была мне знакома у нас достаточно много пишут о внешних связях необходимых для механизации в объединениях заводов впереди меня двое ученых говорили о предстоящей конференции наша лаборатория семь лет отдала эксперименту по проверке этой формулы нам было неизвестно значение функции сопротивления особенно при высоком давлении над поверхностью жидкости опыты показали что оно равно десяти в пятой степени условных единиц странно  ответ

Задача. Создадим словарь, ключами в котором будут символы, а значениями - то, сколько раз эти символы встретились во введенной строке

In [94]:
char_dict = {char: text.count(char) for char in text}

char_dict

{'б': 43,
 'ы': 75,
 'л': 116,
 ' ': 437,
 'т': 115,
 'и': 147,
 'х': 32,
 'й': 31,
 'с': 115,
 'е': 191,
 'р': 103,
 'в': 110,
 'ч': 30,
 'д': 78,
 'у': 66,
 'а': 185,
 'п': 54,
 'н': 155,
 'о': 246,
 'к': 64,
 'м': 83,
 'з': 47,
 'ь': 32,
 'г': 40,
 'я': 54,
 'щ': 13,
 'ц': 14,
 'ш': 22,
 '7': 1,
 'э': 6,
 'ю': 13,
 '–': 1,
 'ж': 17,
 'ъ': 2,
 'ф': 5}

Задача. Напишем программу, которая принимает на вход текст, и печатает частотный словарь встретившихся в нем слов

In [95]:
word_dict = {word: text.count(word) for word in text.lower().split()}

word_dict

{'был': 10,
 'тихий': 1,
 'серый': 1,
 'вечер': 1,
 'дул': 1,
 'ветер': 1,
 'слабый': 1,
 'и': 147,
 'теплый': 1,
 'небо': 1,
 'было': 5,
 'покрыто': 1,
 'тучами': 1,
 'сквозь': 1,
 'которые': 1,
 'иногда': 1,
 'прорывались': 1,
 'лучи': 1,
 'заходящего': 1,
 'солнца': 1,
 'наш': 4,
 'автобус': 2,
 'номер': 2,
 '7': 1,
 'шел': 1,
 'на': 28,
 'запад': 1,
 'мы': 7,
 'все': 4,
 'ехали': 1,
 'в': 110,
 'великий': 1,
 'старый': 1,
 'город': 2,
 'электрические': 1,
 'огни': 1,
 'которого': 1,
 'были': 1,
 'видны': 1,
 'далеко': 1,
 'впереди': 2,
 'по': 19,
 'центральному': 1,
 'радио': 1,
 'передавали': 1,
 'легкую': 1,
 'музыку': 1,
 'хор': 1,
 'ребят': 1,
 'исполнял': 1,
 'песенку': 1,
 'золото': 1,
 'осени': 1,
 'я': 54,
 'невольно': 1,
 'прислушивался': 1,
 'к': 64,
 'разговорам': 1,
 'автобусе': 1,
 'сосед–моряк': 1,
 'не': 23,
 'раз': 6,
 'бывавший': 1,
 'за': 15,
 'границей': 1,
 'рассказывал': 1,
 'о': 246,
 'различных': 1,
 'странах': 1,
 'музеях': 1,
 'газетах': 1,
 'них': 2,
 'защ

Задача. Поиск слова, встретившегося в тексте наибольшее число раз

In [96]:
max_key = max(word_dict, key=word_dict.get)

max_key, word_dict[max_key]

('о', 246)

Задача. Удаление стоп-слов. Напишите программу, которая принимает текст и список стоп-слов, а возвращает частотный словарь, исключая стоп-слова

In [105]:
stop_words = ["и", "о", "об", "а", "на", "в", "с", "у", "к"]

word_dict_filtered = {key: word_dict[key] for key in word_dict.keys()
  if key not in stop_words}
max_key = max(word_dict_filtered, key=word_dict.get)
max_key, word_dict_filtered[max_key]

('я', 54)

Задача. Напишите программу, которая принимает текст и возвращает словарь, в котором ключи - это длины слов, а значения - списки слов соответствующей длины

In [117]:
words = text.split()
words_len = set([len(word) for word in words])

dict_words = {key: [] for key in words_len}

for word in words:
  dict_words[len(word)].append(word)

dict_words_unique = {}

for key, value in dict_words.items():
  dict_words_unique[key] = set(value)

words_len, dict_words_unique[2]

({1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13},
 {'во', 'ее', 'за', 'их', 'мы', 'на', 'не', 'но', 'об', 'он', 'по', 'ты'})

Задача. Замена слов по словарю. Напишите программу, которая принимает текст и словарь замен, а возвращает текст, в котором слова заменены согласно словарю.

In [119]:
replace_dict = {
    "серый": "синий",
    "автобус": "троллейбус",
    "тихий": "шумный",
    "вечер": "полдень",
}

# ваш код
new_text = " ".join([replace_dict.get(word, word) for word in text.split()])
new_text

'был шумный синий полдень дул ветер слабый и теплый небо было покрыто тучами сквозь которые иногда прорывались лучи заходящего солнца наш троллейбус номер 7 шел на запад мы все ехали в великий старый город электрические огни которого были видны далеко впереди по центральному радио передавали легкую музыку хор ребят исполнял песенку золото осени я невольно прислушивался к разговорам в автобусе сосед–моряк не раз бывавший за границей рассказывал о различных странах о музеях о газетах в них защищают всеобщее равенство говорят о нужде и судьбе обыкновенных рабочих тема была мне знакома у нас достаточно много пишут о внешних связях необходимых для механизации в объединениях заводов впереди меня двое ученых говорили о предстоящей конференции наша лаборатория семь лет отдала эксперименту по проверке этой формулы нам было неизвестно значение функции сопротивления особенно при высоком давлении над поверхностью жидкости опыты показали что оно равно десяти в пятой степени условных единиц странно 

Задача. Напишите программу, которая принимает на вход текст, а возвращает словарь, ключи которого - буквы, а значения - списки слов, начинающихся на эти буквы

In [125]:
words = text.split()
start_letters = set([word[0] for word in words])

dict_words = {key: [] for key in start_letters}

for word in words:
  dict_words[word[0]].append(word)

dict_words_unique = {}

for key, value in dict_words.items():
  dict_words_unique[key] = set(value)

dict_words_unique['э']

{'эксперименту', 'электрические', 'это', 'этой'}

<h2> Еще пара встроенных методов работы со списками в Python </h2>

sorted()

Возвращает список, сортированный по некоторому правилу. Если правило не указано - сортировка алфавитная

In [126]:
numbers = [2, 4, 7, 1, 78, 0]

sorted_numbers = sorted(numbers)

sorted_numbers

[0, 1, 2, 4, 7, 78]

In [127]:
words = ['apple', 'banana', 'watermelon', 'grapes', 'dates', 'pear']

sorted_words = sorted(words, key=len)
sorted_words_2 = sorted(words)

sorted_words, sorted_words_2

(['pear', 'apple', 'dates', 'banana', 'grapes', 'watermelon'],
 ['apple', 'banana', 'dates', 'grapes', 'pear', 'watermelon'])

In [130]:
students = [("Маша", 20), ("Паша", 23), ("Наташа", 19), ("Даша", 22)]

sorted_by_age = sorted(students, key=lambda x: x[1])
sorted_by_age

[('Наташа', 19), ('Маша', 20), ('Даша', 22), ('Паша', 23)]

In [131]:
students = [("Маша", 20), ("Паша", 23), ("Наташа", 19), ("Даша", 22)]

sorted_by_age = sorted(students, key=lambda x: x[1], reverse=True)
sorted_by_age

[('Паша', 23), ('Даша', 22), ('Маша', 20), ('Наташа', 19)]

Задача. Возьмите частотный словарь из предыдущих задач и отсортируйте его по значениям.

In [None]:
word_dict = {word: text.count(word) for word in text.lower().split()}

sorted_word_dict = dict(sorted(word_dict.items(), key=lambda item: item[1], reverse=True))

sorted_word_dict

filter()

Возвращает список, отфильрованный по некоторому правилу

Задача. Отфильтруйте список строк, оставив только те, которые начинаются с буквы "a"

In [137]:
words = ['apple', 'banana', 'watermelon', 'avocado', 'grapes', 'dates', 'pear', "apricot"]

filteres_words = list(filter(lambda x: x.startswith('a'), words))

filteres_words

['apple', 'avocado', 'apricot']

Задача. Отфильтруйте список строк, оставив только те, длина которых больше 6

In [138]:
words = ['apple', 'banana', 'watermelon', 'avocado', 'grapes', 'dates', 'pear', "apricot"]

filteres_words = list(filter(lambda x: len(x) > 6, words))

filteres_words

['watermelon', 'avocado', 'apricot']

Задача. Отфильтруйте список строк, оставив только те, длина которых четная

In [139]:
words = ['apple', 'banana', 'watermelon', 'avocado', 'grapes', 'dates', 'pear', "apricot"]

# ваш код
filteres_words = list(filter(lambda x: len(x)%2 == 0, words))

filteres_words

['banana', 'watermelon', 'grapes', 'pear']

Задача. Отфильтруйте строки, оставив только те, которые начинаются на букву "a" и отсортируйте их по длине, начиная от самой длинной.

In [None]:
words = ['apple', 'banana', 'watermelon', 'avocado', 'grapes', 'dates', 'pear', "apricot"]

# ваш код


Задача. Из словаря, получившегося в задаче о составлении словаря со списками слов, начинающихся на определенные буквы, удалите записи, в значениях которых находятся списки короче 5 букв.