In [1]:
"""Словарь в питоне."""

'Словарь в питоне.'

### Понятие словаря

#### Создание словаря

In [None]:
from collections import Counter
from pprint import pprint

import numpy as np

dict_1: dict[str, str] = {}
print(dict_1)

{} {}


In [3]:
company = {"name": "Toyota", "founded": 1937, "founder": "Kiichiro Toyoda"}
company

{'name': 'Toyota', 'founded': 1937, 'founder': 'Kiichiro Toyoda'}

In [4]:
# из вложенных списков
tickers = dict([["TYO", "Toyota"], ["TSLA", "Tesla"], ["F", "Ford"]])
tickers

{'TYO': 'Toyota', 'TSLA': 'Tesla', 'F': 'Ford'}

In [None]:
# словарь с одинаковыми значениями и заданными ключами
keys = ("k1", "k2", "k3")
value0 = 0

empty_values = dict.fromkeys(keys, value0)
empty_values

{'k1': 0, 'k2': 0, 'k3': 0}

#### Ключи и значения словаря

Виды значений словаря

In [6]:
value_types = {
    "k1": 123,
    "k2": "string",
    # "k3": np.NaN,
    "k4": True,
    "k5": None,
    "k6": [1, 2, 3],
    "k7": np.array([1, 2, 3]),
    "k8": {1: "v1", 2: "v2", 3: "v3"},
}
value_types

{'k1': 123,
 'k2': 'string',
 'k4': True,
 'k5': None,
 'k6': [1, 2, 3],
 'k7': array([1, 2, 3]),
 'k8': {1: 'v1', 2: 'v2', 3: 'v3'}}

Методы .keys(), .values() и .items()

In [7]:
person: dict[str, str] = {
    "first name": "Иван",
    "last name": "Иванов",
    "born": "1980",
    "dept": "IT",
}

In [8]:
person.keys()

dict_keys(['first name', 'last name', 'born', 'dept'])

In [9]:
person.values()

dict_values(['Иван', 'Иванов', '1980', 'IT'])

In [10]:
person.items()

dict_items([('first name', 'Иван'), ('last name', 'Иванов'), ('born', '1980'), ('dept', 'IT')])

Использование цикла for

In [11]:
for key, value in person.items():
    print(key, value)

first name Иван
last name Иванов
born 1980
dept IT


Доступ по ключу и метод .get()

In [12]:
person["last name"]

'Иванов'

In [13]:
person["education"]

KeyError: 'education'

In [14]:
print(person.get("education"))

None


In [15]:
person.get("born")

1980

Проверка вхождения ключа и значения в словарь

In [16]:
"born" in person

True

### Операции со словарями

#### Добавление и изменение элементов

In [None]:
person["languages"] = "Python"
person

{'first name': 'Иван',
 'last name': 'Иванов',
 'born': 1980,
 'dept': 'IT',
 'languages': ['Python']}

In [None]:
# присоединение словарей
new_elements = {"job": "программист", "experience": "7"}

person.update(new_elements)
person

{'first name': 'Иван',
 'last name': 'Иванов',
 'born': 1980,
 'dept': 'IT',
 'languages': ['Python'],
 'job': 'программист',
 'experience': 7}

In [22]:
# метод .setdefault проверит есть ли ключ в словаре
# если "да", значение не изменится
person.setdefault("last name", "Петров")
person

{'first name': 'Иван',
 'last name': 'Иванов',
 'born': 1980,
 'dept': 'IT',
 'languages': ['Python'],
 'job': 'программист',
 'experience': 7}

In [None]:
# если нет, то будет добавлен ключ
# и соответствующее значение
person.setdefault("f_languages", "русский")
person

{'first name': 'Иван',
 'last name': 'Иванов',
 'born': 1980,
 'dept': 'IT',
 'languages': ['Python'],
 'job': 'программист',
 'experience': 7,
 'f_languages': ['русский', 'английский']}

Удаление элементов

In [24]:
# метод удаляет значение по ключу и выводит его
person.pop("dept")

'IT'

In [25]:
person

{'first name': 'Иван',
 'last name': 'Иванов',
 'born': 1980,
 'languages': ['Python'],
 'job': 'программист',
 'experience': 7,
 'f_languages': ['русский', 'английский']}

In [26]:
del person["born"]

In [27]:
# удаляет последний добавленный элемент и выводит его
person.popitem()

('f_languages', ['русский', 'английский'])

In [28]:
# удаляет все элементы словаря
person.clear()
person

{}

In [29]:
del person

In [30]:
person

NameError: name 'person' is not defined

Сортировка словарей

In [31]:
dict_to_sort = {"k1": 30, "k2": 20, "k3": 10}

In [32]:
sorted(dict_to_sort)

['k1', 'k2', 'k3']

In [33]:
sorted(dict_to_sort.values())

[10, 20, 30]

In [34]:
# cортировка по ключу
sorted(dict_to_sort.items(), key=lambda x: x[0])

[('k1', 30), ('k2', 20), ('k3', 10)]

In [35]:
# сортировка по значению
sorted(dict_to_sort.items(), key=lambda x: x[1])

[('k3', 10), ('k2', 20), ('k1', 30)]

#### Копирование словарей

In [36]:
original = {"Первый курс": 174, "Второй курс": 131}

Копирование с помощью метода .copy()

In [37]:
new_1 = original.copy()
new_1["Третий курс"] = 117

print(original)
print(new_1)

{'Первый курс': 174, 'Второй курс': 131}
{'Первый курс': 174, 'Второй курс': 131, 'Третий курс': 117}


Копирование через оператор присваивание `=`, две переменные указывают на один адрес

In [38]:
new_2 = original
new_2.clear()
print(original)
print(new_2)

{}
{}


#### Функция `dir()`

In [None]:
some_dict = {"k": 1}
print(dir(some_dict)[:11])

['__class__',
 '__class_getitem__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__']

In [40]:
print(some_dict)

{'k': 1}


In [None]:
print(str(some_dict))  # внутренний вызов __str__

"{'k': 1}"

In [None]:
print(dir(some_dict)[-11:])

['clear',
 'copy',
 'fromkeys',
 'get',
 'items',
 'keys',
 'pop',
 'popitem',
 'setdefault',
 'update',
 'values']

### Dict comprehension

In [43]:
source_dict = {"k1": 2, "k2": 4, "k3": 6}

In [None]:
print({k: v * 2 for k, v in source_dict.items()})

{'k1': 4, 'k2': 8, 'k3': 12}

In [None]:
print({k.upper(): v for k, v in source_dict.items()})

{'K1': 2, 'K2': 4, 'K3': 6}

In [None]:
print({k: v for k, v in source_dict.items() if v > 2 if v < 6})

{'k2': 4}

In [None]:
print({k: ("odd" if v % 2 else "even") for k, v in source_dict.items()})

{'k1': 'even', 'k2': 'even', 'k3': 'even'}

### Дополнительные примеры

#### lambda-функции, функции `map()` и `zip()`

Пример со списком

In [48]:
words = ["apple", "banana", "fig", "blackberry"]

In [None]:
length = list(map(lambda word: len(word) - 1, words))
length

[5, 6, 3, 10]

In [50]:
dict(zip(words, length))

{'apple': 5, 'banana': 6, 'fig': 3, 'blackberry': 10}

In [51]:
dict(zip(words, [len(word) for word in words]))

{'apple': 5, 'banana': 6, 'fig': 3, 'blackberry': 10}

Пример со словарем

In [52]:
height_feet = {"Alex": 6.1, "Jerry": 5.4, "Ben": 5.8}

In [53]:
metres = list(map(lambda height_in_feet: height_in_feet * 0.3048, height_feet.values()))
metres

[1.85928, 1.6459200000000003, 1.76784]

In [54]:
dict(zip(height_feet.keys(), np.round(metres, 2)))

{'Alex': np.float64(1.86), 'Jerry': np.float64(1.65), 'Ben': np.float64(1.77)}

In [None]:
print({k: np.round(v * 0.3048, 2) for k, v in height_feet.items()})

{'Alex': np.float64(1.86), 'Jerry': np.float64(1.65), 'Ben': np.float64(1.77)}

#### Вложенные словари

In [None]:
employees: dict[str, dict[str, str]] = {
    "id1": {
        "first name": "Александр",
        "last name": "Иванов",
        "age": "30",
        "job": "программист",
    },
    "id2": {
        "first name": "Ольга",
        "last name": "Петрова",
        "age": "35",
        "job": "ML-engineer",
    },
}

In [57]:
for employee_info in employees.values():
    print(employee_info)

{'first name': 'Александр', 'last name': 'Иванов', 'age': 30, 'job': 'программист'}
{'first name': 'Ольга', 'last name': 'Петрова', 'age': 35, 'job': 'ML-engineer'}


Базовые операции

In [58]:
employees["id1"]["age"]

30

In [59]:
# для лучшего вывода словарей

In [None]:
employees["id3"] = {
    "first name": "Дарья",
    "last name": "Некрасова",
    "age": "27",
    "job": "веб-дизайнер",
}

# и выведем обновленный словарь с помощью функции pprint()
pprint(employees)

{'id1': {'age': 30,
         'first name': 'Александр',
         'job': 'программист',
         'last name': 'Иванов'},
 'id2': {'age': 35,
         'first name': 'Ольга',
         'job': 'ML-engineer',
         'last name': 'Петрова'},
 'id3': {'age': 27,
         'first name': 'Дарья',
         'job': 'веб-дизайнер',
         'last name': 'Некрасова'}}


In [None]:
employees["id3"]["age"] = "26"
pprint(employees)

{'id1': {'age': 30,
         'first name': 'Александр',
         'job': 'программист',
         'last name': 'Иванов'},
 'id2': {'age': 35,
         'first name': 'Ольга',
         'job': 'ML-engineer',
         'last name': 'Петрова'},
 'id3': {'age': 26,
         'first name': 'Дарья',
         'job': 'веб-дизайнер',
         'last name': 'Некрасова'}}


Циклы `for`

In [None]:
for info in employees.values():
    info["age"] = str(float(info["age"]) + 1)

pprint(employees)

{'id1': {'age': 30.0,
         'first name': 'Александр',
         'job': 'программист',
         'last name': 'Иванов'},
 'id2': {'age': 35.0,
         'first name': 'Ольга',
         'job': 'ML-engineer',
         'last name': 'Петрова'},
 'id3': {'age': 26.0,
         'first name': 'Дарья',
         'job': 'веб-дизайнер',
         'last name': 'Некрасова'}}


Вложенные словари и dict comprehension

In [63]:
pprint(
    {
        id: {k: (int(v) if k == "age" else v) for k, v in info.items()}
        for id, info in employees.items()
    }
)

{'id1': {'age': 30,
         'first name': 'Александр',
         'job': 'программист',
         'last name': 'Иванов'},
 'id2': {'age': 35,
         'first name': 'Ольга',
         'job': 'ML-engineer',
         'last name': 'Петрова'},
 'id3': {'age': 26,
         'first name': 'Дарья',
         'job': 'веб-дизайнер',
         'last name': 'Некрасова'}}


#### Частота слов в тексте

In [None]:
# возьмем знакомый нам текст
corpus = "When we were in Paris we visited a lot of museums. We first went"

In [65]:
words = corpus.split()
print(words)

['When', 'we', 'were', 'in', 'Paris', 'we', 'visited', 'a', 'lot', 'of', 'museums.', 'We', 'first', 'went', 'to', 'the', 'Louvre,', 'the', 'largest', 'art', 'museum', 'in', 'the', 'world.', 'I', 'have', 'always', 'been', 'interested', 'in', 'art', 'so', 'I', 'spent', 'many', 'hours', 'there.', 'The', 'museum', 'is', 'enormous,', 'so', 'a', 'week', 'there', 'would', 'not', 'be', 'enough.']


In [66]:
# с помощью list comprehension удалим точки, запятые и переведем все слова в нижний регистр
words = [word.strip(".").strip(",").lower() for word in words]
print(words)

['when', 'we', 'were', 'in', 'paris', 'we', 'visited', 'a', 'lot', 'of', 'museums', 'we', 'first', 'went', 'to', 'the', 'louvre', 'the', 'largest', 'art', 'museum', 'in', 'the', 'world', 'i', 'have', 'always', 'been', 'interested', 'in', 'art', 'so', 'i', 'spent', 'many', 'hours', 'there', 'the', 'museum', 'is', 'enormous', 'so', 'a', 'week', 'there', 'would', 'not', 'be', 'enough']


Способ 1. Условие if-else

In [None]:
bow_1: dict[str, int] = {}
for word in words:
    if word in bow_1:
        bow_1[word] += 1
    else:
        bow_1[word] = 1

print(sorted(bow_1.items(), key=lambda x: x[1], reverse=True)[:6])

[('the', 4), ('we', 3), ('in', 3), ('a', 2), ('art', 2), ('museum', 2)]

In [None]:
bow_2: dict[str, int] = {}

for word in words:
    bow_2[word] = bow_2.get(word, 0) + 1

print(sorted(bow_2.items(), key=lambda x: x[1], reverse=True)[:6])

[('the', 4), ('we', 3), ('in', 3), ('a', 2), ('art', 2), ('museum', 2)]

In [69]:
bow_3 = Counter(words)

bow_3.most_common(6)

[('the', 4), ('we', 3), ('in', 3), ('a', 2), ('art', 2), ('museum', 2)]

### Дополнительные материалы

#### Изменяемые и неизменяемые типы данных

Неизменяемый тип данных

In [None]:
string = "Python"
print(id(string), type(string), string)

(2159655129360, str, 'Python')

In [None]:
string += " is cool"
print(id(string), type(string), string)

(2159763129392, str, 'Python is cool')

Изменяемый тип данных

In [None]:
lst = [1, 2, 3]
print(id(lst), type(lst), lst)

(2159763180224, list, [1, 2, 3])

In [None]:
lst.append(4)
print(id(lst), type(lst), lst)

(2159763180224, list, [1, 2, 3, 4])

Копирование объектов

In [None]:
string = "Python"
string2 = string
string2 += " is cool"
print(string, string2)

('Python', 'Python is cool')

In [75]:
# оператор == сравнивает значения (values)
# оператор is сравнивает identities
string == string2, string is string2

(False, False)

In [76]:
lst = [1, 2, 3]
lst2 = lst
lst2.append(4)
lst, lst2

([1, 2, 3, 4], [1, 2, 3, 4])

In [77]:
lst == lst2, lst is lst2

(True, True)

In [78]:
lst = [1, 2, 3]
lst2 = lst.copy()
lst2.append(4)
lst, lst2

([1, 2, 3], [1, 2, 3, 4])

In [79]:
lst.append(4)
lst, lst2, lst == lst2, lst is lst2

([1, 2, 3, 4], [1, 2, 3, 4], True, False)