# Словари, frozenset

## Set comprehension
***Set comprehension*** — это способ создания множества на основе другой последовательности или итерируемого объекта с применением условий и выражений.  
Синтаксис полностью аналогичен List comprehension, за исключением фигурных скобок вместо квадратных.  
*Синтаксис:*  
`new_set = {expression for item in iterable}`


In [29]:
# Создание множества с числами
numbers = [1, 2, 2, 4, 7, 8, 8, 10]
even_numbers_set = {num for num in numbers if num % 2 == 0}
print(even_numbers_set)


{8, 2, 10, 4}


In [None]:
#1. Какой результат будет выведен при выполнении следующего кода?
words = ["apple", "banana", "cherry", "apple"]
unique_lengths = {len(word) for word in words}
print(unique_lengths)


## frozenset
***frozenset*** — это неизменяемый аналог обычного множества. В отличие от множества, элементы frozenset не могут быть добавлены, удалены или изменены после создания.


### Создание frozenset
frozenset создаётся с помощью одноимённой функции, в которую передается итерируемый объект:  

In [30]:
immutable_set = frozenset([1, 2, 3, 4, 5])
print(immutable_set)
immutable_from_range = frozenset(range(10))
print(immutable_from_range)

frozenset({1, 2, 3, 4, 5})
frozenset({0, 1, 2, 3, 4, 5, 6, 7, 8, 9})


### Хешируемость frozenset
***frozenset*** является неизменяемым и хешируемым объектом. Это позволяет использовать его в качестве элемента множества, в отличие от обычного множества set, которое не может быть элементом другого множества из-за своей изменяемости.


In [32]:
# Создание frozenset
frozen_set1 = frozenset([1, 2, 3])
frozen_set2 = frozenset([4, 5, 6])


# Создание множества, содержащего frozenset
set_of_frozensets = {frozen_set1, frozen_set2}
print(set_of_frozensets)
# Попытка создать множество, содержащее другие множества
# set_of_sets = {{1, 2, 3}, {4, 5, 6}}  # Вызовет TypeError


{frozenset({1, 2, 3}), frozenset({4, 5, 6})}


In [33]:
type(set_of_frozensets)

set

In [34]:
# Попытка создать множество, содержащее другие множества
set_of_sets = {{1, 2, 3}, {4, 5, 6}}  # Вызовет TypeError

TypeError: unhashable type: 'set'

### Сравнение set и frozenset
set и frozenset — это оба типа множеств, которые поддерживают уникальные элементы и позволяют выполнять множество операций, таких как объединение, пересечение и разность. Однако между ними есть важные различия, которые влияют на их применение.


![image.png](attachment:b49b7a2a-3172-4ef8-9072-015554c53b8c.png)

In [35]:
#2. Какой результат будет выведен при выполнении следующего кода?
immutable_set = frozenset([1, 2, 3])
new_set = immutable_set.union({4, 5})
print(new_set)


frozenset({1, 2, 3, 4, 5})


In [36]:
print(immutable_set)

frozenset({1, 2, 3})


In [37]:
s1 = {1,2,3}
s2 = {4,5}

print(s1 | s2)

{1, 2, 3, 4, 5}


In [40]:
s1 = s1.union(s2)
print(s1)

{1, 2, 3, 4, 5}


## Словари
Словарь (или ассоциативный массив) — это структура данных, представляющая собой неупорядоченную изменяемую коллекцию пар "ключ-значение".


### Создание словарей
Словари в Python представляют собой коллекцию пар "ключ-значение". Каждый ключ в словаре уникален и используется для доступа к соответствующему значению. Словари позволяют хранить и быстро получать доступ к данным благодаря использованию ключей, которые могут быть любыми неизменяемыми объектами, такими как строки, числа или кортежи.


### 1. Создание словаря с использованием фигурных скобок:
`my_dict = {`  
`    key1: value1,`  
`    key2: value2,`  
`    ...`  
`}`  


* key — уникальный объект (ключ), по которому можно получить соответствующее значение.  
* value — данные (значение), которые хранятся по ключу.


In [41]:
person = {"name": "Alice", "age": 30, "city": "New York"}
print(person)


{'name': 'Alice', 'age': 30, 'city': 'New York'}


### 2. Создание пустого словаря:
Создать пустой словарь для последующего добавления элементов можно с помощью фигурных скобок или функции dict().


In [42]:
empty_dict = {}
print(empty_dict)


empty_dict = dict()
print(empty_dict)


{}
{}


## Хранение словаря в памяти  
Словари в Python реализованы с использованием хеш-таблиц, что обеспечивает быстрый доступ к значениям по ключу.  
### Как словарь хранится в памяти  
**1. Хеширование ключей:**  
   * Когда элемент добавляется в словарь, ключ хешируется с помощью хеш-функции. Хеш-функция вычисляет уникальное (в большинстве случаев) хеш-значение, которое определяет, где именно в памяти будет храниться элемент.  
   * Хеширование позволяет словарям быстро находить значение по ключу: доступ по ключу за постоянное время.
     
**2. Хеш-таблица:**  
   * Словарь использует хеш-таблицу, в которой хранятся пары "ключ-значение". Позиции в хеш-таблице определяются хеш-значением ключа.  
   * Если несколько ключей имеют одинаковое хеш-значение (коллизии), используется метод цепочек для разрешения конфликта.
      
**3. Занимаемая память:**  
   * Память, занимаемая словарём, может быть больше, чем просто сумма размеров ключей и значений. Это связано с внутренней структурой хеш-таблицы и необходимостью оставлять "запас" для вставки новых элементов.  
   * По мере добавления новых элементов размер хеш-таблицы увеличивается, что может привести к рехешированию — перестроению таблицы с целью поддержания производительности.
     
**4. Порядок элементов:**  
   * Начиная с Python 3.7, словари сохраняют порядок вставки элементов. Это значит, что элементы будут возвращаться в том же порядке, в котором они были добавлены. Это стало возможным благодаря изменениям в реализации словарей — теперь они используют упорядоченные хеш-таблицы.  
   * С технической стороны, каждый элемент словаря хранится как пара "ключ-значение" в памяти, и к каждой такой паре добавляется ссылка на следующий элемент. Это позволяет сохранять порядок вставки элементов.

### Преимущества хранения словаря в памяти:  
1. ***Быстрый доступ:*** Словари обеспечивают быстрый доступ к элементам благодаря хешированию ключей.
2. ***Гибкость:*** Словари могут хранить данные любых типов в качестве значений (включая списки, множества, другие словари и т.д.).
3. ***Уникальные ключи:*** Каждый ключ в словаре уникален, что упрощает работу с данными, когда требуется быстрый поиск и проверка существования элементов.


### Ограничения:
1. ***Память:*** Из-за внутренней структуры хеш-таблицы словари могут занимать больше памяти по сравнению с другими структурами данных (например, списками).
2. ***Изменяемость ключей:*** Ключи должны быть неизменяемыми и хешируемыми (например, строки, числа, кортежи).

### Особенности словарей  
1. **Ключи должны быть уникальными и хешируемыми:**  
   * В словарях каждый ключ должен быть уникальным. Если в словарь добавляется пара с уже существующим ключом, предыдущее значение заменяется новым.
   * Ключи должны быть хешируемыми. Это означает, что в качестве ключей могут выступать только неизменяемые типы данных, такие как строки, числа и кортежи, но не списки или другие изменяемые объекты.
2. **Гибкость значений:**   
   * В качестве значений в словаре могут использоваться любые объекты Python, включая строки, списки, множества, другие словари и прочие типы данных.
3. **Быстрый доступ к значениям:**  
   * Словари предоставляют быстрый доступ к значениям по ключу с помощью хеш-таблиц, что делает поиск, добавление и удаление элементов эффективным по времени.
4. **Сохранение порядка элементов (начиная с Python 3.7):**  
   * В версиях Python 3.7 и выше порядок вставки элементов в словарь сохраняется. Это означает, что элементы будут перечисляться в том порядке, в котором они были добавлены.
5. **Изменяемость значений:**  
   * Словари — изменяемые структуры данных. Это означает, что вы можете изменять значения, добавлять и удалять пары "ключ-значение" после создания словаря.


### Изменяемые: список, множество, словари
### Неизменяемые: числа, кортежи, фрозенсет, строки



### Особенности хеширования  
В Python числа 1, 1.0 и True обладают одинаковым хешем:
* При сравнении 1 == 1.0 == True результатом будет True.
* Функция hash вернет единицу для значений 1, 1.0 и True.


In [43]:
print(hash(1)) 
print(hash(1.0))
print(hash(True)) 

1
1
1


### Последствия для словарей и множеств
При использовании 1, 1.0 и True в качестве ключей в одном словаре или элементах множества, они будут рассматриваться как один и тот же ключ или элемент. Например:


In [44]:
my_dict = {1.0: "float", 1: "integer", True: "boolean"}
print(my_dict)


{1.0: 'boolean'}


В этом примере значение 1.0: "float" будет перезаписано значением 'boolean', так как все три ключа считаются одинаковыми. При этом ключ остается первый из добавленных.
Множества также будут содержать только один из таких элементов:


In [45]:
my_set = {True, 1, 1.0}
print(my_set)


{True}


In [46]:
#2. Какой результат будет выведен при выполнении следующего кода?
my_dict = {1: "one", 2.0: "float one", True: "boolean one"}
print(my_dict)


{1: 'boolean one'}


## Преобразование в словарь
В Python можно преобразовать другие коллекции в словарь, если они содержат данные в формате, совместимом со структурой "ключ-значение".


### Особенности преобразования:
* Ключи в словаре должны быть хешируемыми и уникальными.
* При преобразовании коллекций с дублирующимися ключами будет сохранено только последнее значение.
* Если структура данных не совместима с форматом "ключ-значение", преобразование в словарь приведёт к ошибке.


***1. Преобразование именованных аргументов в словарь:***  
Функция dict() позволяет создавать словарь из пар ключ-значение, передаваемых как именованные аргументы.


In [48]:
# Словарь с использованием функции dict()
person = dict(name="Bob", age=25, city="London", email = 'a@tu.tu')
print(person)

{'name': 'Bob', 'age': 25, 'city': 'London', 'email': 'a@tu.tu'}


***2. Преобразование других коллекций в словарь:***  
Функция dict() может быть использована для преобразования последовательности пар (например, списка кортежей) в словарь. Важно чтобы вложенные коллекции состояли ровно из двух элементов и имели неизменяемый элемент на нулевом индексе.


In [49]:
# Список кортежей
pairs = [("name", "Charlie"), ("age", 35), ("city", "Paris")]
person = dict(pairs)
print(person) 

{'name': 'Charlie', 'age': 35, 'city': 'Paris'}


In [50]:
# Список списков
pairs = [["name", "Charlie"], ["age", 35], ["city", "Paris"]]
person = dict(pairs)
print(person)

{'name': 'Charlie', 'age': 35, 'city': 'Paris'}


In [53]:
# Несоответствующее количество элементов
not_pairs = [("name", "Charlie"), ["age", 35], ["city", "Paris", "Berlin"]]
person = dict(not_pairs)  # Вызовет ошибку
print(person)

ValueError: dictionary update sequence element #2 has length 3; 2 is required

In [56]:


# Нехешируемый ключ
pairs = [(["name", "surname"], "Charlie"), ["age", 35], ["city", "Paris"]]
person = dict(pairs)  # Вызовет ошибку
print(person)


TypeError: unhashable type: 'list'

## Доступ к значениям по ключам  
Для доступа к значениям в словаре по ключам можно использовать простой синтаксис с квадратными скобками. Это позволяет быстро получать значение, связанное с указанным ключом.  

***Синтаксис:***  
`variable = dictionary[key]`  


* dictionary — объект словаря, из которого вы хотите получить значение.
* key — ключ, по которому будет извлечено связанное значение.
* variable — переменная, в которой можно сохранить значение, связанное с указанным ключом.
  
***Особенности:***  
* Если ключ существует, будет возвращено соответствующее значение.
* Если ключ отсутствует, возникает ошибка KeyError.


In [59]:
# Получение значения по ключу:
my_dict = {"name": "Alice", "age": 30}
print(my_dict["name"])
print(my_dict["age"])
# print(my_dict["city"])  # Вызовет ошибку


Alice
30


In [58]:
print(my_dict["city"])  # Вызовет ошибку

KeyError: 'city'

In [60]:
#1. Какой результат будет выведен при выполнении следующего кода?
pairs = [("name", "Charlie"), ("age", 35), ("city", "Paris"), ("name", "Bob")]
person = dict(pairs)
print(person)
print(person["name"])


{'name': 'Bob', 'age': 35, 'city': 'Paris'}
Bob


In [66]:
#2. Какой результат будет выведен при выполнении следующего кода?
not_pairs = [("name", "Charlie"), ["age", 35], ["city", "Paris", "Berlin"]]
person = dict(not_pairs)
print(person)


ValueError: dictionary update sequence element #2 has length 3; 2 is required

# Все неизменяемые структуры являются хэшируемыми!!!!!

### Оператор in
Оператор in используется для проверки, существует ли указанный ключ в словаре.
Он часто используется для проверки наличия ключа перед доступом к значению, чтобы избежать ошибки KeyError.


In [68]:
my_dict = {"name": "Alice", "age": 30}
if "name" in my_dict:
    print(my_dict["name"])  # Выведет значение по ключу 'name'
if "city" in my_dict:
    print(my_dict["city"])  # Не выполняется, так как ключ 'city' отсутствует


Alice


### Цикл по словарю

In [69]:
my_dict = {"name": "Alice", "age": 30}

for item in my_dict:
    print(item)

name
age


In [70]:
for item in my_dict.values():
    print(item)

Alice
30


## Добавление и обновление данных  
Словари позволяют быстро добавлять новые пары "ключ-значение" или обновлять существующие значения по ключу.


### Добавление новой пары "ключ-значение"
* Чтобы добавить новый элемент в словарь, достаточно присвоить значение новому ключу.


In [71]:
my_dict = {"name": "Alice", "age": 30}
my_dict["city"] = "New York"  # Добавление нового элемента
print(my_dict)


{'name': 'Alice', 'age': 30, 'city': 'New York'}


### Обновление значения по существующему ключу
* Если ключ уже существует в словаре, присваивание нового значения обновит его.


In [72]:
my_dict = {"name": "Alice", "age": 30}
my_dict["age"] = 31  # Обновление значения по ключу "age"
print(my_dict)


{'name': 'Alice', 'age': 31}


### Метод update()
* Метод update() позволяет добавлять несколько пар "ключ-значение" или обновлять значения существующих ключей.
* Можно передать другой словарь или другую последовательность пар ключ-значение.


In [73]:
# Обновление значений и добавление новых ключей
my_dict = {"name": "Alice", "age": 30}
my_dict.update({"age": 32, "country": "USA"})
print(my_dict) 

{'name': 'Alice', 'age': 32, 'country': 'USA'}


In [74]:
# Обновление с использованием списка кортежей
my_dict.update([("name", "Bob"), ("email", "bob@example.com")])
print(my_dict) 


{'name': 'Bob', 'age': 32, 'country': 'USA', 'email': 'bob@example.com'}


In [75]:

# Обновление с использованием именованных аргументов
my_dict.update(city="New York", orders=[])
print(my_dict)


{'name': 'Bob', 'age': 32, 'country': 'USA', 'email': 'bob@example.com', 'city': 'New York', 'orders': []}


### Особенности добавления и обновления:
* Если ключ уже существует, его значение будет обновлено.
* Если ключ отсутствует, он будет добавлен в словарь.


## Удаление данных
### Оператор del
* Удаляет элемент с указанным ключом из словаря.
* Если ключ отсутствует, возникает ошибка KeyError.


In [76]:
my_dict = {"name": "Alice", "age": 30, "city": "New York"}
del my_dict["age"]
print(my_dict)
# del my_dict["email"]  # Вызовет ошибку


{'name': 'Alice', 'city': 'New York'}


### Метод clear()
* Удаляет все элементы из словаря, оставляя пустой словарь.


In [77]:
my_dict = {"name": "Alice", "age": 30}
my_dict.clear()
print(my_dict)


{}


## Удаление и получение данных
### Метод pop()
* Удаляет элемент по указанному ключу и возвращает его значение.
* Если ключ отсутствует и значение по умолчанию не указано, возникает ошибка KeyError.


In [78]:
my_dict = {"name": "Alice", "age": 30}
age = my_dict.pop("age")
print(age)
print(my_dict)
# my_dict.pop("email")  # Вызовет ошибку


30
{'name': 'Alice'}


### Метод popitem()
* Удаляет и возвращает последнюю добавленную пару (начиная с Python 3.7) или случайную пару.
* Если словарь пуст, возникает ошибка KeyError.


In [79]:
my_dict = {"name": "Alice", "age": 30}
last_item = my_dict.popitem()
print(last_item)
print(my_dict)


('age', 30)
{'name': 'Alice'}


# Практические задания

In [80]:
#1. Какой результат будет выведен при выполнении следующего кода?
my_dict = {"name": "Alice", "age": 30}
my_dict.update({"city": "New York", "age": 35})
print(my_dict)


{'name': 'Alice', 'age': 35, 'city': 'New York'}


In [81]:
#2. Какой результат будет выведен при выполнении следующего кода?
my_dict = {"name": "Alice", "age": 30}
del my_dict["age"]
print(my_dict)


{'name': 'Alice'}


In [82]:
#3. Какое значение будет возвращено при выполнении следующего кода?
my_dict = {"name": "Alice", "age": 30}
value = my_dict.pop("age")
print(value)


30


In [83]:
print(my_dict)

{'name': 'Alice'}
