### Интернирование 

https://stepik.org/lesson/624529/step/11?unit=620219

    Интернирование – это процесс хранения в памяти только одной копии объекта. Это означает, что, когда мы создаем две строки (два целых числа) с одинаковыми значениями, то вместо выделения памяти для них обоих, только одна строка (целое число) фактически фиксируется в памяти. Другая же просто указывает на то же самое место в памяти. Для реализации данной оптимизации Python использует специальную таблицу, которая называется пул интернирования. Эта таблица содержит одну уникальную ссылку на каждый объект строкового типа, либо целого числа

        Основные преимущества интернирования:

        экономия памяти: мы не храним копии одинаковых объектов
        быстрые сравнения: сравнение интернированных строк происходит намного быстрее, чем неинтернированных строк. Это происходит потому, что для сравнения интернированных строк нужно только сравнить, совпадают ли их адреса в памяти, а не сравнивать их содержимое

Целые числа

Поскольку небольшие целые числа встречаются достаточно часто в нашем коде, Python интернирует их в диапазоне от 

−5 до 256.

In [1]:
num1 = 100
num2 = 100

num3 = 1000
num4 = 1000

print(num1 is num2, num1 == num2)
print(num3 is num4, num3 == num4)

True True
False True


In [2]:
# независимо от того, каким образом мы создаем целочисленный объект, если он находится в диапазоне выше 
# он будет интернирован.

num1 = 100 
num2 = int(100)
num3 = int('100')
num4 = 1 + 2 + 97

print(id(num1))
print(id(num2))
print(id(num3))
print(id(num4))

4441853264
4441853264
4441853264
4441853264


Интернирование строк
В Python 3.7 интернируются строки, содержащие не более 
20 символов и состоящие только:
- из ASCII-букв,
- цифр 
- и знаков подчёркивания. 

Данный набор символов был выбран потому, что он часто используются в нашем коде

а в версии от 3.8 - 4096 символов, но все равно только букв

In [3]:
s1 = 'beegeek'
s2 = 'beegeek'
s3 = 'bee' + 'geek'

print(id(s1))
print(id(s2))
print(id(s3))

4497508144
4497508144
4497508144


In [4]:
s1 = 'beegeek!'
s2 = 'beegeek!'

print(id(s1))
print(id(s2))

4497508208
4497510000


In [5]:
s1 = 'b' * 4096
s2 = 'b' * 4096

s3 = 'b' * 5000
s4 = 'b' * 5000

print(s1 is s2)
print(s3 is s4)

True
False


        Функция sys.intern()
        Как мы уже знаем, Python интернирует лишь строки, содержащие не более 
        4096
        4096 символов и состоящие только из ASCII-букв, цифр и знаков подчёркивания. Однако функция intern() из модуля sys позволяет интернировать любую строку, например, содержащую 
        5000
        5000 символов или состоящую из букв русского алфавита. Данная функция принимает в качестве аргумента строку, добавляет ее в пул интернирования (если ее там нет) и возвращает интернированную строку.

In [6]:
s1 = 'степик!'
s2 = 'степик!'

print(s1 is s2)

False


In [7]:
import sys

s1 = sys.intern('степик!')
s2 = sys.intern('степик!')

print(s1 is s2)

True


### Присваивание

Оператор присваивания в Python не создает копию объекта, он лишь связывает имя переменной с объектом.

In [8]:
nums1 = [1, 2, 3]
nums2 = nums1

nums1.append(4)

print(nums1)
print(nums2)

[1, 2, 3, 4]
[1, 2, 3, 4]


In [9]:
nums = [1, 2, 3]

print(nums)
print(id(nums))

nums = [1, 2, 3] + [4]

print(nums)
print(id(nums))

[1, 2, 3]
4496733248
[1, 2, 3, 4]
4496734720


Кортежи (тип tuple) являются неизменяемыми, однако если элементами кортежа являются изменяемые объекты, то мы можем изменить эти объекты.

        При этом важно понимать: меняются объекты, являющиеся элементами кортежа, а не кортеж. Кортеж лишь содержит ссылки на эти объекты, которые остаются прежними при изменении самих объектов.

In [10]:
data = (1, 'bee', [1, 2, 3], {'a': 1})

print(data)

data[2][2] = 30
data[3]['b'] = 2

print(data)

(1, 'bee', [1, 2, 3], {'a': 1})
(1, 'bee', [1, 2, 30], {'a': 1, 'b': 2})


        Примечание 2. Python по разному обрабатывает сложение списков с помощью операторов + и +=.



In [11]:
# здесь создается новый список, который присваивается переменной 1 
nums1 = [1, 2, 3]
nums2 = nums1

nums1 = nums1 + [4, 5]

print(nums1)
print(nums2)

[1, 2, 3, 4, 5]
[1, 2, 3]


In [13]:
# а здесь список 1 изменяется
nums1 = [1, 2, 3]
nums2 = nums1

nums1 += [4, 5]

print(nums1)
print(nums2)

[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5]


    Примечание 3. Считается плохой практикой использование изменяемых типов данных в качестве значений параметров по умолчанию, так как значение по умолчанию для параметра создается единожды при определении функции (обычно при загрузке модуля) и становится атрибутом (свойством) функции. Поэтому если значением по умолчанию является изменяемый объект, то его изменение повлияет на каждый следующий вызов функции.

### Поверхностное и глубокое копирование объектов

Модуль copy содержит две функции:

    copy(): копирует объект и возвращает его поверхностную копию
    deepcopy(): копирует объект и возвращает его глубокую копию

Поверхностное копирование создает отдельный новый объект, но вместо **КОПИРОВАНИЯ ДОЧЕРНИХ ЭЛЕМЕНТОВ В НОВЫЙ ОБЪЕКТ, ОНО ПРОСТО КОПИРУЕТ ССЫЛКИ НА ИХ АДРЕСА ПАМЯТИ.**

In [14]:

data1 = [1, 2, 3]
data2 = data1.copy()
data1.append(4)

print(id(data1), data1)
print(id(data2), data2)

4497520448 [1, 2, 3, 4]
4497422848 [1, 2, 3]


В  примере выше элементами списка являются целые числа (неизменяемый тип int), поэтому изменение одного списка не отражается на другом. 

Если бы элементами списка были бы изменяемые типы, то поверхностное копирование скопировало бы лишь ссылки на их адреса памяти. Следовательно, любое **ИЗМЕНЕНИЕ ЭЛЕМЕНТОВ ОДНОГО ОБЪЕКТА ОТРАЗИЛОСЬ БЫ ТАКЖЕ И НА ЭЛЕМЕНТАХ ДРУГОГО ОБЪЕКТА**

In [15]:
data1 = [[1, 2, 3], [4, 5, 6]]
data2 = data1.copy()

data1[0].append(7)
data2[1].append(8)

print(id(data1), data1)
print(id(data2), data2)

4496374720 [[1, 2, 3, 7], [4, 5, 6, 8]]
4497518720 [[1, 2, 3, 7], [4, 5, 6, 8]]


ГЛУБОКОЕ КОПИРОВАНИЕ создает новую и отдельную копию всего объекта со своим уникальным адресом памяти. 

Это означает, что **ЛЮБЫЕ ИЗМЕНЕНИЯ, ВНЕСЕННЫЕ ВАМИ В НОВУЮ КОПИЮ ОБЪЕКТА, НЕ БУДУТ ОТРАЖАТЬСЯ В ИСХОДНОЙ, И НАОБОРОТ.**

In [16]:
from copy import deepcopy
data1 = [[1, 2, 3], [4, 5, 6]]
data2 = deepcopy(data1)

data1[0].append(7)
data2[1].append(8)

print(id(data1), data1)
print(id(data2), data2)

4497420992 [[1, 2, 3, 7], [4, 5, 6]]
4496734144 [[1, 2, 3], [4, 5, 6, 8]]


Встроенные функции, используемые при создании коллекций (list, set, dict, ...), также могут быть использованы для создания поверхностной копии объектов.

In [17]:
data1 = [1, 2, 3, 4]
data2 = {'a': 1, 'b': 2}
data3 = {1, 2, 3, 4}

new_data1 = list(data1)
new_data2 = dict(data2)
new_data3 = set(data3)

print(data1 is new_data1, data1 == new_data1)
print(data2 is new_data2, data2 == new_data2)
print(data3 is new_data3, data3 == new_data3)

False True
False True
False True


In [19]:
# срез тоже создает ПОВЕРХНОСТНУЮ копию
data = [1, 2, 3, 4]

new_data = data[:]

print(data is new_data, data == new_data)

False True


Посмотреть размер всотроенныйх объектов (список, строка, число и пр) в байтах

Примечание: Обратите внимание на то, что с помощью функции getsizeof() нельзя вычислять размер сложных объектов, содержащих вложенные структуры (списки списков и т.д.). Для того чтобы правильно определять размер абсолютно любого объекта (включая пользовательские) в Python используется функция asizeof() модуля asizeof, который находится в библиотеке pympler.

In [20]:
import sys

print(sys.getsizeof(10))
print(sys.getsizeof(True))
print(sys.getsizeof(None))
print(sys.getsizeof(''))
print(sys.getsizeof('beegeek'))

28
28
16
49
56


### Очистка памяти

https://stepik.org/lesson/624149/step/1?unit=619837