# Присваивание и копирование объектов в Python

Идентификаторы в Python (имена переменных, функций, классов) - это указатели на объекты. У идентификатора нет типа, это просто имя. Тип, а точнее, класс, есть у объекта, на который указывает идентификатор.

In [1]:
x = 1
y = x
print('x', x, type(x), id(x))
print('y', y, type(y), id(y))

y = 'hi'
print('x', x, type(x), id(x))
print('y', y, type(y), id(y))

x 1 <class 'int'> 1589626544
y 1 <class 'int'> 1589626544
x 1 <class 'int'> 1589626544
y hi <class 'str'> 2548872978928


В строке 1 создан экземпляр класса `int` со значением `1` и присвоен имени `x`, которое теперь указывает на него.
В строке 2 в результате присваивания имя `y` указывает на тот же объект, на который указывает `x`.
Что подтверждается выводом на печать в строках 3 и 4.

Функция `type()` возвращает класс объекта, а `id()` возвращает уникальный идентификатор объекта. Как видим, идентификаторы объектов, на которые указывают `x` и `y` после присваивания в строке 2, совпадают. А это значит, что `x` и `y` указывают на один и тот же объект.

В строке 6 создан экземпляр класса `str` со значением `'hi'` и присовен имени `y`, которое теперь указывает на него.
Имя `x` по-прежнему указывает на ранее созданный объект `int`.
Что подтверждается выводом на печать в строках 7 и 8.

Аналогичная история - копирование указателя на объект, а не самого объекта - происходит, когда значение переменной передается в функцию в качестве аргумента. Затем внутри функции параметру можно присвоить другое значение:

In [2]:
x = 1

def f(z):
    print('x', x, type(x), id(x))
    print('z', z, type(z), id(z))
    z = 'hi'
    print('x', x, type(x), id(x))
    print('z', z, type(z), id(z))

f(x)

x 1 <class 'int'> 1589626544
z 1 <class 'int'> 1589626544
x 1 <class 'int'> 1589626544
z hi <class 'str'> 2548872978928


Из примера видно, что внутри функции `f` имена `x` и `z` указывают на один и тот же объект `int` со значением 1, пока имени z не присваивается другой объект `str` со значением `hi`.

Имена атрибутов объектов тоже работают как указатели на объекты. Убедимся в этом с помощью функции `id()`:

In [3]:
class Cls(object):
    pass

obj = Cls()
greeting = 'привет'

obj.greeting = greeting
print('    greeting', greeting, type(greeting), id(greeting))
print('obj.greeting', obj.greeting, type(obj.greeting), id(obj.greeting))

    greeting привет <class 'str'> 2548909702240
obj.greeting привет <class 'str'> 2548909702240


Помимо собственно идентификаторов, элементы составных объектов (таких как списки, словари), доступные с помощью индексирования, - тоже указатели на объекты. Вот пример со списком:

In [4]:
x = [0, 1]
x0 = x[0]
print('x[0]', x[0], type(x[0]), id(x[0]))
print('  x0', x0, type(x0), id(x0))

x[0] 0 <class 'int'> 1589626512
  x0 0 <class 'int'> 1589626512


Итак, на многих примерах мы видим, что присваивание вида `y = x` создает еще один указатель `y` на объект, на который указывает `x`. Если таким образом присвоить изменяемый составной объект, то изменять его отдельные элементы можно будет с помощью любого из этих указателей (имен).

Следующий пример демонстрирует это:

In [5]:
x = [0, 1]
y = x
print('x', x, id(x), id(x[0]), id(x[1]))
print('y', y, id(y), id(y[0]), id(y[1]))

x[0] = 5
y[1] = 6
print('x', x, id(x), id(x[0]), id(x[1]))
print('y', y, id(y), id(y[0]), id(y[1]))

x [0, 1] 2548910054088 1589626512 1589626544
y [0, 1] 2548910054088 1589626512 1589626544
x [5, 6] 2548910054088 1589626672 1589626704
y [5, 6] 2548910054088 1589626672 1589626704


После присваиваний в строках 1 и 2 имена `x` и `y` указывают на один и тот же список из двух элементов `[0, 1]`. Далее в строках 6 и 7 оба элемента этого списка получают новые значения, причем список адресуется через разные имена `x` и `y`.

После присваивания одному из имен `x` или `y` другого объекта имена больше не будут указывать на один и тот же объект:

In [6]:
x = [2, 3]
print('x', x, id(x), id(x[0]), id(x[1]))
print('y', y, id(y), id(y[0]), id(y[1]))

x [2, 3] 2548909996616 1589626576 1589626608
y [5, 6] 2548910054088 1589626672 1589626704


Аналогично, при передаче составного изменяемого объекта в функцию в качестве аргумента, внешний по отношению к функции объект может быть изменен изнутри функции, благодаря тому, что параметр содержит указатель на объект:

In [7]:
x = [0, 1]

def f(z):
    print('z', x, id(z), id(z[0]), id(z[1]))
    z[0] = 5
    z[1] = 6
    print('z', x, id(z), id(z[0]), id(z[1]))

print('x', x, id(x), id(x[0]), id(x[1]))
f(x)
print('x', x, id(x), id(x[0]), id(x[1]))

x [0, 1] 2548909994888 1589626512 1589626544
z [0, 1] 2548909994888 1589626512 1589626544
z [5, 6] 2548909994888 1589626672 1589626704
x [5, 6] 2548909994888 1589626672 1589626704


Через новый указатель на экземпляр класса доступны его атрибуты точно так же, как и через оригинальный указатель:

In [8]:
obj = Cls()
obj.greeting = 'привет'

xyz = obj
print('obj', obj, id(obj), obj.greeting, id(obj.greeting))
print('xyz', xyz, id(xyz), xyz.greeting, id(xyz.greeting))

obj.greeting = 'salut'
print('obj', obj, id(obj), obj.greeting, id(obj.greeting))
print('xyz', xyz, id(xyz), xyz.greeting, id(xyz.greeting))

obj <__main__.Cls object at 0x0000025176E16B38> 2548910091064 привет 2548909701928
xyz <__main__.Cls object at 0x0000025176E16B38> 2548910091064 привет 2548909701928
obj <__main__.Cls object at 0x0000025176E16B38> 2548910091064 salut 2548909979272
xyz <__main__.Cls object at 0x0000025176E16B38> 2548910091064 salut 2548909979272


Повторим: присваивание одного имени другому создает еще один указатель на тот же самый объект, на который указывает присваиваемое имя.

Как же получить копию объекта вместо еще одного указателя на тот же самый объект? Для этого изменяемые объекты в Python имеют метод `copy`. А неизменяемые объекты скопировать невозможно, потому что нет смысла: изменить их нельзя, их состояние всегда остается одним и тем же, зачем же плодить одинаковые сущности?

Получим *копию* списка с помощью метода `copy` и свяжем ее с новым именем:

In [9]:
x = [0, 1]
y = x.copy()
print('x', x, id(x), id(x[0]), id(x[1]))
print('y', y, id(y), id(y[0]), id(y[1]))

x[0] = 5
y[1] = 6
print('x', x, id(x), id(x[0]), id(x[1]))
print('y', y, id(y), id(y[0]), id(y[1]))

x [0, 1] 2548909995016 1589626512 1589626544
y [0, 1] 2548909883720 1589626512 1589626544
x [5, 1] 2548909995016 1589626672 1589626544
y [0, 6] 2548909883720 1589626512 1589626704


Элементы оригинального списка `x` и списка-копии `y` сразу после копирования указывают на одни и те же объекты. Но сами списки - разные, они имеют разные `id` и изменения в них вносятся независимо. После присваиваний в строках 6 и 7 элементы списков указывают на разные объекты.

Однако, если список содержит не целые числа, как в рассмотренном примере, а изменяемые составные объекты, то копирования с помощью метода `copy` недостаточно для получения списка-копии, независимого от оригинала. Рассмотрим копирование двумерного списка, то есть, списка, элементами которого являются списки:

In [10]:
x = [[0, 1], [2, 3]]
y = x.copy()
print('x', x, id(x), id(x[0]), id(x[1]))
print('y', y, id(y), id(y[0]), id(y[1]))

x[0][0] = 9
y[1][0] = 9
print('x', x, id(x), id(x[0]), id(x[1]))
print('y', y, id(y), id(y[0]), id(y[1]))

x [[0, 1], [2, 3]] 2548908854664 2548909699016 2548909886280
y [[0, 1], [2, 3]] 2548908655432 2548909699016 2548909886280
x [[9, 1], [9, 3]] 2548908854664 2548909699016 2548909886280
y [[9, 1], [9, 3]] 2548908655432 2548909699016 2548909886280


Метод `copy` создал список-копию `y`, содержащий указатели на вложенные списки, изначально имевшие значения `[0, 1]` и `[2, 3]`. Сами вложенные списки не были скопированы! В строках 6 и 7 мы изменили значения элементов с индексом 0 в обоих вложенных списках, получив к ним доступ через ориигнальный список `x` и список-копию `y`. Как видим, оба изменения отразились в обоих двумерных списках `x` и `y`.

Разумеется, вложенные словари демонстрируют такое же поведение.

Так же ведут себя изменяемые объекты определенных пользователями классов. Для их копирования воспользуемся функцией `copy` из модуля `copy`. Пока атрибуты объекта указывают на неизменяемые объекты (такие как `int`, `str`, `tuple`), значения атрибутов у оригинального объекта и объекта-копии независимы:

In [11]:
from copy import copy

obj = Cls()
obj.greeting = 'привет'
xyz = copy(obj)
print('obj', obj, id(obj), obj.greeting, id(obj.greeting))
print('xyz', xyz, id(xyz), xyz.greeting, id(xyz.greeting))

obj.greeting = 'salut'
print('obj', obj, id(obj), obj.greeting, id(obj.greeting))
print('xyz', xyz, id(xyz), xyz.greeting, id(xyz.greeting))

obj <__main__.Cls object at 0x0000025176DDE978> 2548909861240 привет 2548910127288
xyz <__main__.Cls object at 0x0000025176DDEF28> 2548909862696 привет 2548910127288
obj <__main__.Cls object at 0x0000025176DDE978> 2548909861240 salut 2548910090032
xyz <__main__.Cls object at 0x0000025176DDEF28> 2548909862696 привет 2548910127288


Если же атрибут объекта указывает на составной изменяемый объект, элементы этого последнего можно изменять как через оригинальный объект, так и через объект-копию:

In [12]:
from copy import copy

obj = Cls()
obj.greeting = ['привет', 'salut']
xyz = copy(obj)
print('obj', obj, id(obj), obj.greeting, id(obj.greeting))
print('xyz', xyz, id(xyz), xyz.greeting, id(xyz.greeting))

obj.greeting[1] = 'hello'
print('obj', obj, id(obj), obj.greeting, id(obj.greeting))
print('xyz', xyz, id(xyz), xyz.greeting, id(xyz.greeting))

obj <__main__.Cls object at 0x0000025176DDEFD0> 2548909862864 ['привет', 'salut'] 2548910053320
xyz <__main__.Cls object at 0x0000025176E16748> 2548910090056 ['привет', 'salut'] 2548910053320
obj <__main__.Cls object at 0x0000025176DDEFD0> 2548909862864 ['привет', 'hello'] 2548910053320
xyz <__main__.Cls object at 0x0000025176E16748> 2548910090056 ['привет', 'hello'] 2548910053320


Как видим, изменение элемента с индексом 1 атрибута `greeting` объекта `obj` отразилось на атрибуте `greeting` объекта `xyz`. Поскольку атрибуты двух объектов после копирования указывают на один и тот же список.

Функция `copy` из модуля `copy` и метод `copy`, рассмотренный ранее, выполняют *поверхностное копирование*. При этом копируется сам объект с его атрибутами, которые являются ничем иным, как указателями на другие объекты. Эти последние объекты не копируются.

Чтобы скопировать объект и все объекты, на которые указывают его атрибуты, а также все объекты, на которые указывают их атрибуты, и так далее, нужно воспользоваться *глубоким копированием*.

В только что рассмотренных примерах заменим поверхностное копирование на глубокое:

In [13]:
from copy import deepcopy

x = [[0, 1], [2, 3]]
y = deepcopy(x)
print('x', x, id(x), id(x[0]), id(x[1]))
print('y', y, id(y), id(y[0]), id(y[1]))

x[0][0] = 9
y[1][0] = 9
print('x', x, id(x), id(x[0]), id(x[1]))
print('y', y, id(y), id(y[0]), id(y[1]))

x [[0, 1], [2, 3]] 2548909997448 2548909885384 2548910053768
y [[0, 1], [2, 3]] 2548910052872 2548910052936 2548909994824
x [[9, 1], [2, 3]] 2548909997448 2548909885384 2548910053768
y [[0, 1], [9, 3]] 2548910052872 2548910052936 2548909994824


In [14]:
from copy import deepcopy

obj = Cls()
obj.greeting = ['привет', 'salut']
xyz = deepcopy(obj)
print('obj', obj, id(obj), obj.greeting, id(obj.greeting))
print('xyz', xyz, id(xyz), xyz.greeting, id(xyz.greeting))

obj.greeting[1] = 'hello'
print('obj', obj, id(obj), obj.greeting, id(obj.greeting))
print('xyz', xyz, id(xyz), xyz.greeting, id(xyz.greeting))

obj <__main__.Cls object at 0x0000025176E16198> 2548910088600 ['привет', 'salut'] 2548909886792
xyz <__main__.Cls object at 0x0000025176E16EB8> 2548910091960 ['привет', 'salut'] 2548910054920
obj <__main__.Cls object at 0x0000025176E16198> 2548910088600 ['привет', 'hello'] 2548909886792
xyz <__main__.Cls object at 0x0000025176E16EB8> 2548910091960 ['привет', 'salut'] 2548910054920


Теперь вложенные списки изменяются независимо через оригинальный объект и объект-копию.

Подведем итог:
- присваивание в Python не копирует объект, стоящий справа от знака присваивания, а создает новое имя для него, иными словами, новый именованный указатель на него,
- копирование объектов с помощью метода `copy` или функции `copy` модуля `copy` является поверхностным в том смысле, что атрибуты объекта-копии указывают на те же самые объекты, на которые указывают атрибуты объекта-оригинала,
- для копирования объекта и рекурсивно всех объектов, на которые он ссылается, существует глубокое копирование, реализуемое функцией `deepcopy` модуля `copy`.