# Cópias de coleções de dados

* Situações de cópias:
  * Atribuição da coleção à uma nova variável
  * Quando a coleção é passada como argumento para uma função, que a copia

* Existem três níveis de cópias de coleções de dados mutáveis:
  * Simples
  * Razas
  * Profundas

## Função id()

* Quando um objeto é criado, em Python ele recebe um identificador único.
* A função **id()** retorna esse identificador.

In [2]:
print( id(10) )
print( id(3.14) )
print( id(10) )

94390203251488
139797853032624
94390203251488


In [9]:
# Recuperando o objeto a partir do id:
import ctypes

a = "PYTHON"
ida = id(a)
print( ida )

print( ctypes.cast(ida, ctypes.py_object).value )

139798387115312
PYTHON


## Cópias simples

* Usando o operador de atribuição.

* A cópia de uma coleção mutável irá possuir o mesmo identificador, então qualquer alteração em uma das coleções, altera a outra automaticamente. 

In [22]:
x = 10
print( id(x) )

y = x 
print( id(y) )

94390203251488
94390203251488


In [18]:
# Cópias simples de listas:

# Exemplo 1:
a = [10, 12.3, 5.7, 3+2j]
print("O id da lista a é:", id(a))

for i in range(0,len(a)):
  print("O id do elemento a[", i, "]=", a[i], "é:", id(a[i]))

print()

b = a     # Cópia simples (usando o operador de atribuição =)
print("O id da lista b é:", id(b))

for i in range(0,len(b)):
  print("O id do elemento b[", i, "]=", b[i], "é:", id(b[i]))

O id da lista a é: 139797775830224
O id do elemento a[ 0 ]= 10 é: 94390203251488
O id do elemento a[ 1 ]= 12.3 é: 139797776137840
O id do elemento a[ 2 ]= 5.7 é: 139797776135920
O id do elemento a[ 3 ]= (3+2j) é: 139797777013968

O id da lista b é: 139797775830224
O id do elemento b[ 0 ]= 10 é: 94390203251488
O id do elemento b[ 1 ]= 12.3 é: 139797776137840
O id do elemento b[ 2 ]= 5.7 é: 139797776135920
O id do elemento b[ 3 ]= (3+2j) é: 139797777013968


In [24]:
# Alterar um elemento da lista copiada altera o id daquele elemento, por isso é uma lista mutável
# mas o id da lista permanece o mesmo, então a alteração em qualquer uma delas altera a outra
b[1] = -7
print("O id da lista b é:", id(b))

for i in range(0,len(b)):
  print("O id do elemento b[", i, "]=", b[i], "é:", id(b[i]))

print()

print("O id da lista a é:", id(a))

for i in range(0,len(a)):
  print("O id do elemento a[", i, "]=", a[i], "é:", id(a[i]))

O id da lista b é: 139797775830224
O id do elemento b[ 0 ]= 10 é: 94390203251488
O id do elemento b[ 1 ]= -7 é: 139797776136144
O id do elemento b[ 2 ]= 5.7 é: 139797776135920
O id do elemento b[ 3 ]= (3+2j) é: 139797777013968

O id da lista a é: 139797775830224
O id do elemento a[ 0 ]= 10 é: 94390203251488
O id do elemento a[ 1 ]= -7 é: 139797776136144
O id do elemento a[ 2 ]= 5.7 é: 139797776135920
O id do elemento a[ 3 ]= (3+2j) é: 139797777013968


In [28]:
# Exemplo 2:

# O a foi copiado para dentro da função (a e x estão referenciando o mesmo objeto)
def square(x):
  print(id(x))
  for i in range(len(x)):
    x[i] **= 2                # Equivalente a x[i] = x[i]**2

a = [0, 1, 2, 3, 4]
square(a)

print(a, id(a))

139797776266816
[0, 1, 4, 9, 16] 139797776266816


In [36]:
# Cópia simples em conjuntos:

s = [10, 20, 30, 40]
print(s, id(s))

t = s  # Cópia simples
print(t, id(t))

t.remove(30)
print(s, t)

[10, 20, 30, 40] 139797775582944
[10, 20, 30, 40] 139797775582944
[10, 20, 40] [10, 20, 40]


In [39]:
# Cópia simples em dicionários:

d = dict(aplha=10, beta=20, gamma=30)
print(d, id(d))

d2 = d
print(d2, id(d2))

d2['gamma'] = 3333
print(d, d2)

{'aplha': 10, 'beta': 20, 'gamma': 30} 139797776327376
{'aplha': 10, 'beta': 20, 'gamma': 30} 139797776327376
{'aplha': 10, 'beta': 20, 'gamma': 3333} {'aplha': 10, 'beta': 20, 'gamma': 3333}


In [31]:
# Funciona para dicionários, já que são mutáveis também
# Exemplo 1: dicionários
a = {1:10, 2:12.3, 3:5.7, 4:3+2j}
print("O id de a é:", id(a))

for i in range(1,len(a)+1):
  print("O id do elemento a[", i, "]=", a[i], "é:", id(a[i]))

print()

b = a     # Cópia simples (usando o operador de atribuição =)
print("O id de b é:", id(b))

for i in range(1,len(b)+1):
  print("O id do elemento b[", i, "]=", b[i], "é:", id(b[i]))

print()

b[1] = -7
print("O id de a é:", id(a))

for i in range(1,len(a)+1):
  print("O id do elemento a[", i, "]=", a[i], "é:", id(a[i]))

print()

print("O id de b é:", id(b))

for i in range(1,len(b)+1):
  print("O id do elemento b[", i, "]=", b[i], "é:", id(b[i]))

O id de a é: 139797775583984
O id do elemento a[ 1 ]= 10 é: 94390203251488
O id do elemento a[ 2 ]= 12.3 é: 139797776134864
O id do elemento a[ 3 ]= 5.7 é: 139797776134832
O id do elemento a[ 4 ]= (3+2j) é: 139797777014608

O id dee b é: 139797775583984
O id do elemento b[ 1 ]= 10 é: 94390203251488
O id do elemento b[ 2 ]= 12.3 é: 139797776134864
O id do elemento b[ 3 ]= 5.7 é: 139797776134832
O id do elemento b[ 4 ]= (3+2j) é: 139797777014608

O id de a é: 139797775583984
O id do elemento a[ 1 ]= -7 é: 139797776134512
O id do elemento a[ 2 ]= 12.3 é: 139797776134864
O id do elemento a[ 3 ]= 5.7 é: 139797776134832
O id do elemento a[ 4 ]= (3+2j) é: 139797777014608

O id dee b é: 139797775583984
O id do elemento b[ 1 ]= -7 é: 139797776134512
O id do elemento b[ 2 ]= 12.3 é: 139797776134864
O id do elemento b[ 3 ]= 5.7 é: 139797776134832
O id do elemento b[ 4 ]= (3+2j) é: 139797777014608


In [43]:
# Não funciona para strings, que são imutáveis!
# Exemplo 1: strings
a = 'abcdefghijk'
print("O id de a é:", id(a))

for i in range(0,len(a)):
  print("O id do elemento a[", i, "]=", a[i], "é:", id(a[i]))

print()

b = a     # Cópia simples (usando o operador de atribuição =)
print("O id de b é:", id(b))

for i in range(0,len(b)):
  print("O id do elemento b[", i, "]=", b[i], "é:", id(b[i]))

print()

b[1] = 'X'
print("O id de a é:", id(a))

for i in range(0,len(a)):
  print("O id do elemento a[", i, "]=", a[i], "é:", id(a[i]))

print()

print("O id de b é:", id(b))

for i in range(0,len(b)):
  print("O id do elemento b[", i, "]=", b[i], "é:", id(b[i]))

O id de a é: 139797775303024
O id do elemento a[ 0 ]= a é: 139798410159664
O id do elemento a[ 1 ]= b é: 139798410001136
O id do elemento a[ 2 ]= c é: 139798410449200
O id do elemento a[ 3 ]= d é: 139798409826608
O id do elemento a[ 4 ]= e é: 139798409749552
O id do elemento a[ 5 ]= f é: 139798410562672
O id do elemento a[ 6 ]= g é: 139798409826672
O id do elemento a[ 7 ]= h é: 139798409826800
O id do elemento a[ 8 ]= i é: 139798410019248
O id do elemento a[ 9 ]= j é: 139798409698864
O id do elemento a[ 10 ]= k é: 139798410019632

O id de b é: 139797775303024
O id do elemento b[ 0 ]= a é: 139798410159664
O id do elemento b[ 1 ]= b é: 139798410001136
O id do elemento b[ 2 ]= c é: 139798410449200
O id do elemento b[ 3 ]= d é: 139798409826608
O id do elemento b[ 4 ]= e é: 139798409749552
O id do elemento b[ 5 ]= f é: 139798410562672
O id do elemento b[ 6 ]= g é: 139798409826672
O id do elemento b[ 7 ]= h é: 139798409826800
O id do elemento b[ 8 ]= i é: 139798410019248
O id do elemento b[ 

TypeError: ignored

In [35]:
# Não funciona para tuplas, que são imutáveis!
# Exemplo 1: tuplas
a = (10, 12.3, 5.7, 3+2j)
print("O id de a é:", id(a))

for i in range(0,len(a)):
  print("O id do elemento a[", i, "]=", a[i], "é:", id(a[i]))

print()

b = a     # Cópia simples (usando o operador de atribuição =)
print("O id de b é:", id(b))

for i in range(0,len(b)):
  print("O id do elemento b[", i, "]=", b[i], "é:", id(b[i]))

print()

b[1] = -7  # Erro!
print("O id de a é:", id(a))

for i in range(0,len(a)):
  print("O id do elemento a[", i, "]=", a[i], "é:", id(a[i]))

print()

print("O id dee b é:", id(b))

for i in range(0,len(b)):
  print("O id do elemento b[", i, "]=", b[i], "é:", id(b[i]))

O id de a é: 139797775590224
O id do elemento a[ 0 ]= 10 é: 94390203251488
O id do elemento a[ 1 ]= 12.3 é: 139797776136464
O id do elemento a[ 2 ]= 5.7 é: 139797776135664
O id do elemento a[ 3 ]= (3+2j) é: 139797776136304

O id de b é: 139797775590224
O id do elemento b[ 0 ]= 10 é: 94390203251488
O id do elemento b[ 1 ]= 12.3 é: 139797776136464
O id do elemento b[ 2 ]= 5.7 é: 139797776135664
O id do elemento b[ 3 ]= (3+2j) é: 139797776136304



TypeError: ignored

## Cópia rasas

* Cria uma coleção de objetos com um identificador diferente. Assim, modificar uma não modifica a outra!

* Para coleções de dados ordenados pode-se usar o operador fatiamento **[:]** para fazer uma cópia rasa, mas não para coleções não ordenadas (dicionários e conjuntos).

* As funções **list(), set(), dict()** podem ser usadas para fazer cópias rasas para todas as coleções mutáveis. 

* O método **.copy()** também pode ser usado para fazer cópias rasas de todas as coleções mutáveis.

* Também é possível aplicar a função **copy.copy(coleção)**, que é uma função geral e pode ser utilizada para qualquer tipo de coleção de objetos.

### Cópia rasas de listas por fatiamento

In [41]:
# Cópias rasas de listas:
lista1 = [10, 20, 30, 40]
lista2 = lista1[:]            # Cópia rasa (operador fatiamento)
print(id(lista1), id(lista2))

lista2[1] = 2222
print(lista1, lista2)

139797852067472 139797775958496
[10, 20, 30, 40] [10, 2222, 30, 40]


### Cópia rasas com list(), set(), dict()

In [45]:
# Cópias rasas com list(), set(), dict():

list_old = [10, 20, 30, 40]
list_new = list(list_old)
print( id(list_old), id(list_new) )

list_new[1] = 0
print( list_old, list_new )

139797775393408 139797775403360
[10, 20, 30, 40] [10, 0, 30, 40]


In [48]:
# Conjunto:
set_old = {10, 20, 30, 40}
set_new = set(set_old)
print( id(set_old), id(set_new) )

set_new.add(60)
print( set_old, set_new )

139797775299360 139797775301040
{40, 10, 20, 30} {40, 10, 20, 60, 30}


In [51]:
# Dicionário:
dict_old = {1:10, 2:20, 3:30, 4:40}
dict_new = dict(dict_old)
print( id(dict_old), id(dict_new) )

dict_new[1] = 60
print( dict_old, dict_new )

139797775076800 139797775434848
{1: 10, 2: 20, 3: 30, 4: 40} {1: 60, 2: 20, 3: 30, 4: 40}


In [52]:
# Tupla: não funciona porque é imutável
t_old = (10, 20, 30, 40)
t_new = tuple(t_old)
print( id(t_old), id(t_new) )

t_new[1] = 60
print( t_old, t_new )

139797775437904 139797775437904


TypeError: ignored

### Cópias rasas com o .copy()

In [53]:
# Lista:
list_old = [10, 20, 30, 40]
list_new = list_old.copy()   # Cópia rasa (usando o método .copy)
print( id(list_old), id(list_new) )

list_new[1] = 0
print( list_old, list_new )

139797775419264 139797775437328
[10, 20, 30, 40] [10, 0, 30, 40]


In [54]:
# Conjunto:
set_old = {10, 20, 30, 40}
set_new = set_old.copy()
print( id(set_old), id(set_new) )

set_new.add(60)
print( set_old, set_new )

139797775515232 139797775299360
{40, 10, 20, 30} {40, 10, 20, 60, 30}


In [55]:
# Dicionário:
dict_old = {1:10, 2:20, 3:30, 4:40}
dict_new = dict_old.copy()
print( id(dict_old), id(dict_new) )

dict_new[1] = 60
print( dict_old, dict_new )

139797775074880 139797775504960
{1: 10, 2: 20, 3: 30, 4: 40} {1: 60, 2: 20, 3: 30, 4: 40}


### Com a função copy.copy()

In [56]:
# Lista:
import copy

list_old = [10, 20, 30, 40]
list_new = copy.copy(list_old)   # Cópia rasa (usando o método .copy)
print( id(list_old), id(list_new) )

list_new[1] = 0
print( list_old, list_new )

139797775435728 139797775435248
[10, 20, 30, 40] [10, 0, 30, 40]


In [57]:
# Conjunto:
import copy

set_old = {10, 20, 30, 40}
set_new = copy.copy(set_old)
print( id(set_old), id(set_new) )

set_new.add(60)
print( set_old, set_new )

139797776718736 139797776718016
{40, 10, 20, 30} {40, 10, 20, 60, 30}


In [58]:
# Dicionário:
import copy

dict_old = {1:10, 2:20, 3:30, 4:40}
dict_new = copy.copy(dict_old)
print( id(dict_old), id(dict_new) )

dict_new[1] = 60
print( dict_old, dict_new )

139797775378624 139797775077120
{1: 10, 2: 20, 3: 30, 4: 40} {1: 60, 2: 20, 3: 30, 4: 40}


## Cópias rasas de coleções aninhadas:

* Não atinge aninhamentos, já que muda a identificação da lista, mas não altera as identificações dos elementos.

In [75]:
# A lista foi copiada com um novo id (cópia rasa), mas os elementos possuem os mesmo ids
# então o elemento que é uma lista tem o mesmo id, portanto alteração em um deles altera
# ambos já que são o mesmo objeto
list_old = [10, 2.2, 'abc', [100, 200, 300]]
list_new = list_old.copy()
print(list_old, id(list_old))
print(list_new, id(list_new))
print()

for i in range(len(list_old)):
  print("Elemento índice", i, 'ids:', id(list_old[i]), id(list_new[i]))

print()

list_new[0] = 1.1
print()

for i in range(len(list_old)):
  print("Elemento índice", i, 'ids:', id(list_old[i]), id(list_new[i]))

print()
print(list_old, list_new)
print()

list_new[3][1] = 'None'
print()

for i in range(len(list_old)):
  print("Elemento índice", i, 'ids:', id(list_old[i]), id(list_new[i]))

print()
print(list_old, list_new) 

[10, 2.2, 'abc', [100, 200, 300]] 139797775432832
[10, 2.2, 'abc', [100, 200, 300]] 139797775430032

Elemento índice 0 ids: 94390203251488 94390203251488
Elemento índice 1 ids: 139797776136656 139797776136656
Elemento índice 2 ids: 139798410099824 139798410099824
Elemento índice 3 ids: 139797775429712 139797775429712


Elemento índice 0 ids: 94390203251488 139797775874096
Elemento índice 1 ids: 139797776136656 139797776136656
Elemento índice 2 ids: 139798410099824 139798410099824
Elemento índice 3 ids: 139797775429712 139797775429712

[10, 2.2, 'abc', [100, 200, 300]] [1.1, 2.2, 'abc', [100, 200, 300]]


Elemento índice 0 ids: 94390203251488 139797775874096
Elemento índice 1 ids: 139797776136656 139797776136656
Elemento índice 2 ids: 139798410099824 139798410099824
Elemento índice 3 ids: 139797775429712 139797775429712

[10, 2.2, 'abc', [100, 'None', 300]] [1.1, 2.2, 'abc', [100, 'None', 300]]


## Cópias profundas

* É preciso utilizar a função **copy.deepcopy(coleção)** para que seja criada uma nova identificação também para elementos aninhados.

* É indicado que listas sejam coleções de mesmos objetos, pois se for uma lista só de números ou *strings*, por exemplo, fazer uma cópia rasa já basta. Mas, se for uma lista só de listas, por exemplo, sabe-se que é necessário fazer cópias profundas.

In [78]:
# Observe que as listas possuem ids diferentes também para o elemento que é uma lista
import copy

list_old = [10, 2.2, 'abc', [100, 200, 300]]
list_new = copy.deepcopy(list_old)
print(list_old, id(list_old))
print(list_new, id(list_new))
print()

for i in range(len(list_old)):
  print("Elemento índice", i, 'ids:', id(list_old[i]), id(list_new[i]))

print()

list_new[0] = 1.1
print()

for i in range(len(list_old)):
  print("Elemento índice", i, 'ids:', id(list_old[i]), id(list_new[i]))

print()
print(list_old, list_new)
print()

list_new[3][1] = 'None'
print()

for i in range(len(list_old)):
  print("Elemento índice", i, 'ids:', id(list_old[i]), id(list_new[i]))

print()
print(list_old, list_new) 

[10, 2.2, 'abc', [100, 200, 300]] 139797775209408
[10, 2.2, 'abc', [100, 200, 300]] 139797775209888

Elemento índice 0 ids: 94390203251488 94390203251488
Elemento índice 1 ids: 139797775875760 139797775875760
Elemento índice 2 ids: 139798410099824 139798410099824
Elemento índice 3 ids: 139797775208768 139797775208848


Elemento índice 0 ids: 94390203251488 139797776134224
Elemento índice 1 ids: 139797775875760 139797775875760
Elemento índice 2 ids: 139798410099824 139798410099824
Elemento índice 3 ids: 139797775208768 139797775208848

[10, 2.2, 'abc', [100, 200, 300]] [1.1, 2.2, 'abc', [100, 200, 300]]


Elemento índice 0 ids: 94390203251488 139797776134224
Elemento índice 1 ids: 139797775875760 139797775875760
Elemento índice 2 ids: 139798410099824 139798410099824
Elemento índice 3 ids: 139797775208768 139797775208848

[10, 2.2, 'abc', [100, 200, 300]] [1.1, 2.2, 'abc', [100, 'None', 300]]
