# Objetos na memória (parte 1)

> Este notebook contém exemplos e figuras do livro [_Fluent Python, Second Edition_](https://www.fluentpython.com/).

Nesta aula teremos uma visão básica sobre como os objetos se organizam na memória, bem como os conceitos de *identidade* e *igualdade*, e quando usar `==` ou `is`.

## Referências e coleções

É comum falarmos de coleções *mutáveis* ou *imutáveis* em Python. Coleções mutáveis permitem retirar, acrescentar, ou substituir itens, mas as imutáveis não permitem.

Sequências são uma categoria específica de coleção onde os itens se organizam um atrás do outro e podem ser acessados por índices a partir de zero.

Os tipos `tuple` e `array` representam duas categorias de sequências:

* *Sequência container*: pode conter itens de diferentes tipos ao mesmo tempo, inclusive outros containers. Ex: `tuple`, `list`, `collections.deque`etc.

* *Sequência simples*: pode conter itens de um tipo simples pré-determinado. Ex: `str`, `bytes`, `array.array`.

Veja essas duas sequências, uma tupla com 3 elementos e um array com 3 elementos:

In [None]:
t = 9.46, 'cat', [2.08, 4.29]
t

In [None]:
from array import array
a = array('d', [9.46, 2.08, 4.29])
a

![tuple x array](fig2-1.png)


A figura acima mostra de forma simplificada os valores da tupla `t` e do array `a`.

Uma *sequência container* não armazena os itens diretamente em seu espaço de memória, mas armazena referências aos itens, que estão em outras partes da memória. Em contraste, uma *sequência simples* armazena os valores dos itens diretamente em uma área contígua de posições de memória, e não como objetos separados.

> **NOTA**: Na figura acima, as setas representam *referências*. Uma referência é como um *ponteiro*, ou seja, ela contém um endereço de memória. Porém uma referência é mais segura. Só é possível criar referências para objetos que existem, ao contrário de ponteiros que podem conter endereços para posições arbitrárias de memória, inclusive posições inválidas.

----
### 🤔 Estrutura interna de um objeto em Python

Em CPython (o interpretador padrão escrito em C), objetos Python são representados por uma `struct` em C, uma espécie de registro com vários campos. O tipo mais simples é um `float`, que contém 3 campos:

* `ob_refcnt`: contagem de referências ao objeto (usada pelo coletor de lixo)
* `ob_type`: ponteiro para o tipo do objeto (usado para encontrar métodos)
* `ob_fval`: um `double` em C, contendo o valor do `float`

Em um Python compilado para 64 bits, cada campo acima tem 64 bits. Por isso uma lista de `float` é no mínimo 3 vezes maior que um `array` de float, já que o `array` não armazena objetos `float` completos, mas apenas os valores `double` que representam os números em C.

Na figura acima, os quadrados azuis representam a `struct` de cada objeto. A operação `meu_array[0]` obtém o primeiro valor do array e cria na hora um objeto separado para ser usado nas próximas operações.

A representação de um `int` é mais complexa, porque o valor inteiro pode ser representado na própria `struct` ou como um ponteiro para outra área de memória contendo valores inteiros que não cabem em 64 bits. 

----

## Variáveis não são caixas

Alguns professores sugerem que "variáveis são como caixas".
Essa analogia faz sentido em linguagens como C ou Pascal,
mas não funciona em Python, Java, JS, Ruby,
ou qualquer outra linguagem onde variáveis são referências a objetos.


Veja um código que quebra a ideia de que variáveis são caixas:

In [None]:
a = [1, 2, 3]
b = a
a.append(4)
a, b

Se `a` e `b` são como "caixas", como explicar o que aconteceu? Mas se você imaginar que `a` e `b` são duas etiquetas coladas no mesmo objeto, faz sentido.

![Fig. 6.1](https://raw.githubusercontent.com/fluentpython/images/master/object-refs/var-boxes-x-labels.png)



## Objetos são criados antes de variáveis

O código abaixo prova que o lado direito da instrução `x = Trem()` é executado primeiro,
e só depois acontece a atribuição.

Primeiro a classe `Trem`, que apenas exibe uma mensagem quando uma instância é criada.

In [None]:
class Trem:
    def __init__(self):
        print(f'Trem id: {id(self):#x}')
        
x = Trem()

In [None]:
x

In [None]:
globals()

In [None]:
#y = Trem() * Trem()  # isso vai gerar um erro

In [None]:
'y' in globals()

In [None]:
#y  # isso vai gerar outro erro