# Common Python Data Structures (Guide)

[https://realpython.com/python-data-structures/](https://realpython.com/python-data-structures/)

Neste tutorial, você aprenderá:

- Quais tipos de dados abstratos comuns são integrados à biblioteca padrão do Python
- Como os tipos de dados abstratos mais comuns são mapeados para o esquema de nomenclatura do Python
- Como colocar tipos de dados abstratos em uso prático em vários algoritmos

## Array Data Structures

Um array é uma estrutura de dados fundamental disponível na maioria das linguagens de programação, e tem uma ampla gama de usos em diferentes algoritmos.

Nesta seção, você dará uma olhada nas implementações de arrays em Python que usam apenas recursos padrão da linguagem principal ou funcionalidade que estão incluídas na biblioteca padrão do Python. Você verá os pontos fortes e fracos de cada abordagem para que você possa decidir qual implementação é certa para o seu caso de uso.

Mas antes de nos aprofundarmos, primeiro, vamos cobrir alguns dos fundamentos.Como os arrays funcionam e pra que eles são usados?

Arrays consistem em registros de dados de tamanho fixo que permitem que cada elemento seja localizado com base em seu índice:

In [1]:
#    0  1  2  3  4 <-- índices
a = [1, 2, 3, 4, 5]

print(a[0])  # deve imprimir 1
print(a[1])  # deve imprimir 2
print(a[2])  # deve imprimir 3
print(a[3])  # deve imprimir 4
print(a[4])  # deve imprimir 5

1
2
3
4
5


Como os arrays armazenam informações em blocos adjacentes de memória, são consideradas estruturas de dados contíguas (em oposição a estruturas de dados vinculadas, como *linked lists*, por exemplo).

Uma analogia do mundo real para um array é um estacionamento. Você pode olhar para o estacionamento como um todo e tratá-lo como um único objeto, mas dentro do lote há pontos de estacionamento indexados por um número único. Os pontos de estacionamento são recipientes para veículos - cada local de estacionamento pode estar vazio ou ter um carro, uma moto ou algum outro veículo estacionado nele.

Mas nem todos os estacionamentos são os iguais. Alguns estacionamentos podem ser restritos a apenas um tipo de veículo. Por exemplo, um estacionamento de trailers não permitiria que bicicletas sejam estacionadas nele. Um estacionamento restrito corresponde a um array tipado, que permite que apenas elementos que possuam o mesmo tipo de dados sejam armazenados neles.

Sob a ótica da performance, é muito rápido procurar um elemento contido em um array usando o índice do elemento. Uma implementação adequada de array garante um tempo de acesso constante O(1) para este caso.

O Python inclui várias estruturas de dados, semelhantes a um array, em sua biblioteca padrão. E cada uma tem características ligeiramente diferentes. Vamos dar uma olhada.

## list: Arrays Mutáveis Dinâmicos

As listas fazem parte do núcleo da linguagem Python. Apesar de seu nome, as listas do Python são implementadas como arrays dinâmicos nos bastidores.

Isto significa que uma lista permite que os elementos sejam adicionados ou removidos, e a lista vai ajustar o armazenamento de apoio que mantém estes elementos automaticamente, ao alocar ou liberar memória.

As listas de Python podem armazenar qualquer tipo de elemento, já que tudo, em Python, é um objeto, incluindo as funções. Portanto, você pode misturar e combinar diferentes tipos de tipos de dados e armazená-los todos em uma única lista.

Isso pode ser um recurso poderoso, mas a desvantagem de suportar vários tipos de dados ao mesmo tempo é que a compactação dos dados não é tão boa. Como resultado, toda a estrutura ocupa mais espaço:

In [2]:
# criando uma lista
arr = ["one", "two", "three"]
arr[0]

'one'

In [3]:
# arr.__repr__()
arr

['one', 'two', 'three']

In [4]:
# Alterando um elemento da lista
arr[1] = "hello"
arr

['one', 'hello', 'three']

In [5]:
# Removendo um elemento da lista
del arr[1]
arr

['one', 'three']

In [6]:
# Adicionando um elemento na lista
arr.append(23)
arr

['one', 'three', 23]

## tuple: Recipientes imutáveis

Assim como as listas, as tuplas fazem parte do núcleo da linguagem Python. Ao contrário das listas, no entanto, os objetos de tupla do Python são imutáveis.Isso significa que os elementos não podem ser adicionados ou removidos dinamicamente - todos os elementos em uma tupla devem ser definidos no tempo de criação.

Tuplas são outra estrutura de dados que podem conter elementos de tipos de dados arbitrários. Ter essa flexibilidade é poderosa, mas novamente, também significa que a compactação dos dados é pior do que a compactação de um array tipado.

In [7]:
arr = ("one", "two", "three")
arr[0]

'one'

In [8]:
arr

('one', 'two', 'three')

In [9]:
import traceback  # noqa E402

try:
    arr[1] = "hello"
except TypeError:
    traceback.print_exc()

Traceback (most recent call last):
  File "C:\Users\josen\AppData\Local\Temp/ipykernel_53436/985881917.py", line 4, in <module>
    arr[1] = "hello"
TypeError: 'tuple' object does not support item assignment


In [10]:
import traceback  # noqa E402

try:
    del arr[1]
except TypeError:
    traceback.print_exc()

Traceback (most recent call last):
  File "C:\Users\josen\AppData\Local\Temp/ipykernel_53436/1830385992.py", line 4, in <module>
    del arr[1]
TypeError: 'tuple' object doesn't support item deletion


In [11]:
# Você não pode adicionar um elemento em uma tupla, mas pode somar suas
# tuplas, resultando em uma nova tupla
arr + (23,)

('one', 'two', 'three', 23)

In [12]:
arr

('one', 'two', 'three')

## `array.array`: Basic Typed Arrays

O módulo `array` do Python fornece uma forma eficiente (em relação a espaço) de armazenamento de tipos de dados básicos, estilo C, como bytes, inteiros de 32 bits, números de ponto flutuante e assim por diante.

Arrays criados com a classe `array.array` são mutáveis e se comportam de maneira semelhante às listas, exceto para uma diferença importante: eles são arrays tipados, restritos a um único tipo de dados.

Por causa dessa restrição, objetos `array.array` com muitos elementos economizam mais espaço que listas e tuplas. Os elementos armazenados nele são bem compactados, e isso pode ser muito útil se você quer armazenar elementos do mesmo tipo.

Also, arrays support many of the same methods as regular lists, and you might be able to use them as a drop-in replacement without requiring other changes to your application code.

Além disso, arrays suportam muitos dos mesmos métodos que as listas normais, e você pode substituir um pelo outro com poucas mudanças no código.

In [13]:
import array  # noqa E402

arr = array.array("f", (1.0, 1.5, 2.0, 2.5))
arr[1]

1.5

In [14]:
# arr.__repr__():
arr

array('f', [1.0, 1.5, 2.0, 2.5])

In [15]:
# Arrays são mutáveis:
arr[1] = 23.0
arr

array('f', [1.0, 23.0, 2.0, 2.5])

In [16]:
# É possível deletar um elemento do array
del arr[1]
arr

array('f', [1.0, 2.0, 2.5])

In [17]:
# É possível adicionar um elemento no array
arr.append(42.0)
arr

array('f', [1.0, 2.0, 2.5, 42.0])

In [18]:
import traceback  # noqa E402

try:
    arr[1] = "hello"
except TypeError:
    traceback.print_exc()

Traceback (most recent call last):
  File "C:\Users\josen\AppData\Local\Temp/ipykernel_53436/985881917.py", line 4, in <module>
    arr[1] = "hello"
TypeError: must be real number, not str


## str: arrays imutáveis de caracteres Unicode

Python 3.x inclui um novo tipo de dados, o `str`, que é uma representação de uma sequência **imutável** de caracteres Unicode. Na prática, um str é um array imutável de caracteres. Estranhamente, é também uma estrutura de dados recursiva - cada caracter em uma string é, em si, um objeto str de comprimento 1.

Objetos string são eficientes quanto ao espaço porque são bem compactados e especializados em um único tipo de dados. Se você estiver armazenando o texto Unicode, você deve usar uma string.

Como as strings são imutáveis, modificar uma string requer a criação de uma cópia modificada, ou seja, uma nova string. O equivalente mais próximo a uma string mutável está no armazenando de caracteres individuais dentro de uma lista.

In [19]:
arr = "abcd"
arr[1]

'b'

In [20]:
arr

'abcd'

In [21]:
import traceback  # noqa E402

try:
    arr[1] = "e"
except TypeError:
    traceback.print_exc()

Traceback (most recent call last):
  File "C:\Users\josen\AppData\Local\Temp/ipykernel_53436/672780305.py", line 4, in <module>
    arr[1] = "e"
TypeError: 'str' object does not support item assignment


In [22]:
import traceback  # noqa E402

try:
    del arr[1]
except TypeError:
    traceback.print_exc()

Traceback (most recent call last):
  File "C:\Users\josen\AppData\Local\Temp/ipykernel_53436/1830385992.py", line 4, in <module>
    del arr[1]
TypeError: 'str' object doesn't support item deletion


In [23]:
# Uma string pode ser descompactada em uma lista, para obter uma representação
# mutável dessa string
list("abcd")

['a', 'b', 'c', 'd']

In [24]:
# Para recompactar uma lista em uma string, você pode usar o método join
"".join(list("abcd"))

'abcd'

In [25]:
# Strings são estruturas de dados recursivas, ou seja, cada pedaço da string é
# uma outra string.
type("abc")

str

In [26]:
type("abc"[0])

str