<!--BOOK_INFORMATION-->
<img align="left" style="padding-right:10px;" src="fig/cover-small.jpg">
*Este notebook contém um trecho do [Whirlwind Tour of Python](http://www.oreilly.com/programming/free/a-whirlwind-tour-of-python.csp) por Jake VanderPlas; o conteúdo está disponível [no GitHub](https://github.com/jakevdp/WhirlwindTourOfPython).*

*O texto e código são liberados sob a licença [CC0](https://github.com/jakevdp/WhirlwindTourOfPython/blob/master/LICENSE); veja também o projeto complementar, o [Python Data Science Handbook](https://github.com/jakevdp/PythonDataScienceHandbook).*

<!--NAVIGATION-->
< [Tipos Embutidos: Valores Simples](05-Built-in-Scalar-Types.ipynb) | [Contents](Index.ipynb) | [Controle de Fluxo](07-Control-Flow-Statements.ipynb) >

# Estruturas de Dados Embutidas

Já vimos os tipos simples do Python: ``int``, ``float``, ``complex``, ``bool``, ``str`` e assim por diante.
O Python também tem vários tipos compostos incorporados, que funcionam como contêineres para outros tipos.
Esses tipos compostos são:

| Nome do tipo | Exemplo                   | Descrição                                  |
|--------------|---------------------------|--------------------------------------------|
| ``list``     | ``[1, 2, 3]``             | Coleção ordenada                           |
| ``tuple``    | ``(1, 2, 3)``             | Coleção ordenada imutável                  |
| ``dict``     | ``{'a':1, 'b':2, 'c':3}`` | Mapeamento (chave, valor) não ordenado     |
| ``set``      | ``{1, 2, 3}``             | Coleção não ordenada de valores exclusivos |

Como você pode ver, parênteses, colchetes e chaves têm significados distintos quando se trata do tipo de coleção produzida.
Faremos um rápido tour por essas estruturas de dados aqui.

## Listas
As listas são o tipo de coleção de dados básico *ordenado* e *mutável* do Python.
Elas podem ser definidas com valores separados por vírgulas entre colchetes. Por exemplo, aqui está uma lista dos  números primos iniciais:

In [1]:
L = [2, 3, 5, 7]

As listas têm várias propriedades e métodos úteis disponíveis.
Aqui, daremos uma rápida olhada em algumas das mais comuns e úteis:

In [None]:
# Comprimento de uma lista
len(L)

4

In [None]:
# Adiciona um valor no final
L.append(11)
L

[2, 3, 5, 7, 11]

In [None]:
# Adição concatena listas
L + [13, 17, 19]

[2, 3, 5, 7, 11, 13, 17, 19]

In [None]:
# O método sort() ordena internamente
L = [2, 5, 1, 6, 3, 4]
L.sort()
L

[1, 2, 3, 4, 5, 6]

Além disso, há muitos outros métodos de lista embutidos. Eles são bem cobertos na [documentação on-line](https://docs.python.org/3/tutorial/datastructures.html) do Python.

Embora tenhamos demonstrado listas contendo valores de um único tipo, um dos recursos poderosos dos objetos compostos do Python é que eles podem conter objetos de *qualquer* tipo, ou até mesmo uma mistura de tipos. Por exemplo:

In [6]:
L = [1, 'two', 3.14, [0, 3, 5]]

Essa flexibilidade é uma consequência do sistema de tipos dinâmicos do Python.
Criar uma sequência mista desse tipo em uma linguagem de tipo estático como C pode ser uma dor de cabeça muito maior!
Vemos que as listas podem até mesmo conter outras listas como elementos.
Essa flexibilidade de tipos é uma parte essencial do que torna o código Python relativamente rápido e fácil de escrever.

Até agora, consideramos as manipulações de listas como um todo. Outra parte essencial é o acesso a elementos individuais.
Isso é feito em Python por meio de *indexação* e *fatiamento*, que exploraremos a seguir.

### Indexação e Fatiamento de Listas
O Python fornece acesso a elementos em tipos compostos por meio de *indexação* para elementos únicos e *fatiamento* para vários elementos.
Como veremos, ambos são indicados por uma sintaxe de colchetes.
Agora voltemos à nossa lista dos primeiros números primos:

In [7]:
L = [2, 3, 5, 7, 11]

O Python usa indexação *baseada em zero*, assim podemos acessar o primeiro e o segundo elemento usando a seguinte sintaxe:

In [8]:
L[0]

2

In [9]:
L[1]

3

Os elementos no final da lista podem ser acessados com números negativos, iniciando em -1:

In [10]:
L[-1]

11

In [11]:
L[-2]

7

Você pode visualizar esse esquema de indexação da seguinte forma:

![List Indexing Figure](fig/list-indexing.png)

Aqui os valores da lista são representados por números grandes nos quadrados; os índices da lista são representados por números pequenos acima e abaixo.
Nesse caso, ``L[2]`` retorna ``5``, pois esse é o próximo valor no índice ``2``.

Enquanto a *indexação* é um meio de buscar um único valor da lista, o *fatiamento* é um meio de acessar vários valores em sub-listas.
Ele usa dois pontos para indicar o ponto inicial (inclusive) e o ponto final (não inclusive) da sub-lista.
Por exemplo, para obter os três primeiros elementos da lista, podemos escrever:

In [12]:
L[0:3]

[2, 3, 5]

Observe onde ``0`` e ``3`` se encontram no diagrama anterior e como o fatiamento pega apenas os valores entre os índices.
Se omitirmos o primeiro índice, ``0`` é assumido, de modo que podemos escrever de forma equivalente:

In [13]:
L[:3]

[2, 3, 5]

Da mesma forma, se omitirmos o último índice, ele assumirá como padrão o comprimento da lista.
Assim, os três últimos elementos podem ser acessados da seguinte forma:

In [14]:
L[-3:]

[5, 7, 11]

Por fim, é possível especificar um terceiro número inteiro que representa o tamanho dos passos. Por exemplo, para selecionar cada segundo elemento da lista, podemos escrever:

In [None]:
L[::2]  # equivalente a L[0:len(L):2]

[2, 5, 11]

Uma versão especialmente útil disso é especificar um passo negativo, que inverterá a lista:

In [16]:
L[::-1]

[11, 7, 5, 3, 2]

Tanto a indexação quanto o fatiamento podem ser usados para atribuir elementos da mesma maneira que os acessa.
A sintaxe é como você poderia esperar:

In [17]:
L[0] = 100
print(L)

[100, 3, 5, 7, 11]


In [18]:
L[1:3] = [55, 56]
print(L)

[100, 55, 56, 7, 11]


Uma sintaxe de fatiamento muito semelhante também é usada em muitos pacotes voltados para a ciência de dados, incluindo o NumPy e o Pandas (mencionados na introdução).

Agora que já vimos as listas do Python e como acessar elementos em tipos compostos ordenados, vamos dar uma olhada nos outros três tipos de dados compostos padrão mencionados anteriormente.

## Tuplas
As tuplas são, em muitos aspectos, semelhantes às listas, mas são definidas com parênteses em vez de colchetes:

In [19]:
t = (1, 2, 3)

Eles também podem ser definidos sem nenhum colchete:

In [20]:
t = 1, 2, 3
print(t)

(1, 2, 3)


Como as listas discutidas anteriormente, as tuplas têm um comprimento e os elementos individuais podem ser extraídos usando a indexação de colchetes:

In [21]:
len(t)

3

In [22]:
t[0]

1

A principal característica distintiva das tuplas é que elas são *imutáveis*: isso significa que, uma vez criadas, seu tamanho e conteúdo não podem ser alterados:

In [23]:
t[1] = 4

TypeError: 'tuple' object does not support item assignment

In [24]:
t.append(4)

AttributeError: 'tuple' object has no attribute 'append'

As tuplas são usadas com frequência em um programa Python. Um caso particularmente comum é em funções que têm vários valores de retorno.
Por exemplo, o método ``as_integer_ratio()`` de objetos de ponto flutuante retorna um numerador e um denominador. Esse valor de retorno duplo vem na forma de uma tupla:

In [25]:
x = 0.125
x.as_integer_ratio()

(1, 8)

Esse retorno de valores múltiplos podem ser atribuídos individualmente da seguinte forma:

In [26]:
numerator, denominator = x.as_integer_ratio()
print(numerator / denominator)

0.125


A lógica de indexação e fatiamento abordada anteriormente para listas também funciona para tuplas, juntamente com uma série de outros métodos.
Consulte a [documentação](https://docs.python.org/3/tutorial/datastructures.html) on-line do Python para obter uma lista mais completa deles.

## Dicionários
Os dicionários são mapeamentos extremamente flexíveis de chaves para valores e formam a base de grande parte da implementação interna do Python.
Eles podem ser criados por meio de uma lista separada por vírgulas de pares ``chave:valor`` entre chaves:

In [27]:
numbers = {'one':1, 'two':2, 'three':3}

Os itens são acessados e definidos por meio da sintaxe de indexação usada para listas e tuplas, exceto que aqui o índice não é uma ordem baseada em zero, mas uma chave válida no dicionário:

In [None]:
# Acessar um valor através da chave
numbers['two']

2

Itens novos também podem ser adicionados ao dicionário usando a indexação:

In [None]:
# Definir um novo par chave:valor
numbers['ninety'] = 90
print(numbers)

{'three': 3, 'ninety': 90, 'two': 2, 'one': 1}


Lembre-se de que os dicionários não mantêm nenhuma ordenação para os parâmetros de entrada. Isso é intencional.
Essa falta de ordenação permite que os dicionários sejam implementados de forma muito eficiente, de modo que o acesso a elementos aleatórios seja muito rápido, independentemente do tamanho do dicionário (se estiver curioso para saber como isso funciona, leia sobre o conceito *tabela hash*).
A [documentação do Python](https://docs.python.org/3/library/stdtypes.html) tem uma lista completa dos métodos disponíveis para os dicionários.

## Conjuntos

A quarta coleção básica é o conjunto, que contém coleções não ordenadas de itens únicos.
Eles são definidos de forma muito parecida com as listas e as tuplas, exceto pelo fato de usarem as chaves dos dicionários:

In [30]:
primes = {2, 3, 5, 7}
odds = {1, 3, 5, 7, 9}

Se você estiver familiarizado com a matemática de conjuntos, estará familiarizado com operações como união, interseção, diferença, diferença simétrica e outras.
Os conjuntos do Python têm todas essas operações incorporadas, por meio de métodos ou operadores.
Para cada uma delas, mostraremos os dois métodos equivalentes:

In [None]:
# união: itens que aparecem em um ou outro
primes | odds      # com o operador
primes.union(odds) # equivalente com o método

{1, 2, 3, 5, 7, 9}

In [None]:
# interseção: itens que aparecem em ambos
primes & odds             # com o operador
primes.intersection(odds) # equivalente com o método

{3, 5, 7}

In [None]:
# diferença: itens em primos, mas não em ímpares
primes - odds           # com o operador
primes.difference(odds) # equivalente com o método

{2}

In [None]:
# diferença simétrica: itens que aparecem em apenas um conjunto
primes ^ odds                     # com o operador
primes.symmetric_difference(odds) # equivalente com o método

{1, 2, 9}

Há muitos outros métodos e operações de conjunto disponíveis.
Você provavelmente já adivinhou o que vou dizer a seguir: consulte a [documentação](https://docs.python.org/3/library/stdtypes.html) on-line do Python para obter uma referência completa.

## Mais Estruturas de Dados Especializadas

O Python contém muitas outras estruturas de dados que podem ser úteis. Elas geralmente podem ser encontradas no módulo embutido ``collections``.
O módulo collections está totalmente documentado na [documentação](https://docs.python.org/3/library/collections.html) on-line do Python, e você pode ler mais sobre os vários objetos disponíveis lá.

Particularmente, achei o seguinte muito útil em várias ocasiões:

- ``collections.namedtuple``: Como uma tupla, mas cada valor tem um nome
- ``collections.defaultdict``: Como um dicionário, mas as chaves não especificadas têm um valor padrão especificado pelo usuário.
- ``collections.OrderedDict``: Como um dicionário, mas a ordem das chaves é mantida

Depois de conhecer os tipos de coleção padrão embutidos, o uso dessas funcionalidades estendidas é muito intuitivo, e eu sugiro [ler sobre seu uso](https://docs.python.org/3/library/collections.html).

<!--NAVIGATION-->
< [Tipos Embutidos: Valores Simples](05-Built-in-Scalar-Types.ipynb) | [Contents](Index.ipynb) | [Controle de Fluxo](07-Control-Flow-Statements.ipynb) >