# Coleções

Coleções são estruturas que permitem armazenar múltiplos valores, que podem ser do mesmo tipo ou não. Os principais tipos de coleções são: listas (*list*), tuplas (*tuple*), intervalos (*range*), textos (*str*), dicionários (*dict*) e conjuntos (*set*). As coleções podem ser de dois tipos, dependendo das operações permitidas sobre seus valores: mutáveis e imutáveis. 

## Listas

As listas são coleções mutáveis normalmente (mas não obrigatoriamente) usadas para armazenar itens homogêneos. Uma lista pode ser criada de várias formas:

   1. Para criar uma lista vazia: [] ou **list**()
   2. Para criar uma lista com valores: [*1*, *5*, *2*]
   3. A partir de outra coleção: **list(colecao)**
      * Esta operação irá construir uma lista cujos itens são os mesmos e na mesma ordem que os itens da coleção original

### Verificando a presença de um item

Para verificar se um valor *x* pertence à lista ou vetor *s*, usa-se o operador **in**, que equivale à notação matemática $x \in \vec{s}$, como mostra o código abaixo.

In [1]:
s = [1, 2, -1]

2 in s

True

Por outro lado, para verificar se o elemento não pertence à lista, i.e. $x \notin \vec{s}$:

In [2]:
3 not in s

True

### Concatenando listas

Dadas duas listas *s1* e *s2*, pode-se concatená-las, produzindo uma terceira lista, usando-se o operador de adição:

In [3]:
s1 = [1, 2]
s2 = [3, 4]

s1 + s2

[1, 2, 3, 4]

O operador de multiplicação tem o efeito de repetir *s1* um número de vezes igual a *n*:

In [7]:
n = 2

s1 * n

[1, 2, 1, 2]

### Obtendo o tamanho da lista

Para obter o tamanho da lista, basta usar o operador **len**:

In [26]:
len(s1)

2

### Acessando elementos da lista

Listas tem acesso direto aos seus elementos por meio de índices inteiros, com o índice *0* correspondendo ao primeiro elemento.

In [15]:
s = [4, 5, 0, 2, 3, 9, 7, 1, 12]

s[0]

4

Listas permitem acessar fatias (*slices*) dos seus valores, e.g para obter a fatia da lista *s* compreendida entre os índices \[*1*, *3*):

In [16]:
s[1:3]

[5, 0]

Note que o lado direito do intervalo dos índices é aberto. Também é possível definir o intervalo da fatia com início, fim e incremento. O código abaixo seleciona os índices {*1*, *3* e *5*}.

In [17]:
s[1:7:2]

[5, 2, 9]

Nenhum dos três valores para definição da fatia é obrigatório. Se o início não for fornecido, a fatia irá iniciar do índice *0*. Se o fim não for definido, a fatia irá até a última posição da lista. Por fim, se o incremento não for informado, ele receberá o valor *1*.

In [18]:
s[:3]

[4, 5, 0]

In [19]:
s[2:]

[0, 2, 3, 9, 7, 1, 12]

Python também permite que os elementos sejam acessados usando índices negativos. Para entender esses índices, basta imaginar que a origem deixa de ser o *0* e passa a ser o tamanho da lista, **len**(*s*). Por exemplo, o índice *-1* corresponderá a **len**(*s*) - *1*, ou seja, a última posição da lista. O índice *-2* equivalerá à penúltima posição da lista, i.e. **len**(*s*) - *2*. Além disso, incrementos de fatias também podem ser negativos.

In [20]:
s[-1]

12

In [21]:
s[-2]

1

In [23]:
s = [4, 5, 0, 2, 3, 9, 7, 1, 12]

s[5:2:-1]

[9, 3, 2]

### Modificando a lista

Como mencionado acima, listas são coleções mutáveis, portanto seus valores podem ser modificados ou removidos e novos valores podem ser adicionados. As operações discutidas nesta Seção são implementadas apenas pelas coleções mutáveis. Para modificar um valor da lista, basta atribuir um novo valor a sua posição:

In [74]:
s[2] = 11

s

[4, 5, 11, 2, 3, 9, 7, 1, 12]

Uma fatia inteira pode ser substituída pelos valores de uma outra lista do mesmo tamanho, como mostra o código abaixo.

In [75]:
s[1:3] = [2, 8]

s

[4, 2, 8, 2, 3, 9, 7, 1, 12]

O operador **del** permite remover uma fatia inteira da lista, reduzindo seu tamanho:

In [76]:
del s[2:7:2]

s

[4, 2, 2, 9, 1, 12]

Para adicionar novos elementos pode-se usar as operações **append** (adiciona elemento ao final da lista), **insert** (adiciona elemento na posição desejada) e **extend** (adiciona elementos de outra lista ao final da lista).

In [77]:
s.append(3)

s

[4, 2, 2, 9, 1, 12, 3]

In [78]:
s.insert(1, 5)

s

[4, 5, 2, 2, 9, 1, 12, 3]

In [79]:
s.extend([6, 7])

s

[4, 5, 2, 2, 9, 1, 12, 3, 6, 7]

## Tuplas

Tuplas são coleções imutáveis, tipicamente usadas para armazenar dados heterogêneos. Essas estruturas são bastante usadas para permitir o retorno de múltiplos valores em funções. Uma tupla pode ser criada de várias formas:

   1. Para criar uma tupla vazia: () ou **tuple**()
   2. Para criar uma tupla com valores: *1*, 'a', *2* ou (*1*, 'a', *2*)
   3. A partir de outra coleção: **tuple(colecao)**
      * Esta operação irá construir uma tupla cujos itens são os mesmos e na mesma ordem que os itens da coleção original

Como se pode ver no item 2 acima, parênteses na definição da tupla com valores são opcionais, exceto para evitar situações de ambiguidade, e.g. **func**(*1*, *2*, *3*), ou seja uma chamada de função com três parâmetros, é diferente de **func**((*1*, *2*, *3*)), i.e. uma chamada de função com apenas com parâmetro do tipo tupla.

As tuplas implementam todas as operações de coleções que não modificam valores, incluindo **in**, **not in**, concatenação, **len** e acesso de elementos por fatias de índices.

## Intervalos

Coleções do tipo **range** são imutáveis e contêm sequências de números que são comumente usados em laços com quantidades definidas de repetições (**for**). Intervalos são construídos de forma parecida com as fatias de índices, i.e. por meio de três valores inteiros que definem início, fim (intervalo aberto) e incremento do intervalo. Também de forma similar, se o início for omitido, ele recebe o valor *0* e se o incremento não for informado, assume-se *1*. De forma geral, o **range** $r$, com início $j$, fim $k$ e incremento $t$ retornará os elementos $r = \left\{j \leq r_i < k~|~r_i =j + t * i, i \geq 0\right\}$.

Um detalhe importante das coleções **range** é que ele sempre ocupa a mesma quantidade de memória, independente do tamanho do intervalo. Isso é possível porque ele apenas armazena os valores de início, fim e incremento. Todos os valores que pertencem ao intervalo são calculados apenas quando necessário. Isso significa que para obter os elementos do **range**, é preciso acessá-los explicitamente. Por exemplo, o código abaixo cria um **range** \[*0*, *10*). Diferente das outras coleções, o retorno do comando que cria o **range** não imprime todos os elementos.

In [3]:
range(10)

range(0, 10)

Para imprimir todos os elementos, pode-se criar uma lista a partir do intervalo:

In [4]:
list(range(0, 10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

Uma fatia de um **range** também é um **range**, mantendo a vantagem de usar pouca memória. Por outra lado, valores únicos podem ser acessados diretamente usando seus índices.

In [8]:
range(1,12)[2:6:2]

range(3, 7, 2)

In [10]:
list(range(1,12)[2:6:2])

[3, 5]

In [13]:
range(1,12)[4]

5

## Textos

Dados do tipo texto, também chamados de *strings* são representados por variáveis do tipo **str**, que são coleções imutáveis de caracteres Unicode. Existem três formas de definir variáveis do tipo **str**, diferenciadas pelo tipo de aspas:

   1. Aspas simples: 
       ```python
           'nesse caso, as aspas "internas" devem ser duplas'
       ```
   2. Aspas duplas:
       ```python
           "nesse caso, as aspas 'internas' devem ser simples"
       ```
   3. Três aspas simples ou duplas:
       ```python
           ''' 
               strings neste formato
               podem ocupar múltiplas linhas e
               incluem todos os espaços em branco    
           '''
       ```


Caracteres e fatias de *strings* podem ser acessados, assim como em listas e tuplas. Não há um tipo específico para caracteres, como em outras linguagens de programação. Assim, um caractere é apenas uma *string* de tamanho *1*.

In [26]:
'Estatística'[2]

't'

In [28]:
'Estatística'[2::-1]

'tsE'

### Concatenando *strings*

*Strings* podem ser concatenadas usando o operador de adição ou colocando apenas um espaço branco entre elas.

In [29]:
'ciência ' + 'de ' + 'dados' 

'ciência de dados'

In [30]:
'ciência ' 'de ' 'dados' 

'ciência de dados'