# Uma coleção de sequências
## Visão geral das sequências embutidas

Sequências container
<ul> list, tuple e collections.deque podem armazenar itens de tipos diferentes </ul>

Sequências simples
<ul> str, bytes, memoryview e array.array armazenam itens de um só tipo. </ul>

## List comprehension e expressões geradoras

Uma maneira rápida de criar uma sequência é usar uma **list comprehension (se o alvo for uma list)** ou uma **expressão geradora (para todos os demais tipos de sequência)**. Se você não estiver usando essas formas sintáticas em seu cotidiano, aposto que stará perdendo oportuniaddes de escrever um código que é, ao mesmo tempo, mais legível e, geralmente, mais rápido.

### List comprehensions e legibilidade

Eis um teste: qual exemplo você acha mais fácil de ler, o primeiro ou o segundo ?

Cria uma lista de códigos Unicode(codepoints) a partir de uma string

In [1]:
symbols = '$%&*@!'
codes = []
for symbol in symbols:
    codes.append(ord(symbol))
codes

[36, 37, 38, 42, 64, 33]

In [2]:
symbols = '$%&*@!'
codes = [ord(symbol) for symbol in symbols]
codes

[36, 37, 38, 42, 64, 33]

Qualquer pessoa que conheça um pouco de Python poderá ler o primeiro exemplo. No entanto, após ter conhecido as listcomps, acho o segundo exemplo mais legível, pois seu propósito é explícito.


Um laço _for_ pode ser usado para realizar várias tarefas diferentes: varrer uma sequência para contar ou selecionar itens, computar agregações (somas, médias) ou executar quaisquer outras tarefas de processamento. O código do primeiro exemplo cria uma lista. Em comparação, a sintaxe de listcomp foi concebida com um único proósiot: criar uma nova lista.


### Comparação entre listcomps e map/filter

As listcomps fazem tudo que as funções map e filter fazem, sem os contorcionismos exigidos pelo limitado lambda que temos em Python

In [5]:
symbols = '$%ϢͻΔə'
beyond_ascii = [ord(s) for s in symbols if ord(s) > 127]
beyond_ascii

[994, 891, 916, 601]

In [6]:
beyond_ascii = list(filter(lambda c: c > 127, map(ord, symbols)))
beyond_ascii

[994, 891, 916, 601]

## Produtos cartesianos

* As listcompos podem gerar listas a partir do produto cartesiano de dois ou mais iteráveis.

* Os itens que compõem o produto cartesiano são tuplas compostas de itens de todos os iteráveis de entrada.

* A lista resultante tem um tamanho igual aos tamanhos dos iteráveis de entrada multiplicados.

Por exemplo, suponha que você deva gerar uma lista de camisetas disponíveis em duas cores e três tamanhos. 

In [1]:
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
tshirts = [(color, size) for color in colors for size in sizes]
tshirts

[('black', 'S'),
 ('black', 'M'),
 ('black', 'L'),
 ('white', 'S'),
 ('white', 'M'),
 ('white', 'L')]

## Expressões geradoras

Para inicializar tuplas, arrays e outros tipos de sequência, poderíamos começar também com uma listcomp, porém uma genexp economiza memória, pois ela gera itens um por um usando o protocolo de iteradores, em vez de criar uma lsita completa somenta para alimentar outro construtor.

In [3]:
symbols = '$%ϢͻΔə'
tuple(ord(symbol) for symbol in symbols)

(36, 37, 994, 891, 916, 601)

In [5]:
import array
array.array('I', (ord(symbol) for symbol in symbols))

array('I', [36, 37, 994, 891, 916, 601])

O proximo exemplo utiliza uma genexp com um produto cartesiano. 

Em comparação com o anterior (das roupas), neste caso, a lista de camisetas com seis itens não é criada na memória: a expressão geradora alimenta o laço for gerando um item de cada vez.

Se as duas listas usadas no produto cartesiano tivessem mil itens cada, usar uma expressão geradora evitaria o custo de criar uma lista com um milhão de itens somenta para alimentar o laço for.

In [6]:
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
for tshirt in ('%s %s' % (c, s) for c in colors for s in sizes):
    print(tshirt)

black S
black M
black L
white S
white M
white L


## Tuplas não são apenas listas imutáveis

### Tuplas como registros

* Se pensarmos em uma tupla somente como uma lista imutável, a quantidade e a ordem dos itens poderão o não ser importantes, dependendo do contexto.

* Quando usamos uma tupla como uma coleção de campos, a quantidade de itens geralmente será fixa e sua ordem sempre será muito importante.

O exemplo a seguir mostra tuplas sendo usadas como registros. Observe que, em todoas as expressões, reordenar a tupla destruiria as informações, pois o significado de cada item é dado pela sua posição na tupla.

In [10]:
lax_coordinates = (33.9325, -188.408056)
city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)
traveler_ids = [('USA', '31195855'), ('BRA', 'CE343567'), ('ESO', 'XDA20569')]

for passport in sorted(traveler_ids):
    print('%s/%s' % passport)
    
for country, _ in traveler_ids:
    print(country)

BRA/CE343567
ESO/XDA20569
USA/31195855
USA
BRA
ESO


### Desempacotamento de tuplas

Dois exemplos de desempacotamento de tuplas

`city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)`

`'%s/%s' % passport`

A forma mais visível de desempacotamento de tuplas é a atribuição paralela, atribuição de utens de um iterável a uma tupla de variáveis.

In [12]:
lax_coordinates = (33.9325, -188.408056)
latitude, longitude = lax_coordinates
print(latitude)
print(longitude)

33.9325
-188.408056


***Uma aplicação elegante do desempacotamento de tuplas consiste em trocar(swap) os valores de duas variáveis sem usar uma variável temporária:***

In [14]:
a = 5
b = 10

b, a = a, b

a, b

(10, 5)

Outro exemplo de desempacotamento de tuplas consiste em prefixar um argumento com um asterisco ao chamar uma função:

In [15]:
divmod(20, 8)

(2, 4)

In [16]:
t = (20, 8)
divmod(*t)

(2, 4)

In [17]:
quotient, remainder = divmod(*t)
quotient, remainder

(2, 4)

### Usando * para capturar itens excedentes

In [1]:
a, b, *rest = range(5)
a, b, rest

(0, 1, [2, 3, 4])

In [2]:
a, b, *rest = range(3)
a, b, rest

(0, 1, [2])

In [3]:
a, b, *rest = range(2)
a, b, rest

(0, 1, [])

No contexto da atribuição paralela, o prefixo * pode ser aplicado exatamente a uma variável, mas poderá aparecer em qualquer posição:

In [4]:
a, *body, c, d = range(5)
a, body, c, d

(0, [1, 2], 3, 4)

In [5]:
*head, b, c, d = range(5)
head, b, c, d

([0, 1], 2, 3, 4)

### Desempacotamento de tuplas aninhadas

In [14]:
metro_areas = [
    ('Tokyo', 'JP', 36.933, (35.689, 139.673)),
    ('Delhi NCR', 'IN', 78.223, (25.679, -189.553)),
    ('Mexico City', 'MX', 26.535, (15.349, 179.773)),
    ('New York', 'US', 22.233, (55.589, 122.273)),
    ('Sao Paulo', 'BR', 13.533, (54.789, 779.333)),
]

print('{:15} | {:^9} | {:^9}'.format('', 'lat.', 'long.'))
fmt = '{:15} | {:9.4f} | {:9.4f}'

for name, cc, pop, (latitude, longitude) in metro_areas:
    if longitude <= 0:
        print(fmt.format(name, latitude, longitude))

                |   lat.    |   long.  
Delhi NCR       |   25.6790 | -189.5530


### Tuplas nomeadas

A função collections.namedtuple é uma fábrica (factory) que gera subclasses de tuple melhoradas com nomes de nomes de campos e um nome de classe - o que ajuda no debugging.

> As instâncias de uma classe crada com namedtuple ocupam exatamente a mesma quantidade de memória que tuplas porque os nomes dos campos são armazenados na classe. Elas usam menos memória que um objeto normal, pois não armazenam atributos em um `__dict__` por instância.

O proximo exemplo mostra como definir uma tupla nomeada para armazenar informações sobre uma cidade.

In [17]:
from collections import namedtuple
City = namedtuple('City', ['name', 'country', 'population', 'coordinates'])
tokyo = City('Tokyo', 'JP', 36.933, (35.689722, 139.691667))
tokyo

City(name='Tokyo', country='JP', population=36.933, coordinates=(35.689722, 139.691667))

In [18]:
tokyo.population

36.933

In [20]:
tokyo.coordinates

(35.689722, 139.691667)

In [21]:
tokyo[1]

'JP'

Uma tupla nomeada tem alguns atributos além daqueles herdados de tuple como, por exemplo, o atributo de classe `_fields`, o método de classe `_make(iterable)` e o método de instância `_asdict()`