## Visão Geral das Sequências Embutidas

<p> A <b>Bilioteca-padrão</b> disponibiliza um conjunto de tipos de sequências implementadas em C.<br>
    Essas sequências podem ser divididas em diversas formas, como, por exemplo, os tipos que armazenam:
</p>

  * **_Sequências Container:_** **Armazenam itens de diferentes tipos,** referenciam os objetos que contêm.
       - List
       - Tuple
       - Collections.deque
  * **_Sequências simples:_** **Armazenam itens de um só tipo,** armazenam fisicamente o valor de cada item em seu próprio espaço de memória
       - Str
       - Bytes
       - Bytearray
       - Memoryview
       - Array.array
       
<p> Ou de acordo com a <b>mutabilidade:</b> </p>

  * **_Sequências mutáveis:_**
      - List
      - Bytearray
      - Array.array
      - Collections.deque
      - Memoryview
  * **_Sequências Imutáveis:_**
      - Tuple
      - Str
      - Bytes
      
<p>    As sequências mutáveis se diferenciam das imutáveis ao mesmo tempo que <b>herdam metódos</b> delas. Apesar de não serem subclasses das <i>abstract data classes</i>, estas são utilizadas para formalizar as funcionalidades esperadas de um tipo de sequência completo.<br>    Ter em mente esse traços - <b>mutável vs imutável; container vs simples</b> - é útil para extrapolar o que é conhecido sobre um tipo de sequência em comparação com outro</p>

## List Comprehensions e Expressões Geradoras

   * Alvo: List -> List Comprehension (listcomps)
   * Quaisquer outros tipos de sequência -> Expressão Geradora (genexps)
   
   - Torna o código mais legível e, até mesmo, mais rápido

In [2]:
# Criar uma lista de códigos Unicode a partir de uma string -> Sem listcomps
symbols = '$¢£¥€¤'
codes = []
for symbol in symbols:
    codes.append(ord(symbol))
codes

[36, 162, 163, 165, 8364, 164]

In [3]:
# Com List comprehension
symbols = '$¢£¥€¤'
codes = [ord(symbol) for symbol in symbols]
codes

[36, 162, 163, 165, 8364, 164]

<p>O propósito da list comprehension é mais <b>explícito</b>, uma vez que o laço <i>for</i> pode ser utilizado para diferentes tarefas.<br>Entretanto, as listcomps podem também deixar um código ilegível, portanto utilize-as somente se vai <b>utilizar a lista gerada</b>.<br> Além disso, procure deixá-la <b>concisa</b>, se ela ocupar duas linhas provavelmente será melhor quebrá-la em partes ou reescrevê-la em um laço for</p>
<p>Em Python, as quebras de linhas são ignoradas entre pares [], {} e (), assim, para criar listas, listcomps, genexps, dicionários e outras estruturas com multiplas linhas, não é necessário usar '\'</p>

In [4]:
# As listcomps não afetam o escopo ao redor delas, apartir do Python3, ainda que possam utilizar do mesmo
x = 'ABC'
dummy = [ord(x) for x in x]
print(x) # ABC
print(dummy) # [65, 66, 67]
# O valor x é preservado e a lista ainda é gerada

ABC
[65, 66, 67]


In [5]:
"""
As listcomps criam listas apartir de iteráveis.
As funções filter e map também fazem o mesmo, porém a legibilidade será prejudicada devido ao limitado lambda
"""

symbols = '$¢£¥€¤'
beyond_ascii = [ord(s) for s in symbols if ord(s) > 127] # Mais legível e rápido
print(beyond_ascii)
beyond_ascii = list(filter(lambda c: c > 127, map(ord, symbols))) # Pior legibilidade
print(beyond_ascii)

[162, 163, 165, 8364, 164]
[162, 163, 165, 8364, 164]


In [7]:
# As listcomps podem gerar listas a partir do produto cartesiano de dois ou mais iteráveis
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
tshirts = [(color, size) for color in colors for size in sizes] # Tamanho = len(colors) * len(sizes)
tshirts

[('black', 'S'),
 ('black', 'M'),
 ('black', 'L'),
 ('white', 'S'),
 ('white', 'M'),
 ('white', 'L')]

In [10]:
# Não muito elegante
""" Os loops for estão aninhados na mesma ordem que aparecem em listcomp. """
for color in colors:
    for size in sizes:
        print((color, size))

('black', 'S')
('black', 'M')
('black', 'L')
('white', 'S')
('white', 'M')
('white', 'L')


In [11]:
# Elegante e altamente legível
tshirts = [(color, size) for size in sizes
                         for color in colors]
tshirts

[('black', 'S'),
 ('white', 'S'),
 ('black', 'M'),
 ('white', 'M'),
 ('black', 'L'),
 ('white', 'L')]

In [12]:
"""
    Para inicializar outros tipos de sequência - além de listas - são utilizadas genexps invés de listcomps,
pois elas economizam memória uma vez que geram itens um por um utilizando o protocolo de iteradores
"""

# Inicializando uma tupla e uma array a partir de uma genexps
symbols = '$¢£¥€¤'
t_exp = tuple(ord(symbol) for symbol in symbols) # Se a genexp for o único argumento em uma chamada não é preciso
                                                 # dois parênteses
print(t_exp)

import array
# O construtor array aceita dois argumentos, portanto os parênteses são obrigatórios
array_exp = array.array('I', (ord(symbol) for symbol in symbols)) 
print(array_exp)

(36, 162, 163, 165, 8364, 164)
array('I', [36, 162, 163, 165, 8364, 164])


In [13]:
"""
Uso de genexp com um produto cartesiano
A lista não é criada na memoria, os itens são criados um a um e, assim, a genexp evita o custo de criar uma
lista gigantesca.
"""
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
for tshirt in ('%s %s' % (c, s) for c in colors for s in sizes):
    # Uma lista com as variações jamais será construída
    print(tshirt)

black S
black M
black L
white S
white M
white L


# Tuplas

 As tuplas possuem **dupla função**:
  - Serem utilizadas como listas imutáveis;
  - Registros sem nome de campos;

In [2]:
# Utilização de tuplas como registros
lax_coordinates = (33.9425, -118.408056) # Quantidade de itens fixa e a ordem é importante
city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)
travelers_id = [('USA', '31195855'), ('BRA', 'CE342567'),
                ('ESP', 'XDA205856')]
for passport in sorted(travelers_id):
    print('%s/%s' % passport)
    
for country, _ in travelers_id: # Tuple unpacking
    print(country)

BRA/CE342567
ESP/XDA205856
USA/31195855
USA
BRA
ESP


### Desempacotamento de Tuplas
   O desempacotamento de tuplas funciona com qualquer iterável desde que este gere exatamente um item por variável na tupla recpetora, a não ser que um asterisco seja utilizado para capturar os itens excedentes. Apesar de amplamente usado, o termo desempacotamento de tuplas está sendo substituido por desempacotamento de iteráveis.

In [5]:
# A forma mais visível do tuple unpacking é o parallel assignment
lax_coordinates = (33.9425, -118.408056)
latitude, longitude = lax_coordinates  # Tuple unpacking
print(latitude)
print(longitude)

33.9425
-118.408056


In [7]:
# Outra aplicação elegante do desempacotamento de tuplas é o swap de duas varíaveis sem uma temporária
a = 1
b = 2
print(a, b)
a, b = b, a
print(a, b)

1 2
2 1


In [10]:
# Outro exemplo consiste em prefixar um argumento com um asterisco ao chamar uma função
print(divmod(20, 8))
t = (20, 8)
print(divmod(*t))
quotient, remainder = divmod(*t)
quotient, remainder

(2, 4)
(2, 4)


(2, 4)

In [11]:
# Outra utilização é o retorno das funções que devolvem diversos valores dentro de uma tupla
import os
_, filename = os.path.split('/home/vitor/dev/x.csv') # Esta função cria a tupla (path, last_part)
"""
    Quando estamos interessados em apenas uma parte da tupla ao desempacotar, podemos utilizar uma variável
descartável como _ . Entretanto, ao escrever softwares internacionalizados, este símbolo não é recomendavel
uma vez que é tradicionalmente usado na documentação do módulo gettext
"""
filename

'x.csv'

In [13]:
# O * também pode ser usado para capturar itens excedentes
a, b, *rest = range(5)
a, b, rest

(0, 1, [2, 3, 4])

In [15]:
a, b, *rest = range(3)
a, b, rest

(0, 1, [2])

In [16]:
a, b, *rest = range(2)
a, b, rest

(0, 1, [])

In [17]:
# O prefixo * pode aparecer em qualquer posição
*head, b, c, d = range(5)
head, b, c, d

([0, 1], 2, 3, 4)