## Visão Geral das Sequências Embutidas

<p> A <b>Bilioteca-padrão</b> disponibiliza um conjunto de tipos de sequências implementadas em C.<br>
    Essas sequências podem ser divididas em diversas formas, como, por exemplo, os tipos que armazenam:
</p>

  * **_Sequências Container:_** **Armazenam itens de diferentes tipos,** referenciam os objetos que contêm.
       - List
       - Tuple
       - Collections.deque
  * **_Sequências simples:_** **Armazenam itens de um só tipo,** armazenam fisicamente o valor de cada item em seu próprio espaço de memória
       - Str
       - Bytes
       - Bytearray
       - Memoryview
       - Array.array
       
<p> Ou de acordo com a <b>mutabilidade:</b> </p>

  * **_Sequências mutáveis:_**
      - List
      - Bytearray
      - Array.array
      - Collections.deque
      - Memoryview
  * **_Sequências Imutáveis:_**
      - Tuple
      - Str
      - Bytes
      
<p>    As sequências mutáveis se diferenciam das imutáveis ao mesmo tempo que <b>herdam metódos</b> delas. Apesar de não serem subclasses das <i>abstract data classes</i>, estas são utilizadas para formalizar as funcionalidades esperadas de um tipo de sequência completo.<br>    Ter em mente esse traços - <b>mutável vs imutável; container vs simples</b> - é útil para extrapolar o que é conhecido sobre um tipo de sequência em comparação com outro</p>

## List Comprehensions e Expressões Geradoras

   * Alvo: List -> List Comprehension (listcomps)
   * Quaisquer outros tipos de sequência -> Expressão Geradora (genexps)
   
   - Torna o código mais legível e, até mesmo, mais rápido

In [1]:
# Criar uma lista de códigos Unicode a partir de uma string -> Sem listcomps
symbols = '$¢£¥€¤'
codes = []
for symbol in symbols:
    codes.append(ord(symbol))
codes

[36, 162, 163, 165, 8364, 164]

In [2]:
# Com List comprehension
symbols = '$¢£¥€¤'
codes = [ord(symbol) for symbol in symbols]
codes

[36, 162, 163, 165, 8364, 164]

<p>O propósito da list comprehension é mais <b>explícito</b>, uma vez que o laço <i>for</i> pode ser utilizado para diferentes tarefas.<br>Entretanto, as listcomps podem também deixar um código ilegível, portanto utilize-as somente se vai <b>utilizar a lista gerada</b>.<br> Além disso, procure deixá-la <b>concisa</b>, se ela ocupar duas linhas provavelmente será melhor quebrá-la em partes ou reescrevê-la em um laço for</p>
<p>Em Python, as quebras de linhas são ignoradas entre pares [], {} e (), assim, para criar listas, listcomps, genexps, dicionários e outras estruturas com multiplas linhas, não é necessário usar '\'</p>

In [3]:
# As listcomps não afetam o escopo ao redor delas, apartir do Python3, ainda que possam utilizar do mesmo
x = 'ABC'
dummy = [ord(x) for x in x]
print(x) # ABC
print(dummy) # [65, 66, 67]
# O valor x é preservado e a lista ainda é gerada

ABC
[65, 66, 67]


In [5]:
"""
As listcomps criam listas apartir de iteráveis.
As funções filter e map também fazem o mesmo, porém a legibilidade será prejudicada devido ao limitado lambda
"""

symbols = '$¢£¥€¤'
beyond_ascii = [ord(s) for s in symbols if ord(s) > 127] # Mais legível e rápido
print(beyond_ascii)
beyond_ascii = list(filter(lambda c: c > 127, map(ord, symbols))) # Pior legibilidade
print(beyond_ascii)

[162, 163, 165, 8364, 164]
[162, 163, 165, 8364, 164]


In [7]:
# As listcomps podem gerar listas a partir do produto cartesiano de dois ou mais iteráveis
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
tshirts = [(color, size) for color in colors for size in sizes] # Tamanho = len(colors) * len(sizes)
tshirts

[('black', 'S'),
 ('black', 'M'),
 ('black', 'L'),
 ('white', 'S'),
 ('white', 'M'),
 ('white', 'L')]

In [10]:
# Não muito elegante
""" Os loops for estão aninhados na mesma ordem que aparecem em listcomp. """
for color in colors:
    for size in sizes:
        print((color, size))

('black', 'S')
('black', 'M')
('black', 'L')
('white', 'S')
('white', 'M')
('white', 'L')


In [11]:
# Elegante e altamente legível
tshirts = [(color, size) for size in sizes
                         for color in colors]
tshirts

[('black', 'S'),
 ('white', 'S'),
 ('black', 'M'),
 ('white', 'M'),
 ('black', 'L'),
 ('white', 'L')]

In [12]:
"""
    Para inicializar outros tipos de sequência - além de listas - são utilizadas genexps invés de listcomps,
pois elas economizam memória uma vez que geram itens um por um utilizando o protocolo de iteradores
"""

# Inicializando uma tupla e uma array a partir de uma genexps
symbols = '$¢£¥€¤'
t_exp = tuple(ord(symbol) for symbol in symbols) # Se a genexp for o único argumento em uma chamada não é preciso
                                                 # dois parênteses
print(t_exp)

import array
# O construtor array aceita dois argumentos, portanto os parênteses são obrigatórios
array_exp = array.array('I', (ord(symbol) for symbol in symbols)) 
print(array_exp)

(36, 162, 163, 165, 8364, 164)
array('I', [36, 162, 163, 165, 8364, 164])


In [13]:
"""
Uso de genexp com um produto cartesiano
A lista não é criada na memoria, os itens são criados um a um e, assim, a genexp evita o custo de criar uma
lista gigantesca.
"""
colors = ['black', 'white']
sizes = ['S', 'M', 'L']
for tshirt in ('%s %s' % (c, s) for c in colors for s in sizes):
    # Uma lista com as variações jamais será construída
    print(tshirt)

black S
black M
black L
white S
white M
white L


# Tuplas

 As tuplas possuem **dupla função**:
  - Serem utilizadas como listas imutáveis;
  - Registros sem nome de campos;
  
## Tuplas como listas imutáveis
   Basicamente, as tuplas herdam das lists todos os methods que não alteram - acrescentam ou removem - o seu conteúdo, com a exceção do __\_\_reversed____.
   
## Tuplas como Registros:

In [2]:
# Utilização de tuplas como registros
lax_coordinates = (33.9425, -118.408056) # Quantidade de itens fixa e a ordem é importante
city, year, pop, chg, area = ('Tokyo', 2003, 32450, 0.66, 8014)
travelers_id = [('USA', '31195855'), ('BRA', 'CE342567'),
                ('ESP', 'XDA205856')]
for passport in sorted(travelers_id):
    print('%s/%s' % passport)
    
for country, _ in travelers_id: # Tuple unpacking
    print(country)

BRA/CE342567
ESP/XDA205856
USA/31195855
USA
BRA
ESP


### Desempacotamento de Tuplas
   O desempacotamento de tuplas funciona com qualquer iterável desde que este gere exatamente um item por variável na tupla recpetora, a não ser que um asterisco seja utilizado para capturar os itens excedentes. Apesar de amplamente usado, o termo desempacotamento de tuplas está sendo substituido por desempacotamento de iteráveis.

In [5]:
# A forma mais visível do tuple unpacking é o parallel assignment
lax_coordinates = (33.9425, -118.408056)
latitude, longitude = lax_coordinates  # Tuple unpacking
print(latitude)
print(longitude)

33.9425
-118.408056


In [7]:
# Outra aplicação elegante do desempacotamento de tuplas é o swap de duas varíaveis sem uma temporária
a = 1
b = 2
print(a, b)
a, b = b, a
print(a, b)

1 2
2 1


In [10]:
# Outro exemplo consiste em prefixar um argumento com um asterisco ao chamar uma função
print(divmod(20, 8))
t = (20, 8)
print(divmod(*t))
quotient, remainder = divmod(*t)
quotient, remainder

(2, 4)
(2, 4)


(2, 4)

In [11]:
# Outra utilização é o retorno das funções que devolvem diversos valores dentro de uma tupla
import os
_, filename = os.path.split('/home/vitor/dev/x.csv') # Esta função cria a tupla (path, last_part)
"""
    Quando estamos interessados em apenas uma parte da tupla ao desempacotar, podemos utilizar uma variável
descartável como _ . Entretanto, ao escrever softwares internacionalizados, este símbolo não é recomendavel
uma vez que é tradicionalmente usado na documentação do módulo gettext
"""
filename

'x.csv'

In [13]:
# O * também pode ser usado para capturar itens excedentes
a, b, *rest = range(5)
a, b, rest

(0, 1, [2, 3, 4])

In [15]:
a, b, *rest = range(3)
a, b, rest

(0, 1, [2])

In [16]:
a, b, *rest = range(2)
a, b, rest

(0, 1, [])

In [17]:
# O prefixo * pode aparecer em qualquer posição
*head, b, c, d = range(5)
head, b, c, d

([0, 1], 2, 3, 4)

In [4]:
# Desempacotamento de tuplas aninhadas 

metro_areas = [
    ('Tokyo', 'JP', 36.933, (35.689722, 139.691667)),
    ('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889)),
    ('Mexico City', 'MX', 20.142, (19.433333, -99.133333)),
    ('New York-Newark', 'US', 20.104, (40.808611, -74.02086)),
    ('Sao Paulo', 'BR', 19.649, (-23.547778, -46.635833))
]

print('{:15} | {:^9} | {:^9}'.format('', 'lat.', 'long.'))
fmt = '{:15} | {:9.4f} | {:9.4f}'
for name, cc, pop, (latitude, longitude) in metro_areas: # Ao atribuir o ultimo campo a uma tupla, desempacotamo-a
    if longitude <= 0:
        print(fmt.format(name, latitude, longitude))

                |   lat.    |   long.  
Mexico City     |   19.4333 |  -99.1333
New York-Newark |   40.8086 |  -74.0209
Sao Paulo       |  -23.5478 |  -46.6358


In [5]:
"""
As tuplas são muito úteis, entretanto ao utilizá-las como registros associar nomes aos campos faz falta,
por isso, foram criadas as namedtuple

A função collections.namedtuple cria uma subclasse de tuplas com nomes de campos e um nome de classe - o que
ajuda no debugging
"""

from collections import namedtuple

"""
Dois parâmetros devem ser passados: Um nome de classe e uma lista de nomes de campos especificados, como um
iterável de strings ou como uma uníca string delimitada por espaços
"""
City = namedtuple('City', 'name country population coordinates') # Retorna um objeto chamado City

tokyo = City('Tokyo', 'JP', 36.933, (35.689722, 139.691667))
print(tokyo)
print(tokyo.population)
print(tokyo.coordinates)
print(type(tokyo))


City(name='Tokyo', country='JP', population=36.933, coordinates=(35.689722, 139.691667))
36.933
(35.689722, 139.691667)
<class '__main__.City'>


In [7]:
# Uma namedtuple possui alguns atributos além daqueles herados de tuple
print(City._fields) # _fields tupla com nome dos atributos

LatLong = namedtuple('LatLong', 'lat long')
delhi_data = ('Delhi NCR', 'IN', 21.935, LatLong(28.613889, 77.208889))
delhi = City._make(delhi_data) # _make recebe um iterável e instancía uma tupla a partir dele
print(delhi._asdict()) # _asdict() retorna um collections.OrderedDict a partir da instância da tupla nomeada
for key, value in delhi._asdict().items():
    print(key + ':', value)

('name', 'country', 'population', 'coordinates')
OrderedDict([('name', 'Delhi NCR'), ('country', 'IN'), ('population', 21.935), ('coordinates', LatLong(lat=28.613889, long=77.208889))])
name: Delhi NCR
country: IN
population: 21.935
coordinates: LatLong(lat=28.613889, long=77.208889)


# Slicing

 O Fatiamento - ou slicing - é um recurso comum, mas poderoso, de list, tuple, str e todos os outros tipos de sequência em Python.

### Por que as fatias e os intervalos excluem o último item

   * Torna-se fácil visualizar o tamnho de um fatia ou intervalo quando apenas a posição final é especificada:
       ``` python
       range(3)
       my_list[:3]
       ```
   * É facil calcular o tamanho de um _slice_ ou _interval_ quando o início ou fim são especificados: basta subtrair _stop - start_;
   * É facil separar uma sequência em duas partes em qualquer índice x sem que haja sobreposição:
       ``` python
        l = [10, 20, 30, 40, 50, 60]
        l[:2] # Quebra no 2 -> [10, 20]
        l[2:] # [30, 40, 50, 60]
        l[:3] # Quebra no 3 -> [10, 20, 30]
        l[3:] # [40, 50, 60]
       ```
       
## Objetos Slice
  Ao utilizarmos uma expressão **[start:stop:step]**, criamos um objeto do tipo slice:slice(a, b, c). Assim, conhecendo os objetos slice, podemos atribuir nomes às fatias

In [9]:
invoice = """
0.....6...................................40........52...55........
1909  Pimorini PiBrella                       $17.50    3    $52.50
1489  6mm tactile Switch x20                   $4.95    2     $9.90
1510  Panavise Jr . - PV-201                  $28.00    1    $28.00
1601  PiTFT Mini Kit 320x240                  $34.95    1    $34.95
"""

SKU = slice(0, 6)
DESCRIPTION = slice(6, 40)
UNIT_PRICE = slice(40, 52)
QUANTITY = slice(52, 55)
ITEM_TOTAL = slice(55, None)
line_items = invoice.split('\n')[2:]
for item in line_items:
    print(item[UNIT_PRICE], item[DESCRIPTION]) # Os objetos slice foram utilizados para extrair as informações

      $17.50 Pimorini PiBrella                 
       $4.95 6mm tactile Switch x20            
      $28.00 Panavise Jr . - PV-201            
      $34.95 PiTFT Mini Kit 320x240            
 


## Fatiamento Multidimensional e reticências

   * O operador [] aceita vários índices ou fatias separados por virgulas. Por exemplo, para fatias multidimensionais pode-se usar:
   
    ``` python
        a[m:n, k:l]
    ```
   * Para avaliar esse fatiamento, o interpretador Python recebe os índices a[i, j] como uma tupla.
     
   * As reticências (...) são reconhecidas como um token pelo parser do Python. É um alias para o objeto _Ellipsis_ que é a única instância da classe ellipsis e servem basicamente para abreviar. Por exemplo:
    
    ``` python
        a[i, :, :, :] == a[i, ...]
    ```
    
## Atribuição de valores a fatias

   * Sequências mutáveis podem ser completamente modificadas com a notação de slices do lado esquerdo de uma tribuição ou como alvo do comando del;

In [15]:
l = list(range(10))
l

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [16]:
l[2:5] = [20, 30]
l

[0, 1, 20, 30, 5, 6, 7, 8, 9]

In [17]:
del l[5:7]
l

[0, 1, 20, 30, 5, 8, 9]

In [18]:
l[3::2] = [11, 22]
l

[0, 1, 20, 11, 5, 22, 9]

In [19]:
l[2:5] = 100

TypeError: can only assign an iterable

In [20]:
l[2:5] = [100] # Quando o alvo de atribuição é uma fatia, o lado direito deve ser algo iterável
l

[0, 1, 100, 22, 9]

## Usando + e * em sequências

   Geralmente ambos operandos de + devem ser do mesmo tipo da sequência, e nenhum deles será modificado pois será criado uma nova sequência do mesmo tipo como resultado da concatenação.
   
   * **Tanto + quando * criam um novo objeto e nunca alteram seus operandos**

In [1]:
# Para concatenar diversas cópias da mesma sequência basta multiplicá-la por um inteiro
l = [1, 2, 3]
print(l * 5)
print(5 * 'abcd')

[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]
abcdabcdabcdabcdabcd


In [3]:
# Quanto utilizar a expressão a * n , sendo a uma sequência, com itens mutáveis o resultado é inesperado
my_list = [[]] * 3
my_list

[[], [], []]

### Criação de Listas de Listas

   * O mais correto ao criar uma lista com listas aninhadas é utilizar listcomps;
   * Multiplicar uma lista por um número não possui o resultado esperado;

In [5]:
board = [['_'] * 3 for i in range(3)]
board

[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]

In [6]:
weird_board = [['_'] * 3] * 3
weird_board # Tudo normal

[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]

In [7]:
weird_board[1][2] = 'O'
weird_board # São o mesmo objeto

[['_', '_', 'O'], ['_', '_', 'O'], ['_', '_', 'O']]

In [8]:
# O código equivalente ao weird_board é o seguinte
row = ['_'] * 3
board = []
for i in range(3):
    board.append(row)
print(board)

# Enquanto o código equivalente ao board normal é esse
board = []
for i in range(3):
    row = ['_'] * 3 # Cria um novo objeto a cada iteração
    board.append(row)
print(board)

[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]
[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]


### Atribuições combinadas e sequências
   * Os operadores _**+=**_ e _**\*=**_ se comportam de modo diferente conforme o primeiro operando;
   * O dunder method que faz **+=** funcionar é **\__iadd__** - in-place addition -, no entanto se este não estiver implementado, o Python usará **\__add__**;
   * Se o dunder in-place addition estiver adicionado, uma sequência mutável se comportara como um a.extend(b) - onde b é o próprio a -, caso contrário o interpretador Python convocara o dunder add e um novo objeto será criado;
   * O mesmo ocorre para multiplicação - que é aplicada através do **\__imul__**;
   * Em geral, para _**sequências mutáveis**_ é uma boa aposta supor que tais métodos estão implementados.

In [11]:
l = [1, 2, 3]
id(l)

140544727601792

In [12]:
l *= 2
l

[1, 2, 3, 1, 2, 3]

In [13]:
id(l) # Após a multiplicação, a lista será o mesmo objeto mas modificado

140544727601792

In [16]:
t = (1, 2, 3)
id(t)

140544727901840

In [17]:
t *= 2
id(t) # Após a multiplicação, uma nova tupla foi criada

140544466187552

 A concatenação rápida de sequências imutáveis é **ineficiente**, pois o interpretador precisa copiar toda a sequência-alvo para criar uma nova sequência com os itens concatenados.

In [18]:
# O enigma da atribuição +=
t = (1, 2, [30, 40])
t[2] += [50, 60]

TypeError: 'tuple' object does not support item assignment

In [19]:
t # Apesar de levantar o erro, a lista recebe a atribuição

(1, 2, [30, 40, 50, 60])

In [21]:
import dis

dis.dis('s[a] += b') # Bytecode herado pelo Python para a expressão

  1           0 LOAD_NAME                0 (s)
              2 LOAD_NAME                1 (a)
              4 DUP_TOP_TWO
              6 BINARY_SUBSCR
              8 LOAD_NAME                2 (b)
             10 INPLACE_ADD
             12 ROT_THREE
             14 STORE_SUBSCR
             16 LOAD_CONST               0 (None)
             18 RETURN_VALUE


   * 3 Lições para serem tiradas disso:
       - Colocar itens mutáveis em tuplas não é uma boa ideia;
       - Uma atribuição combinada não é uma operação atômica;
       - Inspecionar bytecodes Python não é muito difícil e pode ajudar a ver o processo interno;
       
# list.sort() e sorted()

   - O Método __*list.sort*__:
       * Ordena uma lista in-place - isto é, sem criar uma cópia;
       * Devido à convenção da API de Python, retorna _None_ o que significa que nenhum objeto foi criado, mas que quem invocou foi alterado.
   - Função embutida __*sorted()*__:
       * Aceita qualquer objeto iterável como argumento, incluindo sequências imutáveis;
       * Retorna um novo objeto.
   - Ambas funções aceitam dois parâmetros nomeados:
       * **Reverse:** Se for *True* os itens serão devolvidos em ordem decrescente. *default=False*.
       * **Key:** Função de um só argumento aplicada a cada item para gerar sua chave de ordenação. Por exemplo, *key=str.lower* pode ser usada para ordenadar sem levar em consideração o *case*, assim como *str.len* pode ser usado para ordenar de acordo com o tamanho. O default é a função identidade.

In [9]:
fruits = ['grape', 'raspberry', 'apple', 'banana']

In [10]:
sorted(fruits)

['apple', 'banana', 'grape', 'raspberry']

In [11]:
fruits

['grape', 'raspberry', 'apple', 'banana']

In [12]:
sorted(fruits, reverse=True)

['raspberry', 'grape', 'banana', 'apple']

In [13]:
sorted(fruits, key=len)

['grape', 'apple', 'banana', 'raspberry']

In [14]:
sorted(fruits, key=len, reverse=True)

['raspberry', 'banana', 'grape', 'apple']

In [15]:
fruits

['grape', 'raspberry', 'apple', 'banana']

In [17]:
fruits.sort()
fruits

['apple', 'banana', 'grape', 'raspberry']

## Administrando sequências ordenadas com bisect
   * O módulo __*bisect*__ possui duas funções principais que usam o algoritmo de busca binária para encontrar rapidamente e inserir itens em qualquer **sequência ordenada:**
       - *__bisect(haystack, needle)__*:
           - **needle:** item a ser inserido;
           - **haystack:** sequência ordenada que permanecerá em ordem crescente;
       - *__insort(seq, item)__*: Insere mantendo a ordem crescente
           - **seq:** Sequência;
           - **item:** item a ser inserido;
       - Ambos aceitam argumentos *__log__* e *__hi__* para limitar a pesquisa a uma subsequência.
       - Ambos possuem uma variação __*left*__ que invertem para o ponto de inserção.           

In [2]:
# bisect.bisect

import bisect
import sys

HAYSTACK = [1, 4, 5, 6, 8, 12, 15, 20, 21, 23, 23, 26, 29, 30]
NEEDLES = [0, 1, 2, 5, 8, 12, 22, 23, 29, 30, 31]

ROW_FMT = '{0:2d} @ {1:2d} {2}{0:2<d}'

def demo(bisect_fn):
    for needle in reversed(NEEDLES):
        position = bisect_fn(HAYSTACK, needle)
        offset = position * ' |'
        print(ROW_FMT.format(needle, position, offset))

if __name__ == '__main__':
    if sys.argv[-1] == 'left':
        bisect_fn = bisect.bisect_left
    else:
        bisect_fn = bisect.bisect
        
print('DEMO:', bisect_fn.__name__)
print('hastack ->', ' '.join('%2d' % n for n in HAYSTACK))
demo(bisect_fn)

DEMO: bisect_right
hastack ->  1  4  5  6  8 12 15 20 21 23 23 26 29 30
31 @ 14  | | | | | | | | | | | | | |31
30 @ 14  | | | | | | | | | | | | | |30
29 @ 13  | | | | | | | | | | | | |29
23 @ 11  | | | | | | | | | | |23
22 @  9  | | | | | | | | |22
12 @  6  | | | | | |12
 8 @  5  | | | | |8
 5 @  3  | | |5
 2 @  1  |2
 1 @  1  |1
 0 @  0 0


In [3]:
# Uma aplicação interessante é a pesquisa de valores numéricos em tabelas
def grade(score, breakpoints=[60, 70, 80, 90], grades='FDCBA'):
    i = bisect.bisect(breakpoints, score)
    return grades[i]

[grade(score) for score in [33, 99, 77, 70, 89, 90, 100]]

['F', 'A', 'C', 'C', 'B', 'A', 'A']

In [9]:
# bisect.insort

import bisect
import random

SIZE = 7

random.seed(1729)

my_list = []
for i in range(SIZE):
    new_item = random.randrange(SIZE*2)
    bisect.insort(my_list, new_item)
    print('%2d ->' % new_item, my_list)

10 -> [10]
 0 -> [0, 10]
 6 -> [0, 6, 10]
 8 -> [0, 6, 8, 10]
 7 -> [0, 6, 7, 8, 10]
 2 -> [0, 2, 6, 7, 8, 10]
10 -> [0, 2, 6, 7, 8, 10, 10]


## Quando uma lista não é a resposta

  <p>Apesar de ser flexível e fácil de usar, às vezes há opções melhores do que listas. Por exemplo, ao armazenar dez milhões de <i>floating points</i> um <i>array</i> é mais eficaz pois armazena apenas os bytes compactos que representam os valores dos objetos na maquina. Além disso, se for adicionar e remover itens constatemente das extremidades da lista como uma estrutura de dados <b>FIFO</b> ou ,<b>LIFO,</b>, um <i>deque</i>(double-ended queue) será mais rápido. Para verificações rápidas, <i>sets</i> são mais recomendados.</p>
  
# Arrays

   * Se a lista contiver somente números, um _array_ será mais eficiente que uma lista.
   * Ele aceita todas as operações de sequências mutáveis, além de ter métodos adicionar para carregar e salvar rapidamente.
   * Ao criar um _**array**_, deve ser fornecido um typecode que determina o tipo que será armazenado no array, isto auxilia na economia da memória.

In [1]:
from array import array
from random import random

floats = array('d', (random() for i in range(10**7)))

In [2]:
floats[-1] # Inspeciona o último numero do array

0.4069499863339914

In [5]:
fp = open('floats.bin', 'wb')
floats.tofile(fp) # Salva o array em um arquivo binário
fp.close()

floats2 = array('d') # Cria um array vazio de doubles
fp = open('floats.bin', 'rb') 
floats2.fromfile(fp, 10**7) # Lê dez milhões de números do arquivo binário
fp.close()

In [6]:
floats2[-1]

0.4069499863339914

In [7]:
floats2 == floats # Verifica se os conteúdos coincidem

True

## Memory View

   * Classe embutida que é um tipo de sequência de memória compartilhada que permite lidar com fatias de arrays sem copiar os bytes.
   * Permite compartilhar memória entre estruturas de dados sem fazer uma cópia inicial **->** Muito importante para conjuntos grandes de dados.
   * Assim como o array, o método _memoryview.cast_ permite alterar o modo como bytes são lidos ou escritos sem movê-los.

In [4]:
numbers = array('h', [-2, -1, 0, 1, 2])
memv = memoryview(numbers)

In [5]:
len(memv)

5

In [6]:
memv[0]

-2

In [8]:
memv_oct = memv.cast('B') # Casting para o tipo B (unsigned char)
memv_oct.tolist()

[254, 255, 255, 255, 0, 0, 1, 0, 2, 0]

In [10]:
memv_oct[5] = 4
numbers

array('h', [-2, -1, 1024, 1, 2])

# Deques e outras queues

   * Removes itens da esquerda de uma lista é muito custoso pois tem que deslocar toda ela.
   * _collections.deque_ é uma fila dupla thread-safe utilizada para inserções e remoções rápidas nas extremidades.
   * Muito útil quando houver necessidade de manter uma lista dos "últimos itens vistos", por exemplo.

In [17]:
from collections import deque
dq = deque(range(10), maxlen=10) # maxlen -> Número máximo de itens permitidos
dq

deque([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [18]:
dq.rotate(3) # N > 0 retira da direita e coloca na esquerda
dq

deque([7, 8, 9, 0, 1, 2, 3, 4, 5, 6])

In [19]:
dq.rotate(-4) # N < 0 retira da esquerda e coloca na direita
dq

deque([1, 2, 3, 4, 5, 6, 7, 8, 9, 0])

In [20]:
dq.appendleft(-1)
dq

deque([-1, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [21]:
dq.extend([11, 22, 33]) # Concatenar itens que ultrapassariam o maxlen exclui os da outra extremidade

In [22]:
dq

deque([3, 4, 5, 6, 7, 8, 9, 11, 22, 33])

In [23]:
dq.extendleft([10, 20, 30, 40])
dq

deque([40, 30, 20, 10, 3, 4, 5, 6, 7, 8])