# 2.2 Uma visão geral das sequências Embutidas

Sequências Contêiner - Podem armazenar tipos diferentes incluindo container aninhados e objetos de qualquer tipo -> list, tuple e collections.deque

Sequências Pllanas - Armazenam itens de algum tipo simples, mas não outras coleções e ou referências a objetos -> str, bytes e array.array

- Sequencias contêiner guardam referencias para os objetos que armazenam, enquanto seguencias planas armazenam os valores no próprio estado de memória


*Outra forma de agrupar sequencias*

Sequências Mutáveis -> list, bytearrey,array.array e collections.deque

Sequências Imutáveis -> tuple, str e bytes



In [None]:
from collections import abc

print(issubclass(tuple, abc.Sequence))
print(issubclass(list, abc.MutableSequence))


## 2.3.1 Compreensões de lista e legibilidade

In [None]:
simbolos = ('abcde')

# ord() retorna o unicode para o caractere fornecido
codes = [ord(simbolo) for simbolo in simbolos]

codes

> Em python, quebras de linha são ignoradas dentro de pares de `{}`, `[]` e `()`. Então podemos fazer listcomprehension em várias linhas de python (O que não é recomendado)
> Se a compreensão de lista tomar mais de uma linha, é melhor quebrá-la e transformar num `for` normal! 

#### Escopo local dentro de compreensões e expressões geradoras

1. X não é alterado
2. Last permanece
3. c não permanece

In [None]:
x = 'ABCDE'

codes = [ord(x) for x in x]

print(x) # 1
print(codes)


codes = [last := ord(c) for c in x]
print(codes)
print(last) # 2

#print(c) # 3



*Operador morsa no python*

> Permite atribuir um valor a uma variável dentro de uma expressão, permitindo execultar a expressão e atribuir ao mesmo tempo

Ex:

In [None]:
print(valor := "Meu nome é Thiago")

print(valor)


In [None]:
if(nome := input("Digite seu nome: ")) and len(nome) > 5:
    print("É um nome grande!")

#### Listcomps vs. map e filter

Listcomps fazem tudo que as funções map e filter fazem, sem os malabarismos exigidos pela funcionalidade limitada do `lambda` do Python

In [None]:
symbols = '!@#$&*()£¢¬'
beyond_ascii = [ord(s) for s in symbols if ord(s) > 127]
print(beyond_ascii)

# Map executa uma função para cada item em um iterável
#Filter retorna um iterável onde os items são filtrados através de uma função para saber se são aceitos ou não.

# Filter pega os resultados da função lambda e testa com a lista de unicodes retornados pelo map

beyond_ascii = list(filter(lambda c: c > 127,
                           map(ord, symbols)))

print(beyond_ascii)


## 2.3.3 Produtos Cartesianos

Listcomps podem criar listas a partir do produto cartesianos de dois ou mais iteráveis. 

Ex. Supondo que precisamos criar uma lista de camisas disponíveis de 2 cores e 3 tamanhos

In [None]:
cores = ['preta', 'branca']
tamanhos = ['P', 'M', 'G']
camisas = [(cor, tamanho) for cor in cores for tamanho in tamanhos]

camisas

Isso gera tuplas ordenadas por cor, depois por tamanho.


In [None]:
for cor in cores:
    for tamanho in tamanhos:
        print((cor, tamanho))

In [None]:
camisas = [(cor, tamanho) for tamanho in tamanhos for cor in cores]

camisas

## 2.3.4 Expressões geradores

Listcomps geram listas. Para gerar tuplas, arrays e outros tipos de sequências, usamos as expressões geradoras. É possível usar uma listcomp também, mas as genexp economiza memória, pois ela produz itens um de cada vez usando o protocolo iterador em vez de criar uma lista inteira apenas para alimentar outro construtor.

In [None]:
simbs = '£¢!@#$*'

print(tuple(ord(symbol) for symbol in simbs))

import array

array.array('I', (ord(symbol) for symbol in simbs))


In [None]:
cores = ['preta', 'branca']
tamanhos = ['P', 'M', 'G']

for tshirt in (f'{c} {t}' for c in cores for t in tamanhos):
    print(tshirt)

A expressão geradora cria um item por vez; uma lista com todas as seis variações de camiseta nunca é criada nesse exemplo.

## 2.4 Tuplas não são apenas listas imutáveis

Tuplas podem ser lista imutáveis ou registros de campos sem nome.

> Utilizamos o desempacotamento, evitando usar índices, segundo o autor.

### Tuplas como registros

In [None]:
lax_coordenadas = (33.9425, -118.408056)

# Implementado na PEP 515, o underscore _ serve para separar visualmente os números;

cidade, ano, pop, chg, area = ('Tokyo', 2003, 32_450, 0.66, 8014)

passaportes = [('USA', '31195855'), ('BRA', 'CE342567'), ('ESP', 'XDA205856')]

for passaporte in sorted(passaportes):
    print('%s/%s' % passaporte)
    #print(f'{passaporte[0]}/{passaporte[1]}' )

# Desempacotamento -> _ é uma variável descartável, não a utilizamos (dummy variable)
for pais, _ in passaportes:
    print(pais)

### Tuplas como listas imutáveis

Tuplas usam menos memória que uma lista de mesmo tamanho e permite ao python realizar algumas otimizações.


> Sobre a imutabilidade das tuplas, elas só se aplicam às referências ali contidas. Referências de uma tupla não podem ser apagadas ou substituidas. Mas se uma das referências apontar para um objeto mutável, e aquele objeto mudar, então o valor da tupla muda

In [8]:
a = (10, 'alpha', [1,2])
b = (10, 'alpha', [1,2])

a == b
#True
b[-1].append(99)

a == b 
#False
print(b)


(10, 'alpha', [1, 2, 99])


Tuplas com itens mutáveis podem ser fontes de bugs. Se uma tuple contém um item mutável, ela não pode ser uma chave de dicionário ou como elemento em um `set`

## 2.5 Desempacotando sequências e iteráveis

O desenpacotamento evita o uso de índices para acessar itens de sequências, o que causa muitos bugs.

Atribuição paralela -> Atribuir itens de um iterável a uma tupla de variáveis

In [31]:
lax_coordenadas = (33.9425, -118.408056)
latitude, longitude = lax_coordenadas #desempacotamento

latitude

33.9425

In [32]:
# Permutar valores de variáveis sem usar variável auxiliar

a = 1
b = 2

b, a = a,b

print(a)

print(b)



2
1


Outro exemplo de empacotamento é prefixar um argumento com * ao chamar uma função:

In [34]:
divmod(20,8) # Retorna a divisão e o resto

t = (20,8)

divmod(*t)

quociente, resto = divmod(*t)

print(quociente, resto)

2 4


In [12]:
import os 
# os.path.split() cria uma tupla (path, last_part) a partir de um caminho do sistema de arquivos
_ , filename = os.path.split('/home/thiago/.ssh/id_ed25519.pub')

filename

'id_ed25519.pub'

### 2.5.1 Usando o operador `*` para recolher itens em excesso

In [13]:
a, b, *rest = range(5)

print(a, b, rest)

*rest, a, b = range(5)

print(a, b, rest)

0 1 [2, 3, 4]
3 4 [0, 1, 2]


No contexto da atribuição paralela, o prefixo * pode ser aplicado a exatamente uma variável, mas pode aparecer em qualquer posição:

In [1]:
a , *body, c, d = range(8)

print(a, body, c, d)

0 [1, 2, 3, 4, 5] 6 7


### Desempacotando com * em chamadas de função e sequências literais

In [20]:
def fun(a,b,c,d,*rest):
    return a, b, c, d, rest

# não é possivel usar * mais de uma vez no empacotamento, 
# mas é possível no desempacotamento em chamadas de função (PEP 448)

fun(*[1,2,3,4], 93, *range(4,17))


(1, 2, 3, 4, (93, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16))

O desempacotamento também pode ser utilizado na definição de literais: list, tuple ou set. 

In [None]:
*range(4), 4

lista = [*range(4), 4]

set_set = {*range(4), 4, *(5,6,7)}

print(set_set)

{0, 1, 2, 3, 4, 5, 6, 7}


### 2.5.3 Desempacotamento aninhado

O alvo de um desempacotamento pode usar aninhamento, por exemplo `(a,b,(c,d))`

In [None]:
metro_areas = [
    ('Tokyo', 'JP', 36.933, (35.689722, 139.691667)),  # (1)
    ('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889)),
    ('Mexico City', 'MX', 20.142, (19.433333, -99.133333)),
    ('New York-Newark', 'US', 20.104, (40.808611, -74.020386)),
    ('São Paulo', 'BR', 19.649, (-23.547778, -46.635833)),
]

def main():
    print(f'{"":15} | {"latitude":>9} | {"longitude":>9}')
    for name, _, _, (lat, lon) in metro_areas: # (2)
        if lon <= 0: # (3)
            print(f'{name:15} | {lat:9.4f} | {lon:9.4f}')


if __name__ == '__main__':
    main()

                |  latitude | longitude
Mexico City     |   19.4333 |  -99.1333
New York-Newark |   40.8086 |  -74.0204
São Paulo       |  -23.5478 |  -46.6358


1. Cada tupla comtém um registro com 4 campos, o ultimo é um par de coordenadas
2. Ao atribuir o ultimo campo a uma tupla aninhada, desempacotamos as coordenadas
3. O teste `lon <= 0:` seleciona apenas as cidades do hemisfério ocidental


## 2.6 Pattern Matching com sequências

Casamento de padrões (PEP 634)


Supondo que estamos construindo um robô que aceita comandos enviados como sequências de palavras e números como `BEEPER 440 3`

In [None]:
def comando_gatilho(self, message):
    match message: #(1) 
        case ['BEEPER', frequency, times]: #(2)
            self.beep(times, frequency)
        case ['NECK', angle]: #(3)
            self.rotate_neck(angle)
        case ['LED', pin, intensity]: #(4)
            self.leds[ident].set_brightness(pin,intensity)
        case ['LED', pin, red, green, blue]: #(5)
            self.leds[ident].set_color(pin, red, green, blue)

        case _: #(6)
            raise InvalidCommand(message)
        

Apesar de parecer com o switch/case do C, o match/case possui melhorias como a desentruturação - uma forma mais avançada de desenpacotamento. 

1. A expressão após a palavra chave `match` é o sujeito. O sujeito contém os dados que python vai comparar aos padrões em cada instrução case.
2. Esse padrão casa com qualquer sujeito que seja uma sequência de três itens. O primeiro item deve ser a string `BEEPER`. O segundo e o terceiro itens podem ser qualquer coisa, e serão vinculados às variàveis `frequency` e `times` respectivamente. 
3.  Isso casa com qualquer sujeito com dois itens, se o primeiro for `NECK`

4. Isso vai casar com um sujeito de três itens começando com `LED`. Se o numero de itens não for correspondente, Python segue para o próximo `case`.

5. Outro padão de sequência começando com `LED`, agora com 5 itens - incluindo a constante `LED`.

6. Esse é o `case` default. Vai casar com qualquer sujeito que não tenha sido que não tenha sido capturado por um dos padrões precedentes. A variável `_` é especial 

Exemplo 8 reescrito com desestruturação:

In [None]:
metro_areas = [
    ('Tokyo', 'JP', 36.933, (35.689722, 139.691667)),
    ('Delhi NCR', 'IN', 21.935, (28.613889, 77.208889)),
    ('Mexico City', 'MX', 20.142, (19.433333, -99.133333)),
    ('New York-Newark', 'US', 20.104, (40.808611, -74.020386)),
    ('São Paulo', 'BR', 19.649, (-23.547778, -46.635833)),
]

def main():
    print(f'{"":15} | {"latitude":>9} | {"longitude":>9}')
    for record in metro_areas:
        match record: #(1)
            case [name, *_, (lat, lon)] if lon <= 0: #(2)
                print(f'{name:15} | {lat:9.4f} | {lon:9.4f}')

if __name__ == '__main__':
    main()

                |  latitude | longitude
Mexico City     |   19.4333 |  -99.1333 
New York-Newark |   40.8086 |  -74.0204 
São Paulo       |  -23.5478 |  -46.6358 


1. O sujeito desse `match` é `record` - cada uma das tuplas em `metro_areas`
2. Uma instrução case tem duas partes: um padrão e uma guarda opcional, com a palavra chave if.

Em geral, um padrão de sequência casa com o sujeito se estas 3 condições forem verdadeiras:

1. O sujeito é uma sequência, *e*
2. O sujeito e o padrão tem o mesmo numero de itens, *e*
3. Todos os itens correspondentes casam, incluindo os itens aninhados.

Exemplo:  o padrão `[name, _, _, (lat, lon)]` casa com uma sequência de quatro itens, e o ultimo item precisa ser uma sequência de dois itens.

Padrões de sequência podem ser escritos como tuplas e listas, mas a sintaxe usada não faz diferença: em um padrão de sequência, colchetes e parênteses tem o mesmo significado.



> Tipos que são compatíveis com padrões de sequência: `list`, `tuple`, `memoryview`, `array.array`, `tuple`, `range`, `collections.deque`

Ao contrário do desenpacotamento, padrões não desentruturam iteráveis que não sejam sequências (tal como os iteradores)

O símbolo `_` é especial nos padrões: ele casa com qualquer item naquela posição, mas nunca é vinculado ao valor daquele item. O valor é descartado. Além disso, o _ é a única variável que pode aparecer mais de uma vez em um padrão. 


Podemos vincular qualquer parte de um padrão a uma variável usando a palavra-chave `as`:

`case [name, _, _, (lat,lon) as coord]`



`case [name, _, _, (lat, lon) as coord]:`


Variável | Valor 

name        'Shanghai'
lat         31.1
lon         121.3
coord       (31.1, 121.3)


Para os padões ficarem ainda mais específicos podemos incluir informações de tipo

`case [str(name), _, _, (float(lat), float(lon))]`

Se queremos casar qualquer sujeito sequência começando com uma `str` e terminando com uma sequência aninhada com dois números de ponto flutuante, podemos escrever:

`case[str(name), *_, (float(lat), float(lon))]`



### 2.6.1 Casando padrões de sequência em um interpretador




##### 2.6.1.1 Padrões alternativos para lambda

A ideia o tópico continua sendo pattern matching usando o exemplo de um interpretador... 

# 2.7 Fatiamento

`seq[start:stop:step]`

`list`, `tuple` e `str` possuem suporte a fatiamento...

## 2.7.1 Por que fatias e faixas excluem o último item


In [11]:
l = [10,20,30,40,50,60]

l[:2] # divide no 2 

# [10, 20]

l[2:] # divide a partir do 2

# [30, 40, 50, 60]

l[:3] # divide no 3

# [10, 20, 30]

l[3:] # divide a partir do 3

# [40, 50, 60]

[40, 50, 60]

### 2.7.2 Objetos fatia

Na sintaxe `s[a:b:c]`, c pode ser um passo ou um salto fazendo que a fatia resultante pule itens. O passo pode ser também negativo devolvendo os itens em ordem inversa:

In [None]:
s = 'bicicleta'

print(s[::3])

print(s[::-1])

print(s[::-2])

bie
atelcicib
aeccb


A notação `a:b:c` só é valida entre `[]` quando usada como operador de indexação ou de substituição (subscript).

Para avaliar a expressão, o python chama `seq.__getitem__(slice(start,stop,step))`. Podemos dar nomes às fatias.

### 2.7.3 Fatiamento multidimensional e reticências


As reticências `...` são reconhecidas como um símbolo passado como argumento para funções e como parte da especificação de uma fatia, como em `f(a, ..., z)` 

### 2.7.4 Atribuindo Fatias

In [None]:
l = list(range(10))

print(l)

l[2:5] = [20,30]

print(l)

del l [5:7]

print(l)

l[3::2] = [11,22]

print(l)

#l[2:5] = 100 #(1)

# Quando o alvo de uma atribuição é uma fatia, 
# o lado direito deve ser um objeto iterável, 
# mesmo que tenha apenas um item

l[2:5] = [100]

print(l)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[0, 1, 20, 30, 5, 6, 7, 8, 9]
[0, 1, 20, 30, 5, 8, 9]
[0, 1, 20, 11, 5, 22, 9]
[0, 1, 100, 22, 9]


# 2.8 Usando `+` e `*` com sequências

In [None]:
# Os dois operandos de um + precisam ser do mesmo tipo 
# de sequência e nenhum deles é modificado e sim um novo 
# elemento é criado

l = [1,2,3]

print(l * 5)

print(5 * 'abcd')

[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]
abcdabcdabcdabcdabcd


## 2.8.1 Criando uma lista de listas

In [36]:
# Uma lista com três listas de tamanho 3 pode representar um tabuleiro de jogo da velha

board = [['_'] * 3 for i in range(3)] ## O elemento '_' é criado 3 vezes dentro da mesma lista

board[1][2] = 'X'

board


[['_', '_', '_'], ['_', '_', 'X'], ['_', '_', '_']]

In [None]:
# Um atalho tentador mas errado seria:

# A lista externa é feita de três referências para a mesma lista interna
weird_board = [['_'] * 3] * 3

weird_board[1][2] = 'O' 
# Colocar um O na linha 1, coluna 2 revela que todas as linhas são apelidos do mesmo objeto

weird_board

[['_', '_', 'O'], ['_', '_', 'O'], ['_', '_', 'O']]

In [None]:
row = ['_'] * 3

board = []

for i in range(3):
    board.append(row) # a mesma row é anexada 3 vezes ao board


# Por outro lado, a compreensão de lista do exemplo 14 equivale a:

board = []
for i in range(3):
    row = ['_'] * 3 # é criada uma nova row para cada ciclo do for
    board.append(row)



## 2.8.2 Atribuição aumentada com sequências


O método especial que faz `\+=` funcionar se chama `__iadd__`, que significa in-plade addition (adição interna).

Entretanto, se `__iadd__` não tiver implementado, o python usa `__add__` como antes de fazer a atribuição. 

In [None]:
a = [1,2,3]
b = [4,5,6]

a += b

a

# se á for sequência mutável (list, bytearray, array.array) 
# o objeto será modificado no lugar (mesmo que a.extend(b))


[1, 2, 3, 4, 5, 6]

In [None]:
l = [1,2,3]

print(id(l))

l *= 2

print(id(l)) # A lista é a mesma 

t = (1,2,3)

print(id(t))

t *= 2

print(id(t)) # foi criada uma nova tupla



139800497432768
139800497432768
139800850898304
139800923403168


A concatenação repetida de sequências imutáveis é ineficiente, pois ao invés de apenas acrescentar novos itens, o interpretador tem que copiar toda a sequência alvo para criar um novo objeto com os novos itens concatenados

## 2.8.3 Um quebra-cabeça com a atribuição +=

In [None]:
t = (1,2,[30,40])

t[2] += [50,60]


TypeError: 'tuple' object does not support item assignment

In [13]:
print(t)

(1, 2, [30, 40, 50, 60])


In [15]:
import dis
dis.dis('s[a] += b')

  0           RESUME                   0

  1           LOAD_NAME                0 (s)
              LOAD_NAME                1 (a)
              COPY                     2
              COPY                     2
              BINARY_SUBSCR
              LOAD_NAME                2 (b)
              BINARY_OP               13 (+=)
              SWAP                     3
              SWAP                     2
              STORE_SUBSCR
              RETURN_CONST             0 (None)


O autor faz uma análise do bytecode resultante e explica o motivo de a saída do exemplo acima funcionar e dar erro ao mesmo tempo.

TODO: Estudar sobre o bytecode do python.

### 2.9 list.sort versus a função embutida sorted

`list.sort` ordena uma lista internamente, devolve `None`

> Uma convenção importante em python: Funções e métodos que mudam o objeto internamente devem devolver `None`

A função embutida `sorted`, por outro lado, crie e devolve uma nova lista. Ela aceita qualquer objeto iterável como um argumento. Sempre devolve uma lista, independentemente do tipo de iterável passado.


Ambos aceitam dois argumentos opcionais:
- `reverse` -> Se true, os itens são develvidos em ordem decrescente.
- `key` -> Uma função de um argumento que será aplicada a cada item para produzir sua chave de ordenação.

In [None]:
a = 'qwertyuZiopasdfghj'

sorted(a, key=str.lower) # Ordena sem levar em conta maiúsculas e minúsculas

# key=len - Ordena pela quantidade de caracteres

['a',
 'd',
 'e',
 'f',
 'g',
 'h',
 'i',
 'j',
 'o',
 'p',
 'q',
 'r',
 's',
 't',
 'u',
 'w',
 'y',
 'Z']

In [None]:
frutas = ['uva', 'banana', 'maça', 'melão']

print(sorted(frutas)) # (1) Ordem alfabética

print(frutas) # (2) A lista não mudou

print(sorted(frutas, reverse=True)) # (3) Ordenação alfabética invertida

print(sorted(frutas, key=len)) # (4)  Strings ordenadas por tamanho

print(sorted(frutas, key=len, reverse=True)) # (5) Ordenadas em ordem decrescente

print(frutas) # (6) Até aqui a ordenação não mudou

frutas.sort()#Ordenação interna, retorna None

print(frutas) # Ordenada



['banana', 'maça', 'melão', 'uva']
['uva', 'banana', 'maça', 'melão']
['uva', 'melão', 'maça', 'banana']
['uva', 'maça', 'melão', 'banana']
['banana', 'melão', 'maça', 'uva']
['uva', 'banana', 'maça', 'melão']
['banana', 'maça', 'melão', 'uva']
