# Coleções

São objetos iteráveis: contém outros objetos, com os quais é possível contar e, a cada contagem, executar determinada ação.  
São essenciais para algoritmos de laço (loop).

Um iterador é sempre um iterável, mas que produz um valor a cada vez que é usado como argumento da função nativa next().

Um iterador deve sempre implementar o método next(), no Python 2, ou "\_\_next\_\_"(), no Python 3. Esse método deve retornar a exceção _StopIteration_ quando não há mais valores para o iterador produzir.

[O que são Iteradores no Python.](https://www.alura.com.br/artigos/o-que-sao-iteradores-no-python)

**Tipos de coleções:**  
*  Lista
*  Tupla
*  Dicionário
*  String
*  Set
*  Range

Alguns pacotes proveem seus próprios objetos iteráveis, como o *numpy*, com seu array e o *pandas*, que dispõe séries e dataframes.

Usaremos, primeiramente, as funções *print()*, *type()* e *len()* que, respectivamente, imprime o objeto, retorna o tipo do objeto e retorna o número de item dentro da coleção.

In [10]:
# Para imprimir o tipo dos objetos:

printype = lambda x: print(type(x))
printlen = lambda x: print(len(x))

## String

Em geral, é a forma como o Python entende o formato de texto.
* Contém tudo que estiver entre aspas simples ou aspas duplas.
* Cada caractere dentro de uma string também é uma string (uma string de apenas um caractere ainda é uma coleção)
* Números dentro de strings são identificados como strings e não podem participar de operações matemáticas - é preciso converter o tipo.

In [11]:
Texto = 'Isso é uma "string".'

print(Texto)
printype(Texto)
printlen(Texto)

Isso é uma "string".
<class 'str'>
20


In [12]:
# Uma string com apenas um caractere ainda é uma coleção
# E espaços também contam como caractere

Espaço = ' '

print(Espaço)
printype(Espaço)
printlen(Espaço)

 
<class 'str'>
1


In [13]:
# Escrevendo um texto corrido

Quintana = '''
Todos estes que aí estão
Atravancando o meu caminho,
Eles passarão.
Eu passarinho! 🐦
'''

print(Quintana)


Todos estes que aí estão
Atravancando o meu caminho,
Eles passarão.
Eu passarinho! 🐦



In [14]:
# Quebra de linha é designada como \n
# conta como um caractere

Quebra = 'a\na'

printlen(Quebra)

Quebra = '''a
a'''

printlen(Quebra)

###

# Tab é designado como \t
print('a\ta')

3
3
a	a


In [15]:
# O método "split()" transforma a string em lista, separando por um caractere definido no parâmetro.
# Se nenhum parâmetro é informado, a divisão ocorre nos espaços.

Texto_Split = Texto.split()

print(Texto_Split)
printype(Texto_Split)

print()
# O método "splitlines()" faz o mesmo, mas apenas nas quebras de linhas

Texto_Split_Line = Quintana.splitlines()

print(Texto_Split_Line)
printype(Texto_Split_Line)

['Isso', 'é', 'uma', '"string".']
<class 'list'>

['', 'Todos estes que aí estão', 'Atravancando o meu caminho,', 'Eles passarão.', 'Eu passarinho! 🐦']
<class 'list'>


In [16]:
Texto_Exemplo = 'isto é uma string\t sim, é.'

print(Texto_Exemplo)

Texto_Exemplo = Texto_Exemplo.capitalize()
print(Texto_Exemplo)

Texto_Exemplo = Texto_Exemplo.casefold()
print(Texto_Exemplo)

print('.',Texto_Exemplo.center(50),'.')

print(Texto_Exemplo.count('i'))

print(Texto_Exemplo.endswith('ng'))

print(Texto_Exemplo.expandtabs(80))

print(Texto_Exemplo.find('tri'))

print(Texto_Exemplo.find('tri'))

# Um identificador não contém espaçamento nem inicia com número.
print(Texto_Exemplo.isidentifier())

# Em inglês, diferentemente do português, todas as palavras do título inicial com letra maiúscula.
print(Texto_Exemplo.istitle())

# Justificado à esquerda
print(Texto_Exemplo.ljust(20,'.'))

# Versão cortada à esquerda
print(Texto_Exemplo.lstrip())



isto é uma string	 sim, é.
Isto é uma string	 sim, é.
isto é uma string	 sim, é.
.             isto é uma string	 sim, é.             .
3
False
isto é uma string                                                                sim, é.
12
12
False
False
isto é uma string	 sim, é.
isto é uma string	 sim, é.


In [17]:
# Conversão/tradução: substituição de caracteres

# O método maketrans() retorna um dicionário descrevendo cada substituição, em unicode:
Tábula = Texto_Exemplo.maketrans('i','y')
print(Tábula)

print(Texto_Exemplo.translate(Tábula))

{105: 121}
ysto é uma stryng	 sym, é.


In [18]:
# Valores cambiáveis na string

Preço = 47

Resposta = f'Custa apenas R${Preço},00.'
print(Resposta)

Resposta = 'Custa apenas R${price:.2f}.'
print(Resposta.format(price = Preço))

Resposta = 'Custa apenas R${price},00.'
print(Resposta.format(price = Preço))

Resposta = 'Custa apenas R${price},00.'.format(price = Preço)
print(Resposta)


Custa apenas R$47,00.
Custa apenas R$47.00.
Custa apenas R$47,00.
Custa apenas R$47,00.


In [19]:
# O prefixo 'r' na string faz com que a contrabarra não seja associada a um próximo caractere.

print('esta string \não tem quebra de linha')

print()

print(r'esta string \não tem quebra de linha')

esta string 
ão tem quebra de linha

esta string \não tem quebra de linha


## Listas

* Os elementos dentro da lista são separados por vírgula 
* Contém tudo que estiver entre Abre e Fecha Conchetes
* Podem ser modificadas
* Cada item dentro de uma lista possui um índice implícito, sendo o primeiro índice de número 0

In [20]:
lista = ['a','b','c','d','e','f','g','h']


In [72]:
lista[0]

'a'

In [73]:
lista.index('a')

0

In [21]:
# Zip une listas em uma iteração, retornando, em cada item, uma tupla composta dos valores de ambas as listas para o mesmo índice
# O número de itens resultantes será igual ao comprimeito da menor dentre as listas.

Lista1 = ['a','b','c','i']
Lista2 = ['d','e','f']
Lista3 = ['g','h']

for i in zip(Lista1,Lista2,Lista3):
    print(i)
    print(type(i))

print()

for i,j,k in zip(Lista1,Lista2,Lista3):
    print(i,j,k)

('a', 'd', 'g')
<class 'tuple'>
('b', 'e', 'h')
<class 'tuple'>

a d g
b e h


In [22]:
# Concatenação de listas

l1 = [1,2,3,4]

l1 + l1

[1, 2, 3, 4, 1, 2, 3, 4]

In [79]:
# Verificação lógica a partir de listas vazias ou preenchidas

Vazia = []

Cheia = [1]

if Vazia: #False
    print('A lista está vazia.')

if not Vazia: # not False
    print('A lista não está vazia')

if Cheia: # True
    print('A lista está preenchida')

if not Cheia: # not True
    print('A lista não está cheia.')

# Sempre lê-se "if contém" ou "if not contém"

A lista não está vazia
A lista está preenchida


## Tupla

In [23]:
#Tuplas são criadas com parênteses
tupla = ('isso', 'é', 'muito', 'limitado')
tupla

('isso', 'é', 'muito', 'limitado')

Tuplas são imutáveis. Não recebem nem perdem valores.

In [24]:
# É possível apenas obter informações da tupla
tupla2 = (1,2,3,4,5,6,7,8,9,0,0,9,8,7,6,5,4,3,2,1)
len(tupla2)

20

In [25]:
#O índice de determinado item de uma tupla
tupla2.index(5)

4

In [26]:
#Quantas vezes determinado item aparece numa tupla
tupla2.count(5)

2

In [27]:
#Conversão de tupla para lista
listupla = list(tupla2)
listupla

[1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 0, 9, 8, 7, 6, 5, 4, 3, 2, 1]

In [28]:
#Conversão de tupla para lista
tuplista = tuple(listupla)
tuplista

(1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 0, 9, 8, 7, 6, 5, 4, 3, 2, 1)

In [29]:
# Substituição com autoatribuição
tuplista = list(tuplista)
tuplista

[1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 0, 9, 8, 7, 6, 5, 4, 3, 2, 1]

## Dicionário

In [30]:
lista = [5, 10, 15, 20, 25, 30]

dict_4 = dict(Listado=lista)

print(dict_4)

{'Listado': [5, 10, 15, 20, 25, 30]}


In [31]:
dict1 = {'k1':4,'k2':6,'k3':8}
dict2 = {'k1':3,'k2':5,'k3':7}
dict3 = {'k1':2,'k2':10,'k3':17}

In [71]:
# A chave, no dicionário, funciona como índice

dict1['k1']

3

In [67]:
# Iterar pelo dicionário trará apenas as chaves

for i in dict1:
    print(i)

k1
k2
k3


In [77]:
dict1 = {'k1':4,'k2':6,'k3':8}

for i, j in dict1:
    print(i,j)

# Às vezes isso pode retornar um erro, além de apenas omitir os valores

for i,j in dict1.items():
    print(i,j)

k 1
k 2
k 3
k1 4
k2 6
k3 8


In [32]:
# Chaves e valores dos dicionários são iteráveis

Valores = dict1.values()
Chaves = dict1.keys()

for i in Valores:
    print(i)
for i in Chaves:
    print(i)

print(type(Valores))
print(type(Chaves))

4
6
8
k1
k2
k3
<class 'dict_values'>
<class 'dict_keys'>


In [33]:
# Normalmente, igualar cria uma cópia autônoma da variável original.

jjj = 3
kkk = jjj

kkk += 2

print(jjj)
print(kkk)

3
5


In [34]:
# Especificidade dos dicionários:
# o símbolo de igualdade não cria uma cópia, mas uma chamada
# O que ocorre com a chamada, ocorre com o dicionário original
# Igualar a outro dicionário não altera o dicionário original, mas altera a chamada para outro dicionário.

dict_atual = dict1
dict_atual['k2'] += dict_atual['k2']*2

print(dict_atual)
print(dict1)

{'k1': 4, 'k2': 18, 'k3': 8}
{'k1': 4, 'k2': 18, 'k3': 8}


In [35]:
del dict_atual['k3']
print(dict1)

{'k1': 4, 'k2': 18}


In [36]:
#É preciso utilizar o comando .uptade para copiar os itens de um dicionário para outro.
#receptor.update(fonte)
#qualquer item do dict fonte que tiver a mesma chave do dict receptor acaba por sobrescrevê-lo.

dict_atual.update(dict2)
dict_atual['k2'] += dict_atual['k2']*2

print(dict_atual)
print(dict2)
print(dict1)

{'k1': 3, 'k2': 15, 'k3': 7}
{'k1': 3, 'k2': 5, 'k3': 7}
{'k1': 3, 'k2': 15, 'k3': 7}


In [37]:
#Antes de usar o update, é preciso criar a cópia, mesmo que seja vazia.
#O comando .update transfere o conteúdo de um dict a outro.

dict_atual_2 = {}
dict_atual_2.update(dict2)

dict_atual_2['k3'] = dict_atual_2['k3']-2

print(dict_atual_2)
print(dict2)

dict_atual_2.update(dict3)

print(dict_atual_2)

{'k1': 3, 'k2': 5, 'k3': 5}
{'k1': 3, 'k2': 5, 'k3': 7}
{'k1': 2, 'k2': 10, 'k3': 17}


In [38]:
dictAppendable = {'ki':8,'kii':88,'k3':888}

#Aqui, como o dict2 tem chaves iguais às do dict_atual_2, elas são substituídas
dict_atual_2.update(dict2)
print(dict_atual_2)

#Aqui, como o dictAppendable tem chaves distintas, elas são adicionadas.
#Umas das chaves é igual, então ela sobrescreve como visto anteriormente
dict_atual_2.update(dictAppendable)
print(dict_atual_2)

{'k1': 3, 'k2': 5, 'k3': 7}
{'k1': 3, 'k2': 5, 'k3': 888, 'ki': 8, 'kii': 88}


In [39]:
#Uma forma (nada conveniente) de garantir que um dicionário será sobrescrito não obstante as chaves é:
#1 - Deletar o dicionário que seria sobrescrito
#2 - Recriar o dicionário que seria sobrescrito
#3 - Utilizar o método .append

def override(self,dict_overrider):
    del self
    self = {}
    self.update(dict_overrider)

override(dict_atual_2,dictAppendable)
print(dict_atual_2)

{'k1': 3, 'k2': 5, 'k3': 888, 'ki': 8, 'kii': 88}


## Set

## Looping

Trata-se de uma estrutura de código que implica em repetição de uma tarefa um número de vezes pré-estabelecido ou um até que uma condição seja atingida.

Diferença entre 'pass' e 'continue'.

In [40]:
# 'for'

In [41]:
# 'break'

In [42]:
# 'while True' e 'break'

In [43]:
x = 0

# 'pass' pula a verificação atual
    # Neste caso, passa pelo 'print(x)'

while True:
    x += 1
    if float(x) < 5:
        print('Esse não. Outro.')
        pass # <-- # <-- # <-- # <-- # <-- #
    else:
        print('Pode ser.')
        break
    print(x)

Esse não. Outro.
1
Esse não. Outro.
2
Esse não. Outro.
3
Esse não. Outro.
4
Pode ser.


In [44]:
x = 0

# 'continue' retorna o loop para o início
    # Neste caso, não passa por mais nada abaixo disso.

while True:
    x += 1
    if float(x) < 5:
        print('Esse não. Outro.')
        continue  # <-- # <-- # <-- # <-- # <-- #
    else:
        print('Pode ser.')
        break
    print(x)

Esse não. Outro.
Esse não. Outro.
Esse não. Outro.
Esse não. Outro.
Pode ser.


## Operações e Iteraçõs

### Converções

In [45]:
# De tupla ou lista para string
# Todos os itens devem ser strings

Tupla_Nomes = ("John", "Peter", "Vicky")

# Aqui, separaremos os itens com sustenido entre espaços.
x = " # ".join(Tupla_Nomes)

print(x)

Dicio_Nomes = {'Nome 1':"John", 'Nome 2':"Peter", 'Nome 3':"Vicky"}

# Conforme a iteraçõo de um dicionário passa apenas pelas chaves, aqui também apenas as chaves são convertidas.
# Aqui, separaremos os itens com sustenido entre espaços.
x = " # ".join(Dicio_Nomes)

print(x)

John # Peter # Vicky
Nome 1 # Nome 2 # Nome 3


In [46]:
#Transformando uma lista em um dicionário.
#As chaves serão os índices.

lista = ['a','b','c','d','e','f','g','h']

dict_da_lista = {i:j for i,j in enumerate(lista)}
print(dict_da_lista)

# Mais detalhes sobre a função 'enumerate' são dadas abaixo

{0: 'a', 1: 'b', 2: 'c', 3: 'd', 4: 'e', 5: 'f', 6: 'g', 7: 'h'}


In [47]:
# Transformando em lista

String_to_List = list('ABCD')

Tuple_to_List = list(('A', 'B', 'C', 'D'))

print(String_to_List == Tuple_to_List)

True


### Map

Aplica uma função a todos os elementos de uma coleção. A função não recebe coleções, mas elementos individuais

Um atalho para loop.

map(função,coleção,coleção,...)

In [48]:
#Duas listas iguais e uma função com return

a = [2,3,1,5,7,3,4,6,8,5,3,3,5,8,9]
b = [4,2,6,4,3,6,5,4,6,5,3,1,7,1,6]

def funcao(itemA,itemB):
    if itemA == itemB:
        return 'iguais'
    elif itemA > itemB:
        return 'primeiro maior'
    else:
        return 'segundo maior'

In [49]:
# O resultado é um iterador.
#Precisa ser transformado em uma lista ou tupla

print(map(funcao,a,b))
print('')
print(list(map(funcao,a,b)))

<map object at 0x000001C16B9F16C0>

['segundo maior', 'primeiro maior', 'segundo maior', 'primeiro maior', 'primeiro maior', 'segundo maior', 'segundo maior', 'primeiro maior', 'primeiro maior', 'iguais', 'iguais', 'primeiro maior', 'segundo maior', 'primeiro maior', 'primeiro maior']


In [50]:
#Listas de tamanhos diferentes.
#O resultado terá o tamanhno da menor lista

import random

c = []
for i in range(20):
    c.append(random.randint(1,100))
print(c)
print('')

d = []
for i in range(21):
    d.append(random.randint(1,100))
print(d)
print('')

mapeado = list(map(funcao,c,d))
print(mapeado)
print('')
print('Tamanho da lista mapeada:',(len(mapeado)))
print('')

for i,j,k in zip(c,d,mapeado):
    print(i,j,k)

[81, 1, 94, 86, 15, 76, 50, 77, 53, 100, 73, 62, 71, 44, 29, 3, 27, 31, 70, 22]

[35, 57, 78, 41, 78, 9, 22, 2, 87, 31, 69, 64, 51, 62, 52, 58, 58, 72, 37, 78, 34]

['primeiro maior', 'segundo maior', 'primeiro maior', 'primeiro maior', 'segundo maior', 'primeiro maior', 'primeiro maior', 'primeiro maior', 'segundo maior', 'primeiro maior', 'primeiro maior', 'segundo maior', 'primeiro maior', 'segundo maior', 'segundo maior', 'segundo maior', 'segundo maior', 'segundo maior', 'primeiro maior', 'segundo maior']

Tamanho da lista mapeada: 20

81 35 primeiro maior
1 57 segundo maior
94 78 primeiro maior
86 41 primeiro maior
15 78 segundo maior
76 9 primeiro maior
50 22 primeiro maior
77 2 primeiro maior
53 87 segundo maior
100 31 primeiro maior
73 69 primeiro maior
62 64 segundo maior
71 51 primeiro maior
44 62 segundo maior
29 52 segundo maior
3 58 segundo maior
27 58 segundo maior
31 72 segundo maior
70 37 primeiro maior
22 78 segundo maior


In [51]:
# Usando lambda como função inline

print(list(map(lambda x,y: x*y-x-y,a,b)))

[2, 1, -1, 11, 11, 9, 11, 14, 34, 15, 3, -1, 23, -1, 39]


Map e lambda são amplamente usados com o pacote Pandas para gerar colunas a partir de funções.

### Reduce

In [52]:
from functools import reduce

A função reduce, do pacote functools, é similar à função map, mas retorna apenas um valor ao invés de uma coleção

A função deve comportar exatamente 2 argumentos.

In [53]:
#Criando uma sequência de elementos numa lista para exemplo

from random import randint

a = []
for i in range(100):
    a.append(randint(1,1000))
    
b = []
for i in range(100):
    b.append(randint(1,1000))

In [54]:
#Recebe uma função e uma coleção como argumentos.
#Os argumentos da função estipulada como argumento do reduce serão os elementos da lista.
#O retorno é aplicado ao próximo item da lista.

def soma2(x,y):
    return x+y

resultado_da_soma2 = reduce(soma2,a)

print(resultado_da_soma2)

50331


In [55]:
# Usando lambda

resultado_da_soma4 = reduce(lambda x, y: x+y, a)
print(resultado_da_soma4)

50331


In [56]:
# Encontrar o maior valor

resultado_maior = reduce(lambda x,y: x if x>y else y, a)

print(resultado_maior)

975


### Filter

Exige uma função que retorna unicamente um resultado booleano, e uma coleção de valores que serão verificados.

O resultado é uma coleção de itens iguais aos itens da lista dada como parâmetro, mas excluindo aqueles cuja função avaliou como "False".

In [57]:
# A famigerada lista de números aleatórios
from random import randint

a = [randint(1,1000) for i in range (100)]
print(a)

[372, 837, 983, 223, 927, 518, 546, 54, 791, 720, 84, 117, 620, 160, 695, 386, 821, 579, 86, 133, 474, 458, 722, 645, 739, 354, 164, 38, 933, 105, 445, 873, 942, 579, 796, 228, 900, 910, 709, 184, 256, 461, 374, 328, 265, 721, 212, 600, 839, 414, 445, 282, 877, 110, 630, 903, 955, 501, 835, 330, 824, 61, 449, 169, 388, 204, 920, 274, 130, 278, 737, 758, 231, 841, 286, 221, 191, 721, 327, 300, 521, 832, 417, 743, 93, 524, 320, 957, 884, 476, 171, 776, 681, 772, 718, 944, 476, 679, 515, 960]


In [58]:
def par(a):
    if a%2 == 0:
        return True
    #else:
        #False

In [59]:
#Fora da lista, o resultado é um iterador.

print(filter(par,a))

print(list(filter(par,a)))

<filter object at 0x000001C16B9F8E20>
[372, 518, 546, 54, 720, 84, 620, 160, 386, 86, 474, 458, 722, 354, 164, 38, 942, 796, 228, 900, 910, 184, 256, 374, 328, 212, 600, 414, 282, 110, 630, 330, 824, 388, 204, 920, 274, 130, 278, 758, 286, 300, 832, 524, 320, 884, 476, 776, 772, 718, 944, 476, 960]


In [60]:
#Inline

list(filter(lambda x: True if x%2 == 0 else False,[randint(1,1000) for i in range (100)]))

len(list(filter(lambda x: True if x%2 == 0 else False,[randint(1,1000) for i in range (100)])))

50

In [61]:
#Apenas a verificação já basta, sem o 'if'

list(filter(lambda x: x%2 == 0 ,[randint(1,1000) for i in range (100)]))

[940,
 710,
 222,
 734,
 502,
 842,
 822,
 666,
 426,
 420,
 986,
 178,
 354,
 806,
 494,
 304,
 886,
 438,
 702,
 64,
 46,
 388,
 324,
 854,
 428,
 162,
 318,
 162,
 496,
 464,
 346,
 830,
 950,
 98,
 412,
 918,
 748,
 60,
 602,
 954,
 616,
 62,
 698,
 994,
 934,
 446,
 630,
 56,
 794,
 202,
 686]

### Zip

Com coleções de mesmo tamanho e tipo, as coleções são emparelhadas e são formadas tuplas. Cada tupla na nova coleção é composta pelos elementos das coleções fornecidas que tenham seu mesmo índice. A coleção resultante terá o mesmo tamanho das coleções fornecidas.

In [62]:
#O objeto criado pelo zip é um iterador.

listaA = ['a','b','c','d','e']
listaB = [1,2,3,4,5]

zipado = zip(listaA,listaB)

print(zipado)

print(list(zipado))

<zip object at 0x000001C16CA46040>
[('a', 1), ('b', 2), ('c', 3), ('d', 4), ('e', 5)]


In [63]:
#Uma aplicação recorrete do zip é na criação de dicionários a partir de outras coleções

dictzip = {}
for i,j in zip(listaA,listaB):
    dictzip[i] = j
print(dictzip) 

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}


In [64]:
#A mesma funcionalidade acima utilizando dict comprehention

dictcomprehended = {i:j for i,j in zip(listaA,listaB)}

print(dictcomprehended)

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}


In [65]:
#Como o pedido de apenas valores ou apenas chaves de um dicionário é dado como uma coleção indexada,
# também é possível lidar diretamente com elas.

#Objetos de dict não são evocáveis, mas podem ser pedidos como listas

dictkeys = {abra:cadabra for abra,cadabra in zip(list(dictzip.keys()),list(dictzip.keys()))}
print(dictkeys)

{'a': 'a', 'b': 'b', 'c': 'c', 'd': 'd', 'e': 'e'}


### Enumerate

In [66]:
# enumerate altera a iteração entre as listas, onde cada item passa a ser uma tupla composta de índice e valor daquela lista

Lista_Curta = ['a','b','c']

for i in enumerate(Lista_Curta):
    print(i)
    print(type(i))
    for j in i:
        print('     >',j)
        print('     >',type(j))
    print()

print('----------------------')

for i,j in enumerate(Lista_Curta):
    print(i,j)



(0, 'a')
<class 'tuple'>
     > 0
     > <class 'int'>
     > a
     > <class 'str'>

(1, 'b')
<class 'tuple'>
     > 1
     > <class 'int'>
     > b
     > <class 'str'>

(2, 'c')
<class 'tuple'>
     > 2
     > <class 'int'>
     > c
     > <class 'str'>

----------------------
0 a
1 b
2 c
