# Coleções

São objetos iteráveis: contém outros objetos, com os quais é possível contar e, a cada contagem, executar determinada ação.  
São essenciais para algoritmos de laço (loop).

Um iterador é sempre um iterável, mas que produz um valor a cada vez que é usado como argumento da função nativa next().

Um iterador deve sempre implementar o método next(), no Python 2, ou "\_\_next\_\_"(), no Python 3. Esse método deve retornar a exceção _StopIteration_ quando não há mais valores para o iterador produzir.

[O que são Iteradores no Python.](https://www.alura.com.br/artigos/o-que-sao-iteradores-no-python)

**Tipos de coleções:**  
*  Lista
*  Tupla
*  Dicionário
*  String
*  Set
*  Range

Alguns pacotes proveem seus próprios objetos iteráveis, como o *numpy*, com seu array e o *pandas*, que dispõe séries e dataframes.

Usaremos, primeiramente, as funções *print()*, *type()* e *len()* que, respectivamente, imprime o objeto, retorna o tipo do objeto e retorna o número de item dentro da coleção.

In [30]:
# Para imprimir o tipo dos objetos:

printype = lambda x: print(type(x))
printlen = lambda x: print(len(x))

## String

Em geral, é a forma como o Python entende o formato de texto.
* Contém tudo que estiver entre aspas simples ou aspas duplas.
* Cada caractere dentro de uma string também é uma string (uma string de apenas um caractere ainda é uma coleção)
* Números dentro de strings são identificados como strings e não podem participar de operações matemáticas - é preciso converter o tipo.

In [31]:
Texto = 'Isso é uma "string".'

print(Texto)
printype(Texto)
printlen(Texto)

Isso é uma "string".
<class 'str'>
20


In [6]:
# Uma string com apenas um caractere ainda é uma coleção
# E espaços também contam como caractere

Espaço = ' '

print(Espaço)
printype(Espaço)
printlen(Espaço)

 
<class 'str'>
1


In [8]:
# Escrevendo um texto corrido

Quintana = '''
Todos estes que aí estão
Atravancando o meu caminho,
Eles passarão.
Eu passarinho! 🐦
'''

print(Quintana)


Todos estes que aí estão
Atravancando o meu caminho,
Eles passarão.
Eu passarinho! 🐦



In [83]:
# Quebra de linha é designada como \n
# conta como um caractere

Quebra = 'a\na'

printlen(Quebra)

Quebra = '''a
a'''

printlen(Quebra)

###

# Tab é designado como \t
print('a\ta')

3
3
a	a


In [32]:
# O método "split()" transforma a string em lista, separando por um caractere definido no parâmetro.
# Se nenhum parâmetro é informado, a divisão ocorre nos espaços.

Texto_Split = Texto.split()

print(Texto_Split)
printype(Texto_Split)

print()
# O método "splitlines()" faz o mesmo, mas apenas nas quebras de linhas

Texto_Split_Line = Quintana.splitlines()

print(Texto_Split_Line)
printype(Texto_Split_Line)

['Isso', 'é', 'uma', '"string".']
<class 'list'>

['', 'Todos estes que aí estão', 'Atravancando o meu caminho,', 'Eles passarão.', 'Eu passarinho! 🐦']
<class 'list'>


In [89]:
Texto_Exemplo = 'isto é uma string\t sim, é.'

print(Texto_Exemplo)

Texto_Exemplo = Texto_Exemplo.capitalize()
print(Texto_Exemplo)

Texto_Exemplo = Texto_Exemplo.casefold()
print(Texto_Exemplo)

print('.',Texto_Exemplo.center(50),'.')

print(Texto_Exemplo.count('i'))

print(Texto_Exemplo.endswith('ng'))

print(Texto_Exemplo.expandtabs(80))

print(Texto_Exemplo.find('tri'))

print(Texto_Exemplo.find('tri'))

# Um identificador não contém espaçamento nem inicia com número.
print(Texto_Exemplo.isidentifier())

# Em inglês, diferentemente do português, todas as palavras do título inicial com letra maiúscula.
print(Texto_Exemplo.istitle())

# Justificado à esquerda
print(Texto_Exemplo.ljust(20,'.'))

# Versão cortada à esquerda
print(Texto_Exemplo.lstrip())



isto é uma string	 sim, é.
Isto é uma string	 sim, é.
isto é uma string	 sim, é.
.             isto é uma string	 sim, é.             .
3
False
isto é uma string                                                                sim, é.
12
12
False
False
isto é uma string	 sim, é.
isto é uma string	 sim, é.


In [93]:
# Conversão/tradução: substituição de caracteres

# O método maketrans() retorna um dicionário descrevendo cada substituição, em unicode:
Tábula = Texto_Exemplo.maketrans('i','y')
print(Tábula)

print(Texto_Exemplo.translate(Tábula))

{105: 121}
ysto é uma stryng	 sym, é.


In [72]:
# Valores cambiáveis na string

Preço = 47

Resposta = f'Custa apenas R${Preço},00.'
print(Resposta)

Resposta = 'Custa apenas R${price:.2f}.'
print(Resposta.format(price = Preço))

Resposta = 'Custa apenas R${price},00.'
print(Resposta.format(price = Preço))

Resposta = 'Custa apenas R${price},00.'.format(price = Preço)
print(Resposta)


Custa apenas R$47,00.
Custa apenas R$47.00.
Custa apenas R$47,00.
Custa apenas R$47,00.


In [8]:
# O prefixo 'r' na string faz com que a contrabarra não seja associada a um próximo caractere.

print('esta string \não tem quebra de linha')

print()

print(r'esta string \não tem quebra de linha')

esta string 
ão tem quebra de linha

esta string \não tem quebra de linha


: 

## Listas

* Os elementos dentro da lista são separados por vírgula 
* Contém tudo que estiver entre Abre e Fecha Conchetes
* Podem ser modificadas
* Cada item dentro de uma lista possui um índice implícito, sendo o primeiro índice de número 0

In [9]:
lista = ['a','b','c','d','e','f','g','h']


In [28]:
# Zip une listas em uma iteração, retornando, em cada item, uma tupla composta dos valores de ambas as listas para o mesmo índice
# O número de itens resultantes será igual ao comprimeito da menor dentre as listas.

Lista1 = ['a','b','c','i']
Lista2 = ['d','e','f']
Lista3 = ['g','h']

for i in zip(Lista1,Lista2,Lista3):
    print(i)
    print(type(i))

print()

for i,j,k in zip(Lista1,Lista2,Lista3):
    print(i,j,k)

('a', 'd', 'g')
<class 'tuple'>
('b', 'e', 'h')
<class 'tuple'>

a d g
b e h


In [1]:
# Concatenação de listas

l1 = [1,2,3,4]

l1 + l1

[1, 2, 3, 4, 1, 2, 3, 4]

## Tupla

In [5]:
#Tuplas são criadas com parênteses
tupla = ('isso', 'é', 'muito', 'limitado')
tupla

('isso', 'é', 'muito', 'limitado')

Tuplas são imutáveis. Não recebem nem perdem valores.

In [None]:
# É possível apenas obter informações da tupla
tupla2 = (1,2,3,4,5,6,7,8,9,0,0,9,8,7,6,5,4,3,2,1)
len(tupla2)

20

In [None]:
#O índice de determinado item de uma tupla
tupla2.index(5)

2

In [None]:
#Quantas vezes determinado item aparece numa tupla
tupla2.count(5)

2

In [None]:
#Conversão de tupla para lista
listupla = list(tupla2)
listupla

[1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 0, 9, 8, 7, 6, 5, 4, 3, 2, 1]

In [None]:
#Conversão de tupla para lista
tuplista = tuple(listupla)
tuplista

(1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 0, 9, 8, 7, 6, 5, 4, 3, 2, 1)

In [None]:
# Substituição com autoatribuição
tuplista = list(tuplista)
tuplista

[1, 2, 3, 4, 5, 6, 7, 8, 9, 0, 0, 9, 8, 7, 6, 5, 4, 3, 2, 1]

## Dicionário

In [4]:
lista = [5, 10, 15, 20, 25, 30]

dict_4 = dict(Listado=lista)

print(dict_4)

{'Listado': [5, 10, 15, 20, 25, 30]}


In [None]:
dict1 = {'k1':4,'k2':6,'k3':8}
dict2 = {'k1':3,'k2':5,'k3':7}
dict3 = {'k1':2,'k2':10,'k3':17}

In [None]:
# Normalmente, igualar cria uma cópia autônoma da variável original.

jjj = 3
kkk = jjj

kkk += 2

print(jjj)
print(kkk)

3
5


In [None]:
#Especificidade dos dicionários:
# o símbolo de igualdade não cria uma cópia, mas uma chamada
#O que ocorre com a chamada, ocorre com o dicionário original
# Igualar a outro dicionário não altera o dicionário original, mas altera a chamada para outro dicionário.

dict_atual = dict1
dict_atual['k2'] += dict_atual['k2']*2

print(dict_atual)
print(dict1)

{'k1': 4, 'k2': 18, 'k3': 8}
{'k1': 4, 'k2': 18, 'k3': 8}


In [None]:
del dict_atual['k3']
print(dict1)

{'k1': 4, 'k2': 18}


In [None]:
#É preciso utilizar o comando .uptade para copiar os itens de um dicionário para outro.
#receptor.update(fonte)
#qualquer item do dict fonte que tiver a mesma chave do dict receptor acaba por sobrescrevê-lo.

dict_atual.update(dict2)
dict_atual['k2'] += dict_atual['k2']*2

print(dict_atual)
print(dict2)
print(dict1)

{'k1': 3, 'k2': 15, 'k3': 7}
{'k1': 3, 'k2': 5, 'k3': 7}
{'k1': 3, 'k2': 15, 'k3': 7}


In [None]:
#Antes de usar o update, é preciso criar a cópia, mesmo que seja vazia.
#O comando .update transfere o conteúdo de um dict a outro.

dict_atual_2 = {}
dict_atual_2.update(dict2)

dict_atual_2['k3'] = dict_atual_2['k3']-2

print(dict_atual_2)
print(dict2)

dict_atual_2.update(dict3)

print(dict_atual_2)

{'k1': 3, 'k2': 5, 'k3': 5}
{'k1': 3, 'k2': 5, 'k3': 7}
{'k1': 2, 'k2': 10, 'k3': 17}


In [None]:
dictAppendable = {'ki':8,'kii':88,'k3':888}

#Aqui, como o dict2 tem chaves iguais às do dict_atual_2, elas são substituídas
dict_atual_2.update(dict2)
print(dict_atual_2)

#Aqui, como o dictAppendable tem chaves distintas, elas são adicionadas.
#Umas das chaves é igual, então ela sobrescreve como visto anteriormente
dict_atual_2.update(dictAppendable)
print(dict_atual_2)

{'k1': 3, 'k2': 5, 'k3': 7}
{'k1': 3, 'k2': 5, 'k3': 888, 'ki': 8, 'kii': 88}


In [None]:
#Uma forma (nada conveniente) de garantir que um dicionário será sobrescrito não obstante as chaves é:
#1 - Deletar o dicionário que seria sobrescrito
#2 - Recriar o dicionário que seria sobrescrito
#3 - Utilizar o método .append

def override(self,dict_overrider):
    del self
    self = {}
    self.update(dict_overrider)

override(dict_atual_2,dictAppendable)
print(dict_atual_2)

{'k1': 3, 'k2': 5, 'k3': 888, 'ki': 8, 'kii': 88}


## Set

## Looping

Trata-se de uma estrutura de código que implica em repetição de uma tarefa um número de vezes pré-estabelecido ou um até que uma condição seja atingida.

Diferença entre 'pass' e 'continue'.

In [None]:
# 'for'

In [None]:
# 'break'

In [None]:
# 'while True' e 'break'

In [100]:
x = 0

# 'pass' pula a verificação atual
    # Neste caso, passa pelo 'print(x)'

while True:
    x += 1
    if float(x) < 5:
        print('Esse não. Outro.')
        pass # <-- # <-- # <-- # <-- # <-- #
    else:
        print('Pode ser.')
        break
    print(x)

Esse não. Outro.
1
Esse não. Outro.
2
Esse não. Outro.
3
Esse não. Outro.
4
Pode ser.


In [101]:
x = 0

# 'continue' retorna o loop para o início
    # Neste caso, não passa por mais nada abaixo disso.

while True:
    x += 1
    if float(x) < 5:
        print('Esse não. Outro.')
        continue  # <-- # <-- # <-- # <-- # <-- #
    else:
        print('Pode ser.')
        break
    print(x)

Esse não. Outro.
Esse não. Outro.
Esse não. Outro.
Esse não. Outro.
Pode ser.


## Operações e Iteraçõs

### Converções

In [82]:
# De tupla ou lista para string
# Todos os itens devem ser strings

Tupla_Nomes = ("John", "Peter", "Vicky")

# Aqui, separaremos os itens com sustenido entre espaços.
x = " # ".join(Tupla_Nomes)

print(x)

Dicio_Nomes = {'Nome 1':"John", 'Nome 2':"Peter", 'Nome 3':"Vicky"}

# Conforme a iteraçõo de um dicionário passa apenas pelas chaves, aqui também apenas as chaves são convertidas.
# Aqui, separaremos os itens com sustenido entre espaços.
x = " # ".join(Dicio_Nomes)

print(x)

John # Peter # Vicky
Nome 1 # Nome 2 # Nome 3


In [None]:
#Transformando uma lista em um dicionário.
#As chaves serão os índices.

lista = ['a','b','c','d','e','f','g','h']

dict_da_lista = {i:j for i,j in enumerate(lista)}
print(dict_da_lista)

# Mais detalhes sobre a função 'enumerate' são dadas abaixo

{0: 'a', 1: 'b', 2: 'c', 3: 'd', 4: 'e', 5: 'f', 6: 'g', 7: 'h'}


In [3]:
# Transformando em lista

String_to_List = list('ABCD')

Tuple_to_List = list(('A', 'B', 'C', 'D'))

print(String_to_List == Tuple_to_List)

True


### Map

Aplica uma função a todos os elementos de uma coleção. A função não recebe coleções, mas elementos individuais

Um atalho para loop.

map(função,coleção,coleção,...)

In [None]:
#Duas listas iguais e uma função com return

a = [2,3,1,5,7,3,4,6,8,5,3,3,5,8,9]
b = [4,2,6,4,3,6,5,4,6,5,3,1,7,1,6]

def funcao(itemA,itemB):
    if itemA == itemB:
        return 'iguais'
    elif itemA > itemB:
        return 'primeiro maior'
    else:
        return 'segundo maior'

In [None]:
# O resultado é um iterador.
#Precisa ser transformado em uma lista ou tupla

print(map(funcao,a,b))
print('')
print(list(map(funcao,a,b)))

<map object at 0x000002485F7B8880>

['segundo maior', 'primeiro maior', 'segundo maior', 'primeiro maior', 'primeiro maior', 'segundo maior', 'segundo maior', 'primeiro maior', 'primeiro maior', 'iguais', 'iguais', 'primeiro maior', 'segundo maior', 'primeiro maior', 'primeiro maior']


In [None]:
#Listas de tamanhos diferentes.
#O resultado terá o tamanhno da menor lista

import random

c = []
for i in range(20):
    c.append(random.randint(1,100))
print(c)
print('')

d = []
for i in range(21):
    d.append(random.randint(1,100))
print(d)
print('')

mapeado = list(map(funcao,c,d))
print(mapeado)
print('')
print('Tamanho da lista mapeada:',(len(mapeado)))
print('')

for i,j,k in zip(c,d,mapeado):
    print(i,j,k)

[33, 85, 1, 87, 70, 46, 41, 15, 12, 47, 77, 81, 49, 56, 30, 92, 78, 71, 47, 48]

[92, 24, 50, 93, 24, 65, 4, 72, 15, 68, 8, 38, 76, 17, 94, 45, 67, 77, 8, 10, 34]

['segundo maior', 'primeiro maior', 'segundo maior', 'segundo maior', 'primeiro maior', 'segundo maior', 'primeiro maior', 'segundo maior', 'segundo maior', 'segundo maior', 'primeiro maior', 'primeiro maior', 'segundo maior', 'primeiro maior', 'segundo maior', 'primeiro maior', 'primeiro maior', 'segundo maior', 'primeiro maior', 'primeiro maior']

Tamanho da lista mapeada: 20

33 92 segundo maior
85 24 primeiro maior
1 50 segundo maior
87 93 segundo maior
70 24 primeiro maior
46 65 segundo maior
41 4 primeiro maior
15 72 segundo maior
12 15 segundo maior
47 68 segundo maior
77 8 primeiro maior
81 38 primeiro maior
49 76 segundo maior
56 17 primeiro maior
30 94 segundo maior
92 45 primeiro maior
78 67 primeiro maior
71 77 segundo maior
47 8 primeiro maior
48 10 primeiro maior


In [None]:
# Usando lambda como função inline

print(list(map(lambda x,y: x*y-x-y,a,b)))

[2, 1, -1, 11, 11, 9, 11, 14, 34, 15, 3, -1, 23, -1, 39]


Map e lambda são amplamente usados com o pacote Pandas para gerar colunas a partir de funções.

### Reduce

In [1]:
from functools import reduce

A função reduce, do pacote functools, é similar à função map, mas retorna apenas um valor ao invés de uma coleção

A função deve comportar exatamente 2 argumentos.

In [None]:
#Criando uma sequência de elementos numa lista para exemplo

from random import randint

a = []
for i in range(100):
    a.append(randint(1,1000))
    
b = []
for i in range(100):
    b.append(randint(1,1000))

In [None]:
#Recebe uma função e uma coleção como argumentos.
#Os argumentos da função estipulada como argumento do reduce serão os elementos da lista.
#O retorno é aplicado ao próximo item da lista.

def soma2(x,y):
    return x+y

resultado_da_soma2 = reduce(soma2,a)

print(resultado_da_soma2)

49667


In [None]:
# Usando lambda

resultado_da_soma4 = reduce(lambda x, y: x+y, a)
print(resultado_da_soma4)

49667


In [None]:
# Encontrar o maior valor

resultado_maior = reduce(lambda x,y: x if x>y else y, a)

print(resultado_maior)

978


### Filter

Exige uma função que retorna unicamente um resultado booleano, e uma coleção de valores que serão verificados.

O resultado é uma coleção de itens iguais aos itens da lista dada como parâmetro, mas excluindo aqueles cuja função avaliou como "False".

In [None]:
# A famigerada lista de números aleatórios
from random import randint

a = [randint(1,1000) for i in range (100)]
print(a)

[867, 594, 432, 203, 162, 526, 6, 809, 827, 181, 954, 340, 620, 422, 85, 228, 999, 198, 806, 959, 146, 724, 338, 879, 762, 955, 239, 415, 390, 715, 337, 200, 769, 838, 169, 452, 620, 714, 10, 138, 546, 663, 889, 664, 662, 681, 936, 740, 556, 388, 619, 729, 598, 306, 279, 983, 759, 947, 83, 387, 969, 898, 38, 592, 968, 703, 586, 201, 395, 156, 25, 996, 10, 244, 885, 826, 422, 905, 556, 54, 674, 846, 477, 289, 402, 683, 774, 657, 692, 807, 859, 460, 599, 545, 732, 603, 864, 614, 8, 240]


In [None]:
def par(a):
    if a%2 == 0:
        return True
    #else:
        #False

In [None]:
#Fora da lista, o resultado é um iterador.

print(filter(par,a))

print(list(filter(par,a)))

[594, 432, 162, 526, 6, 954, 340, 620, 422, 228, 198, 806, 146, 724, 338, 762, 390, 200, 838, 452, 620, 714, 10, 138, 546, 664, 662, 936, 740, 556, 388, 598, 306, 898, 38, 592, 968, 586, 156, 996, 10, 244, 826, 422, 556, 54, 674, 846, 402, 774, 692, 460, 732, 864, 614, 8, 240]


In [None]:
#Inline

list(filter(lambda x: True if x%2 == 0 else False,[randint(1,1000) for i in range (100)]))

len(list(filter(lambda x: True if x%2 == 0 else False,[randint(1,1000) for i in range (100)])))

43

In [None]:
#Apenas a verificação já basta, sem o 'if'

list(filter(lambda x: x%2 == 0 ,[randint(1,1000) for i in range (100)]))

[536,
 488,
 284,
 798,
 452,
 572,
 856,
 254,
 12,
 350,
 960,
 214,
 164,
 124,
 386,
 12,
 792,
 902,
 764,
 144,
 196,
 604,
 344,
 890,
 950,
 720,
 924,
 786,
 358,
 50,
 452,
 254,
 422,
 484,
 794,
 536,
 236,
 4,
 930,
 710,
 4,
 150,
 608,
 682,
 844,
 1000,
 342,
 836,
 850,
 642,
 142,
 276,
 244,
 346,
 878,
 900,
 486,
 554]

### Zip

Com coleções de mesmo tamanho e tipo, as coleções são emparelhadas e são formadas tuplas. Cada tupla na nova coleção é composta pelos elementos das coleções fornecidas que tenham seu mesmo índice. A coleção resultante terá o mesmo tamanho das coleções fornecidas.

In [None]:
#O objeto criado pelo zip é um iterador.

listaA = ['a','b','c','d','e']
listaB = [1,2,3,4,5]

zipado = zip(listaA,listaB)

print(zipado)

print(list(zipado))

<zip object at 0x000001D1F87C8E40>
[('a', 1), ('b', 2), ('c', 3), ('d', 4), ('e', 5)]


In [None]:
#Uma aplicação recorrete do zip é na criação de dicionários a partir de outras coleções

dictzip = {}
for i,j in zip(listaA,listaB):
    dictzip[i] = j
print(dictzip) 

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}


In [None]:
#A mesma funcionalidade acima utilizando dict comprehention

dictcomprehended = {i:j for i,j in zip(listaA,listaB)}

print(dictcomprehended)

{'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}


In [None]:
#Como o pedido de apenas valores ou apenas chaves de um dicionário é dado como uma coleção indexada,
# também é possível lidar diretamente com elas.

#Objetos de dict não são evocáveis, mas podem ser pedidos como listas

dictkeys = {abra:cadabra for abra,cadabra in zip(list(dictzip.keys()),list(dictzip.keys()))}
print(dictkeys)

{'a': 'a', 'b': 'b', 'c': 'c', 'd': 'd', 'e': 'e'}


### Enumerate

In [23]:
# enumerate altera a iteração entre as listas, onde cada item passa a ser uma tupla composta de índice e valor daquela lista

Lista_Curta = ['a','b','c']

for i in enumerate(Lista_Curta):
    print(i)
    print(type(i))
    for j in i:
        print('     >',j)
        print('     >',type(j))
    print()

print('----------------------')

for i,j in enumerate(Lista_Curta):
    print(i,j)



(0, 'a')
<class 'tuple'>
     > 0
     > <class 'int'>
     > a
     > <class 'str'>

(1, 'b')
<class 'tuple'>
     > 1
     > <class 'int'>
     > b
     > <class 'str'>

(2, 'c')
<class 'tuple'>
     > 2
     > <class 'int'>
     > c
     > <class 'str'>

----------------------
0 a
1 b
2 c
