<h1> Estrutura de Dados, Funções e Arquivos - Ch3

In [1]:
#Testando descompactar tuplas com *rest

values = tuple([1,2,3,4,5])
a,b,*rest = values

print(a,b)
print(rest)

1 2
[3, 4, 5]


In [2]:
#Loop for diferente para descompactar tuplas

seq = [(1,2,3), (4,5,6), (7,8,9)]

for a,b,c in seq:
    print('a={0}, b={1}, c={2}'.format(a,b,c))

a=1, b=2, c=3
a=4, b=5, c=6
a=7, b=8, c=9


In [3]:
#Passando para listas, o método .sort() ordena a própria lista enquanto a função sorted() cria uma cópia da lista ordenada

a = [7,2,5,1,3]
a.sort()
print(a)

b = sorted(a)
print(b)

[1, 2, 3, 5, 7]
[1, 2, 3, 5, 7]


In [4]:
#A biblioteca bisect pode ser muito útil para buscas binárias em uma lista JÁ ORDENADA
import bisect
lista = [1,2,2,2,3,4,7]

#o método bisect retorna a posição adequada para inserirmos um elemento novo. Faremos isso para o elemento 5
print(bisect.bisect(lista, 5))

#Ele nos retornou a 6a posição da lista, após o número 4
#Vamos agora inserir o elemento 5 na lista automaticamente

bisect.insort(lista,5)
lista

6


[1, 2, 2, 2, 3, 4, 5, 7]

In [5]:
#Só reforçando a importância da função enumerate()

some_list = ['foo','bar','joy']

mapping = {}

for k, v in enumerate(some_list):
    mapping[k] = v

print(mapping)

{0: 'foo', 1: 'bar', 2: 'joy'}


In [6]:
#Reforçando a importância da função zip para parear elementos de listas ou tuplas distintas

seq_01 = ['foo','bar','joy']
seq_02 = ['one','two','three']

zipped = zip(seq_01, seq_02)

#é preciso descompactar o objeto zip usando o comando list()
list(zipped)

[('foo', 'one'), ('bar', 'two'), ('joy', 'three')]

In [7]:
#Podemos também mapear dicionários a partir de sequências

keys = ['1', '2','3']
values = [500, 1000, 1500]
mapping = {}

for key,value in zip(keys,values):
    mapping[key] = value

mapping

{'1': 500, '2': 1000, '3': 1500}

In [8]:
#Valores default são um conceito importante e nem sempre utilizados

words = ['apple','bat', 'bar', 'battery', 'amen', 'atom','book']

by_letter = {}

for word in words:
    #recupera a primeira letra da palavra
    letter = word[0]
    #Se a letra não estiver no dicionário cria uma lista
    if letter not in by_letter:
        by_letter[letter] = [word]
    #Se a letra inicial já existir no dicionário, só amplia a lista
    else:
        by_letter[letter].append(word)
    
by_letter

{'a': ['apple', 'amen', 'atom'], 'b': ['bat', 'bar', 'battery', 'book']}

In [9]:
#Poderíamos reescrever a célula anterior a partir do método setdefault

by_letter = {}

#Para o método .setdefault() colocamos primeiro o valor default, depois o valor condicional
#fica assim então: dicionario.setdefault(valor_default, valor_condicional=NONE)

for word in words:
    letter = word[0]
    by_letter.setdefault(letter, []).append(word)

print(by_letter)

{'a': ['apple', 'amen', 'atom'], 'b': ['bat', 'bar', 'battery', 'book']}


Os valores de um dicionário podem ser de qualquer tipo, já as chaves precisam ser imutáveis (hashable).

A função *hash()* nos ajuda a descobrir quais tipos de dados são mutáveis ou imutáveis.

In [10]:
print(hash('string'))
print(hash((1,2,(2,3))))
print(hash(20))

4913233019112863333
-9209053662355515447
20


In [11]:
#quando usamos a função hash em um tipo de dados mutável, recebemos um erro:

hash([2,4,6])

TypeError: unhashable type: 'list'

<h2> Brincando com sets

Set são conjuntos, uma coleção ordenada de elementos únicos. São como dicionários só com as chaves, sem os valores.

In [None]:
#Podemos criar sets por meio de uma função:

conjunto = set([1,2,2,2,3,1,1,2,3,3,3])
print(conjunto)

#Ou por meio da mesma sintáxe que o dicionário

conjunto = {1,2,2,2,1,1,1,3,3,3,1,2,1,3,1,2,3}
print(conjunto)

Podemos fazer operações matemáticas de conjuntos com os sets, como união, intersecção e diferença

In [None]:
a = {1,2,3,4,5}
b = {3,4,5,6,7,8}

print(a.union(b))
print(a.intersection(b))
print(a.difference(b))
print(b.difference(a))

Para ver todas as operações possíveis, é só apertar tab na última linha a seguir

In [None]:
set01 = set()
set01.

Assim como seria em um dicionário, para colocar uma lista em um objeto set precisaríamos primeiro convertê-lo em uma tupla

In [None]:
my_data = [1,2,3,4]
my_set = tuple(my_data)
my_set

Também podemos verificar se um conjunto contém ou está contido em outro

In [None]:
conj_01 = {1,2,3,4,5}
conj_02 = {0,1,2,3,4,5,6,7,8,9}

print(conj_01.issubset(conj_02))
print(conj_02.issuperset(conj_01))
print(conj_02.issubset(conj_01))

<h2> List, Set e Dict Comprehension

In [None]:
programming_languages = ['C','C++', 'C#', 'Java', 'Javascript', 'Python', 'Ruby', 'HTML', 'CSS', 'Go']

#list comprehension
print([s.lower() for s in programming_languages if len(s)>=3])

#set comprehension
word_len = {len(x) for x in programming_languages}
print(word_len)

#dict comprehension
loc_mapping = {indice:("Linguagem " + valor) for indice, valor in enumerate(programming_languages)}
print(loc_mapping)

In [None]:
#Aninhamento

all_data = [["John", "Emily", "Peter", "Mary", "James"], ["João", "Emília", "Pedro", "Maria", "Tiago"]]

#Verificando todos os nomes com 2 os.
#[output for variavel_01 in lista_maior for variavel_02 in lista_menor if condição_lista-menor]

resultado = [name for names in all_data for name in names if name.count('o') >=2]
print(resultado)

#Outro exemplo com tuplas numéricas

some_tuples = [(1,2,3), (4,5,6), (7,8,9)]

flattened = [number for numbers in some_tuples for number in numbers]
print(flattened)

#Uma sintáxe diferente que transforma as tuplas em listas
some_lists = [[n for n in tup] for tup in some_tuples]
print(some_lists)

<h2> Funções

In [None]:
def soma_sub (x,y, z=1):
    if z>=1:
        return x + y
    if z<1:
        return x-y

    #no caso, x e y são posicionais e z é nomeado

print(soma_sub(2,3))
print(soma_sub(2,3,0))
print(soma_sub(3,4,1))

Namespace é uma outra designação para escopo de função (local e global)

In [None]:
a = None

def bind_list():
    global a 
    a = [1,2,3]

bind_list()
print(a)

Quando uma função retorna "diversos valores", na verdade está devolvendo uma tupla. Podemos descompactá-los ou trabalhar com a tupla.

In [None]:
def f():
    a=5
    b=6
    c=7
    return a,b,c


valores = f()
print(valores)

v1,v2,v3 = f()
print(v3)

**Funções também são objetos!** Por isso, podemos funções que queremos aplicar sequencialmente em uma lista e aplicá-las. Veja o exemplo

In [None]:
import re

estados = ["São Paulo", "são paulo", "São paulo?", "Bahia", "Rio de Janeiro!", "#ParAná"]

def remove_ponctuation(value):
    return re.sub('[!#?]', '',value)

#Todas as funções que iremos utilizar
clean_fxns = [str.strip, remove_ponctuation, str.title]

def clean_strings(strings,clean_functions):
    result = []
    for value in strings:
        for function in clean_functions:
            value = function(value)
        result.append(value)
    return result

cs = clean_strings(estados,clean_fxns)
print(set(cs))

Um exemplo do uso de funções em outras funções é a função map() que aplica uma função em um determinado conjunto de dados.

In [None]:
for x in map(remove_ponctuation, estados):
    print(x)

Utilizamos **currying** quando queremos simplificar uma função aplicando parcialmente alguns argumentos. Por exemplo:

In [None]:
def add(x,y):
    return x+y

#Se x for sempre 5, poderíamos fazer
add_five = lambda y: add(5,y)

#Agora se usarmos add_five
print(add_five(2))

<h2>Geradores (Generators) e Expressões Geradoras (Generator Expressions)

Um gerador é uma nova forma concisa de construir um objeto que seja iterável. Enquanto funções usuais executam e devolvem um único resultado de cada vez, os geradores devolvem uma sequência de vários resultados em modo lazy, fazendo uma pausa após cada um até que o próximo resultado seja solicitado. Para criar um gerador, basta usar a palavra reservada **yield** ao invés de *return* em uma função.

In [12]:
def squares(n=10):
    print("\nGerando os quadrados de 1 a {0}".format(n))
    for i in range(1, n+1):
        yield i**2

#Squares() só devolve um objeto gerador
print(squares())

#Para solicitar os elementos de um gerador, precisamos de um laço for
for x in squares():
    print(x, end = ' ')
    
for x in squares(15):
    print(x, end = '|')

<generator object squares at 0x000002203EC29A50>

Gerando os quadrados de 1 a 10
1 4 9 16 25 36 49 64 81 100 
Gerando os quadrados de 1 a 15
1|4|9|16|25|36|49|64|81|100|121|144|169|196|225|

Outra forma mais concisa de criar um gerador é por meio de uma **expressão geradora (genexpr)**. Basa usar um list comprehension entre parêntese ao invés de entre colchetes.

In [13]:
gen = (x**2 for x in range(100))
print(gen)
print()
print(list(gen), end = ' ')
print('\n')
print(sum(gen))

<generator object <genexpr> at 0x000002203EB7B510>

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361, 400, 441, 484, 529, 576, 625, 676, 729, 784, 841, 900, 961, 1024, 1089, 1156, 1225, 1296, 1369, 1444, 1521, 1600, 1681, 1764, 1849, 1936, 2025, 2116, 2209, 2304, 2401, 2500, 2601, 2704, 2809, 2916, 3025, 3136, 3249, 3364, 3481, 3600, 3721, 3844, 3969, 4096, 4225, 4356, 4489, 4624, 4761, 4900, 5041, 5184, 5329, 5476, 5625, 5776, 5929, 6084, 6241, 6400, 6561, 6724, 6889, 7056, 7225, 7396, 7569, 7744, 7921, 8100, 8281, 8464, 8649, 8836, 9025, 9216, 9409, 9604, 9801] 

0


O módulo **itertools** tem uma série de funções geradoras que podem nos ser bastante úteis

In [None]:
import itertools

first_letter = lambda x : x[0]

names = ['Gustavo Ferratti', 'Juliana', 'Raul', 'Kátia', 'Rodolfo', 'Gustavo Schimidt', 'Victor', 'Paula']
names = sorted(names)
names_groupby = itertools.groupby(names, first_letter)

for letter, names in names_groupby:
    print(letter, list(names))#names é um gerador, por isso usamos list()

#Importante! Para o groupby dar certo a lista precisa estar ORDENADA!!!

In [None]:
from itertools import combinations, permutations

#combinação ignora a ordem
lista_01 = ['pato','ganso','macaco','mosca']
comb = combinations(lista_01,2)
lista_comb = [' '.join(conjunto) for conjunto in comb]
print(lista_comb)

#permutação a ordem importa
perm = permutations(lista_01,2)
lista_perm = [' '.join(conjunto) for conjunto in perm]
print(lista_perm)