### Conjuntos

In [2]:
usuarios_data_science = [15, 23, 43, 56]
usuarios_machine_learning = [13, 23, 56, 42]

- Suponha que queiramos definir uma lista com todas as pessoas que assistiram os cursos de data science ou machine learning. Podemos definir uma nova lista a partir dessas duas iniciais com o auxílio do método *extend* para objetos do tipo list

In [4]:
assistiram = []
assistiram.extend(usuarios_data_science) # passa por todos os elementos da lista 'usuarios_data_science' e os acrescenta ao final da lista 'assistiram'

In [5]:
# ou então:
assistiram = usuarios_data_science.copy()
assistiram.extend(usuarios_machine_learning)
assistiram

[15, 23, 43, 56, 13, 23, 56, 42]

- Se quiséssemos excluir os elementos repetidos por algum motivo, poderíamos abandonar temporariamente a ideia de lista e passar a lidar com *conjuntos*

In [9]:
print(set(assistiram))
# um conjunto no python não possui elementos repetidos,

print(type(set(assistiram)))

{42, 43, 13, 15, 23, 56}
<class 'set'>


- Caso a ordem dos elementos não seja relevante (assim como a posição dos elementos, que é um dos requisitos gerais para se utilizar listas), então podemos utilizar conjuntos 

In [11]:
usuarios_data_science = {15, 23, 43, 56}
usuarios_machine_learning = {13, 23, 56, 42}

In [12]:
# os conjuntos, entretanto, não possuem indexação
usuarios_data_science[0]

TypeError: 'set' object is not subscriptable

- Obs.: como sequências de elementos, os conjuntos ainda podem ser iterados, contudo, dado que esses objetos não possuem indexação (temos literalmente *um conjunto de valores* armazenado numa variável), a ordem de emissão dos valores é aleatória

In [13]:
for usuario in set(assistiram):
    print(usuario)

42
43
13
15
23
56


In [16]:
usuarios_data_science | usuarios_machine_learning 
# 'ou' (união de conjuntos)

{13, 15, 23, 42, 43, 56}

In [17]:
usuarios_data_science & usuarios_machine_learning 
# 'e' (interseção de conjuntos)

{23, 56}

In [None]:
usuarios_data_science - usuarios_machine_learning
# (exclusão de conjuntos; verificação dos elementos que estão somente no primero conjunto)

In [18]:
fez_ds_mas_n_fez_ml = usuarios_data_science - usuarios_machine_learning

print(10 in fez_ds_mas_n_fez_ml)
print(15 in fez_ds_mas_n_fez_ml)

False
True


- Os conjuntos, assim como as listas, são objetos mutáveis, mas como não possuem indexação, as duas únicas alterações que podemos aplicar são: adição / remoção de elemntos.
- Ps.: ainda assim, a adição não garante que o conjunto será alterado, pois por padrão esse tipo de objeto já remove todas as duplicidades

In [21]:
testes = {10,5,1,6,3,7,3}
testes.add(5)
print(len(testes))
testes.add(1)
print(len(testes))
testes.add(8)
print(len(testes))
testes.remove(8)
print(len(testes))

6
6
7
6


- Caso haja necessidade, por algum motivo, de trabalhar com conjuntos imutáveis, podemos fazer isso com a utilização da função *frozenset*, que retorna um novo objeto do tipo set, mas imutável

In [25]:
testes2 = frozenset(testes)
testes2

frozenset({1, 3, 5, 6, 7, 10})

In [26]:
testes2.add(2)

AttributeError: 'frozenset' object has no attribute 'add'

- Não necessáriamente precisamos utilizar sempre números. O objeto conjunto permite que trabalhemos também com strings

In [23]:
texto = 'Meu nome é Lucas, meu hobbie é treinar e meu notebook precisa ser atualizado'
texto.replace(',','').split()

['Meu',
 'nome',
 'é',
 'Lucas',
 'meu',
 'hobbie',
 'é',
 'treinar',
 'e',
 'meu',
 'notebook',
 'precisa',
 'ser',
 'atualizado']

In [24]:
set(texto.replace(',','').split()) 
# retorna todas as palavras do nosso string sem duplicação

{'Lucas',
 'Meu',
 'atualizado',
 'e',
 'hobbie',
 'meu',
 'nome',
 'notebook',
 'precisa',
 'ser',
 'treinar',
 'é'}

### Dicionários

- Representam uma estrutura do tipo *chave-valor*

In [27]:
dic = {
    'Lucas': 2
    ,'teste': 'testando'
}

In [28]:
type(dic)

dict

In [29]:
dic['Lucas'] # valor da chave 'Lucas'

2

In [30]:
dic['teste'] # valor da chave 'teste'

'testando'

In [31]:
dic['teste2'] # valor da chave 'teste2' (não existe no dicionário criado)

KeyError: 'teste2'

In [33]:
dic.get('teste2', 0) # tento pegar o valor da chave 'teste2' e, caso não esteja presente na estrutura, retorno o código 0

0

- Apesar de não ser muito comum, poderíamos definir um dicionário também utilizando o indcador built-in *dict* do próprio Python, de acordo com a seguinte sintaxe

In [34]:
dic = dict(Lucas= 2, teste= 'testando')
dic

{'Lucas': 2, 'teste': 'testando'}

- Para adicionar um novo elemento, ou seja, uma nova chave, precisamos manipular a sintaxe como se estivéssemos querendo acessar o valor da chave 

In [37]:
dic['Lucas5'] = 'teste_testando'
dic

{'Lucas': 2, 'teste': 'testando', 'Lucas5': 'teste_testando'}

- Para remover, utilizamos o comando *del*

In [38]:
del dic['Lucas5']
dic

{'Lucas': 2, 'teste': 'testando'}

In [45]:
# verificando a presença de chaves no dicionário
print('Lucas' in dic)
print('Lucas4' in dic)

print("- x - x - "*3)
for chave in dic:
    print(chave)

True
False
- x - x - - x - x - - x - x - 
Lucas
teste


In [50]:
# se quiséssemos deixar claro que estamos percorrendo as chaves do dicionário, poderíamos utilizar o método 'keys'

print('Lucas' in dic.keys())
print('Lucas5' in dic.keys())

print("- x - x - "*3)
for chave in dic.keys():
    print(chave)

True
False
- x - x - - x - x - - x - x - 
Lucas
teste


In [51]:
# podemos percorrer os values do dicionário utilizando a mesma estrutura de código aplicada no bloco anterior, apenas alterando a chamada do método 'keys' para 'values'

print('Lucas' in dic.values())
print('testando' in dic.values())

print("- x - x - "*3)
for valor in dic.values():
    print(valor)

False
True
- x - x - - x - x - - x - x - 
2
testando


- Além de percorrer separadamente as chaves e os valores do dicionário utilizando os métodos *keys* e *values*, respectivamente, também podemos percorrer os elementos chave/valor simultaneamente. Para isso, utiliza-se o método *items*

In [52]:
for item in dic.items():
    print(item)

('Lucas', 2)
('teste', 'testando')


- Perceba que faz todo sentido o resultado ser uma tupla: o dicionário representa uma sequência de duplas chave-valor, em que o primeiro elemento é sempre a chave, o segundo é sempre o valor (ou seja, a ordem importa e as posições têm significado) e, ainda, não há necessidade/interesse em alterar o resultado da consulta. Logo, temos um objeto do tipo tupla como saída

In [54]:
# ou ainda, poderíamos fazer o unpack dos itens antes de apresentá-los
for key, value in dic.items():
    print('{} = {}'.format(key, value))

Lucas = 2
teste = testando


- Suponha que quiséssemos construir um dicionário que retornasse, para cada determinada palavra, a quantidade de vezes em que ela aparece num texto string.

- Maneira 1:
    - Definindo o dicionário, verificando se a palavra já foi armazenada e atualizando o contador/dicionário a cada iteração

In [56]:
texto = 'Seja bem vindo ao curso. Espero que esteja bem e aproveite bem os estudos ao som do cantor Xpto'

aux = {}
for palavra in texto.lower().replace('.','').split():
    contador_palavra = aux.get(palavra, 0)
    aux[palavra] = contador_palavra+1 

for item in aux.items():
    print(item)

('seja', 1)
('bem', 3)
('vindo', 1)
('ao', 2)
('curso', 1)
('espero', 1)
('que', 1)
('esteja', 1)
('e', 1)
('aproveite', 1)
('os', 1)
('estudos', 1)
('som', 1)
('do', 1)
('cantor', 1)
('xpto', 1)


- Maneira 2:
    - Utilizando o objeto *defaultdict*, que consegue efetuar a chamada de uma função sempre que uma chave ainda não definida for chamada, e atribuir o resultado dessa função à chave.
    - Ao passar o parâmetro *int* na definição do objeto (que também pode ser usado como função: *int()* ), estamos deixando claro ao python que, para elementos ainda não inseridos, o valor default deve ser o resultado da função *int()*, que é 0

In [70]:
print(int)
print(int())

<class 'int'>
0


In [65]:
from collections import defaultdict

aux = defaultdict(int)

for palavra in texto.lower().replace('.','').split():
    contador = aux[palavra]
    aux[palavra] = contador+ 1 

for item in aux.items():
    print(item)

('seja', 1)
('bem', 3)
('vindo', 1)
('ao', 2)
('curso', 1)
('espero', 1)
('que', 1)
('esteja', 1)
('e', 1)
('aproveite', 1)
('os', 1)
('estudos', 1)
('som', 1)
('do', 1)
('cantor', 1)
('xpto', 1)


- Maneira 3:
    - Utilizando o método específico para contagem de elementos em um dicionário, o *Counter*

In [71]:
from collections import Counter

aux = Counter()
for palavra in texto.lower().replace('.','').split():
    aux[palavra] +=1

for item in aux.items():
    print(item)

('seja', 1)
('bem', 3)
('vindo', 1)
('ao', 2)
('curso', 1)
('espero', 1)
('que', 1)
('esteja', 1)
('e', 1)
('aproveite', 1)
('os', 1)
('estudos', 1)
('som', 1)
('do', 1)
('cantor', 1)
('xpto', 1)


In [73]:
# ou ainda:

# podemos definir um dicionário de contagens diretamente a partir da lista de palavras, passando-a como parâmetro do método
aux = Counter(texto.lower().replace('.','').split())

for item in aux.items():
    print(item)

('seja', 1)
('bem', 3)
('vindo', 1)
('ao', 2)
('curso', 1)
('espero', 1)
('que', 1)
('esteja', 1)
('e', 1)
('aproveite', 1)
('os', 1)
('estudos', 1)
('som', 1)
('do', 1)
('cantor', 1)
('xpto', 1)
