# Sequenciamento - Conjuntos
Neste notebook estudamos algumas estruturas de dados da linguagem Python utilizadas para **sequenciamento**. Segundo a documentação, estruturas de **sequenciamento** compartilham certas propriedades como indexação, fatiamento, concatenação e muito mais. 
> Observação: Para ler mais sobre as estruturas de sequenciamento, recomendo a leitura da documentação sobre estes tipos de dados na documentação do Python 3 ([link](https://docs.python.org/3/library/stdtypes.html#typesseq)).

Nos estudos, buscamos entender como utilizar estas estruturas e suas principais diferenças.

## Conjuntos
Um **conjunto** (**set** em inglês) é uma estrutura do tipo coleção que pode conter diferentes elementos de diferentes tipos de dados (desde que sejam imutáveis), parecido com tuplas e listas. As duas principais diferenças é que os elementos de um conjunto não são ordenados e não podem ter valores repetidos. Além disso, não se pode alterar um elemento existente em conjunto de forma direta. Para isso, é necessário remover o elemento e inserir um novo elemento com o valor atualizado.
> Observação: Segue um [link](https://docs.python.org/3/library/stdtypes.html?highlight=set#set) da documentação referente a conjuntos.

### Definição de conjuntos
Podemos construir um conjunto com o operador de chaves `{}`, inserindo entre as chaves os elementos separados por vírgulas.

In [2]:
conjA = {"A","B","C","D","A"}
print(conjA)
type(conjA)

{'B', 'D', 'A', 'C'}


set

Também podemos utilizar o método construtor `set()` para realizar **casting** forçando uma lista a ser transformada em um conjunto. 

In [3]:
listA = ["E","F"]
conjB = set(listA)
print(conjB)
type(conjB)

{'E', 'F'}


set

### Operações e Métodos

#### Inserção
É possível realizar a inserção em conjunto através do método `add()`. Este método recebe um argumento que é o elemento a ser inserido.


In [4]:
conjB.add("G")
print(conjB)

{'E', 'F', 'G'}


O método `update()` pode ser utilizado para inserir mais de um elemento de uma vez só em um conjunto. Ele pode receber uma quantidade indefinida de elementos separados por vírgulas, ou outros tipos iteráveis como listas e tuplas. 

In [5]:
conjB.update("A","B","C")
print(conjB)

{'E', 'C', 'B', 'A', 'G', 'F'}


Note que é impossível inserir elementos mutáveis em conjuntos (como listas e conjuntos). Veja um exemplo abaixo:

In [6]:
aux = {[1,2]}

TypeError: unhashable type: 'list'

Caso se deseje inserir um conjunto dentro de outro conjunto, você pode criar um **frozenset**. Este tipo de conjunto é um conjunto imútavel, e portanto, pode ser um elemento de um conjunto. Podemos transformar uma lista em um frozenset para poder manter ela dentro de um conjunto.

In [7]:
aux = { frozenset([1,2])}
print(aux)

{frozenset({1, 2})}


#### Remoção
Para realizar a remoção podemos utilizar o método `remove()`. Este método recebe um único argumento que é o elemento a ser removido. Caso o elemento não exista, um erro ocorre. 

In [8]:
conjB.remove("G")
print(conjB)

{'E', 'C', 'B', 'A', 'F'}


Para evitar a ocorrência de erros caso o elemento não exista na lista, é possível utilizar o método `discard()`. 

In [9]:
conjB.discard("Z")
print(conjB)

{'E', 'C', 'B', 'A', 'F'}


O método `pop()` também funciona para conjuntos, mas não recomenmendamos seu uso. Ele geralmente é utilizado para remover o ultimo elemento do iterável, mas como conjuntos não são ordenados, não há como sabermos qual elemento ele irá remover. 

O método `clear()` server para remover todos elementos de um conjunto. Devemos tomar cuidado com atribuições pois elas funcionam como tuplas. Ao atribuir um conjunto a outro conjunto, ao modificar o novo conjunto (que na realidade é uma referência ao original) se modifica o conjunto original. Para evitar isto, ao tentar fazer esta atribuição, usamos o construtor `set()` para indicar a criação de um novo conjunto a partir do antigo. Outra forma de fazer isto é utilizando o me´todo `copy()` que retorna uma cópia de um conjunto.

In [10]:
conjC = conjB.copy()
conjC.clear()
print(conjC, conjB)

set() {'E', 'C', 'B', 'A', 'F'}


#### Verificação de existência
Um operador que pode ser utilizado é o `in`. Antes do operador deve ser informado um elemento, e depois do operador deve ser informado o conjunto. O operador verifica se o elemento pertence ou não ao conjunto retornando um resultado `True` ou `False`.

In [11]:
print("A" in conjB)
print("Z" in conjB)

True
False


O numero de elementos no conjunto pode ser verificado com a função `len()` passando um conjunto como argumento.

In [12]:
print(len(conjB))

5


#### Intersecção
É possível utilizar o operador **AND**, dado pelo simbolo `&`, para gerar um novo conjunto que contém a intersecção entre conjuntos. A intersecção é um conjunto que contém os elementos que são compartilhados pelos dois conjuntos. 

In [13]:
print(conjA & conjB)

{'B', 'A', 'C'}


O método `intersection()` pode ser utilizado para retornar o mesmo resultado. Outro método mais interessante é o `intersection_update()` que ao invés de reotrnar um novo conjunto, atualiza o conjunto original.

In [14]:
conjD = conjA.copy()
conjD.intersection_update(conjB)
print(conjD)

{'B', 'A', 'C'}


#### União
Outra operação que temos é a união entre conjuntos. O operador **OU**, representado pelo simbolo `|`, pode ser utilizado para gerar um novo conjunto que contém todos elementos que o primeiro, ou segundo, ou ambos conjuntos contém. A união também pode ser representada pelo método `union()`.

In [15]:
print(conjA | conjB)
print(conjB.union(conjA))

{'E', 'D', 'C', 'F', 'B', 'A'}
{'E', 'D', 'C', 'B', 'A', 'F'}


O método update pode ser utilizado para atualizar o conjunto com a união com outro conjunto, ao invés de retorna o novo conjunto como vimos na inserção.

#### Diferença
A diferença entre conjuntos é representada pelo oeprador de subtração `-`. O resultado desta operação entre dois conjuntos é um novo conjunto que contém os elementos do primeiro conjunto que não estão no segundo. Isto pode ser feito pelo método `difference()` também.

In [16]:
print(conjB - conjA)
print(conjA.difference(conjB))

{'E', 'F'}
{'D'}


O método `difference_update()` pode ser utilizado para atualizar o conjunto original com a diferença.

A união simétrica é a união entre as duas diferenças de um conjunto. O conjunto gerado contém todos os elementos que não são compartilhados entre os dois conjuntos (tanto do primeiro quanto do segundo).

In [17]:
print(conjA ^ conjB)

{'E', 'D', 'F'}


Outra forma de realizar esta operação é através do método `symmetric_difference()`. Como vimos nos outros exemplos, também há um método `symmetric_difference_update()` para atualizar o conjunto original.
> Curiosidade: Segundo a documentação, a diferença entre os operadores, no caso:`|`; `&`; `-` e `^`, e os métodos é que operadores permitem apenas operações entre conjuntos, enquanto os métodos permitem operações entre qualquer iterável (transformando eles em conjuntos e depois realizando a operação).  

#### Tipos de conjuntos
Um **superconjunto** é um conjunto que contém todos os elementos de outro conjunto, podendo também conter outros itens. É possível verificar sem um conjunto é superconjunto de outro conjunto com o método `issuperset()`. O resultado é retornado de forma booleana.

In [26]:
# Todos elementos presentes no argumento ({'A'}) estão presentes no conjunto ({'B', 'D', 'A', 'C'}?
conjTest = {"A"}
conjA.issuperset(conjTest)

True

Também podemos verificar se um conjunto é **subconjunto** de outro conjunto. Isto significa que todos seus itens pertecem ao conjunto passado como argumento. O conjunto passado como argumento pode conter mais elementos, além dos que estão no conjunto original. Utilizamos o método `issubset()` para isso.

In [27]:
# Todos no presentes no conjunto ({'A'}) estão presentes no argumento({'B', 'D', 'A', 'C'})?
conjTest.issubset(conjA)

True

Por ultimo podemos verificar se dois conjuntos são **disjuntos**. Dois conjuntos são disjuntos quando eles não compartilham nenhum elemento em comum. Para isso utilizamos o método `isdisjoint()`

In [28]:
conjTest.isdisjoint(conjA)

False