# Conjuntos

Uma pesquisa foi realizada com os alunos de uma turma de Tecnologia da Informação, perguntando quais idiomas cada aluno falava, dentre inglês, espanhol, francês e alemão.

Com os resultados coletados, deseja-se saber quantos alunos falam somente um idioma. Considerando que a turma tinha apenas 30 alunos, talvez fosse fácil alcançar tal objetivo.

Agora, suponha que essa mesma pesquisa fosse aplicada para todos os alunos da UFRN? E se considerássemos todos os campi da UFRN?

É aí que entram os conjuntos!

Os conjuntos são tipos abstratos de dados (equivalente aos conjuntos matemáticos) que manipulam coleções de elementos únicos, não ordenados e imutáveis.

## Primeiros passos

Em Python, um conjunto pode ser criado já com seus elementos declarados, dentro de chaves {} e separando-os por vírgulas.

Também é possível criar um conjunto vazio, com a função construtora ```set()```:

In [1]:
meu_conjunto = {1, 2, 3, 4, 5}
conjunto_vazio = set()

print(meu_conjunto)
print(conjunto_vazio)

{1, 2, 3, 4, 5}
set()


Um conjunto pode ter elementos de diferentes tipos:

In [2]:
meu_conjunto = {1, 3.3, 'a', 'palavra'}
print(meu_conjunto)

{'a', 1, 3.3, 'palavra'}


Além disso, um conjunto pode ser criado com a função construtora ```set()``` tendo como parâmetro um tipo iterável de dados (string, lista, dicionário, tuplas, etc...). 

Nesse caso, o conjunto formado possui os elementos únicos do tipo iterávels fornecido como parâmetro:

In [3]:
meu_conjunto = set('Hello,world')
print(meu_conjunto)

{',', 'o', 'e', 'l', 'r', 'H', 'w', 'd'}


### Iterando sobre seus elementos

Você pode iterar sobre os elementos de um conjunto usando um `for`:

In [4]:
for x in meu_conjunto:
 print(x)

,
o
e
l
r
H
w
d


Como não há preservação de ordem dos elementos de um `set`, você não pode acessar seus elementos por índices ou confiar em qual ordem eles estarão:

In [5]:
meu_conjunto[0]

TypeError: 'set' object is not subscriptable

#### Exercícios w3r - [w3resource list](https://www.w3resource.com/python-exercises/python-functions-exercises.php)

1 -  Escreva um procedimento que determine o maior número dentro de um conjunto de 7 números.

In [8]:
conjunto = {1, 8, 5, 3, 4, 6, 7}

print(max(conjunto))

8


2 - Escreva um procedimento que some todos os elementos de um conjunto.

In [9]:
print(sum(conjunto))

34


3 - Escreva um procedimento que multiplique todos os elementos de um conjunto.

In [10]:
import math 

print(math.prod(conjunto))

20160


> Como os exercícios acima são bem comuns no dia-a-dia, Python tem procedimentos-padrão para resolvê-los. Pesquise sobre eles e veja como fica bem mais simples de resolver essas questões 👍🏻

## Como usar o `set`

### Adição e remoção de elementos 

Depois de ser criado, um conjunto pode ser modificado, tendo elementos adicionados ou removidos dele.

Para adicionar um elemento, utiliza-se o método ```add()```. 

> Confira na sessão de **Extras** os comandos `update` para adição de múltiplos elementos.

In [11]:
meu_conjunto = {1, 2, 3}
meu_conjunto.add(4)
print(meu_conjunto)

{1, 2, 3, 4}


Já para remover, tem-se o método ```remove()```, que elimina do conjunto o elemento passado como parâmetro:

In [12]:
meu_conjunto = {1, 2, 3}
meu_conjunto.remove(3)
print(meu_conjunto) 

{1, 2}


E, se por algum motivo, o usuário tentar remover um elemento que não existe no conjunto?

In [13]:
meu_conjunto = {1, 2, 3}
meu_conjunto.remove(4)
print(meu_conjunto) 

KeyError: 4

Você recebeu o erro `KeyError`, justamente porque o `remove()` só remove elementos que fazem parte do conjunto. 

Para essa situação, existe o método `discard()`, que tenta remover um elemento sem disparar erros caso ele não exista.

In [14]:
meu_conjunto = {1, 2, 3}
meu_conjunto.discard(2)
print(meu_conjunto) 
meu_conjunto.discard(4)
print(meu_conjunto) 

{1, 3}
{1, 3}


Também existe o método `clear()`, que remove todos os elementos do conjunto:

In [15]:
meu_conjunto = {1, 2, 3}
print(meu_conjunto)
meu_conjunto.clear()
print(meu_conjunto) 

{1, 2, 3}
set()


### Cardinalidade 

O número de elementos de um conjunto pode ser calculado com o procedimento `len()`:

In [16]:
meu_conjunto = {1, 2, 3}
print (len(meu_conjunto))

3


### União

Assim como na matemática, a união de `sets` concatena os elementos dos conjuntos em questão em um só.

Em Python, a operação é realizada através do método `union()` ou do operador `|`.

> A união de conjuntos significa literalmente identificar os elementos presentes em um conjunto **ou** no outro. É por isso que podemos usar o operador lógico `|` 🙃 

No exemplo abaixo, temos dois conjuntos distintos `a` e `b` que desejamos unir:

In [17]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}

# operando com union()
print(a.union(b))

# operando com |
print(a | b)

{1, 2, 3, 4, 5, 6}
{1, 2, 3, 4, 5, 6}


### Intersecção

Fazendo a interseção entre dois `sets`, obtemos o conjunto de elementos em comum entre eles.

Podemos realizar essa operação através do método `intersection()` ou do operador `&`.

> A intersecção de conjuntos significa literalmente identificar os elementos presentes em um conjunto **e** no outro. É por isso que podemos usar o operador lógico `&` 🙃 

In [18]:
# operando com intersection()
print(a.intersection(b))

#operando com &
print(a & b)

{3, 4}
{3, 4}


### Diferença

Com a diferença entre `a` e `b`, obtemos o conjunto de elementos que pertencem ao conjunto `a`, mas não pertencem ao conjunto `b`.

Realizamos esta operação usando o método `difference()` ou o operador `-`. 

**Note que `a - b` não é necessariamente igual a `b - a`.**

> A diferença de conjuntos significa literalmente identificar os elementos presentes em um conjunto, **menos** os que estejam no outro. É por isso que podemos usar o operador aritmético `-` 🙃 

In [19]:
# operando com difference()
print(a.difference(b))
print(b.difference(a))

# operando com -
print(a - b)
print(b - a)

{1, 2}
{5, 6}
{1, 2}
{5, 6}


### Diferença simétrica

A diferença simétrica representa a união dos elementos de dois conjuntos, com exceção daqueles que estejam na intersecção entre estes dois conjuntos.

É possível realizar esta operação através do método `symmetric_difference()` ou do operador `^`.

> A diferença simétrica de conjuntos significa literalmente identificar os elementos presentes **ou** em um conjunto **ou** no outro. É por isso que podemos usar o operador lógico `^`, que representa o **ou exclusivo** 🙃 

In [20]:
# operando com symmetric_difference()
print(a.symmetric_difference(b))

# operando com ^
print(a ^ b)

{1, 2, 5, 6}
{1, 2, 5, 6}


### Pertinência

Utilizando o operador de pertinência `in`, podemos verificar se um elemento está ou não em um conjunto:

In [21]:
1 in a

True

In [22]:
5 in a

False

Também podemos combinar o operador `in` com o operador lógico `not`:

In [23]:
8 not in a

True

### Continência e disjunção

Enquanto o operador `in` verifica se um elemento pertence a um conjunto, o `set` oferece três métodos para testar relações entre conjuntos: 

1. `issubset()` ou `<=`:  testa se um conjunto está contido em outro, ou seja, se um conjunto é um subconjunto do outro.

In [24]:
c = {1, 2}

# operando com issubset()
if c.issubset(a): 
  print("C é subconjunto de A, pois C está contido em A.")
else:
  print("C não é subconjunto de A, pois C não está contido em A.")

# operando com <=
if not c <= a: 
  print("C não é subconjunto de A, pois C não está contido em A.")
else:
  print("C é subconjunto de A, pois C está contido em A.")

C é subconjunto de A, pois C está contido em A.
C é subconjunto de A, pois C está contido em A.


2. `issuperset()` ou `>=`:  testa se um conjunto contém o outro, ou seja, se um conjunto é um superconjunto do outro.

In [25]:
# operando com issuperset()
if a.issuperset(c):
  print("A é superconjunto de C, pois A contém C.")
else:
  print("A não é superconjunto de C, pois A não contém C.")
  
# operando com >=
if not a >= c:
  print("A não é superconjunto de C, pois A não contém C.")
else:
  print("A é superconjunto de C, pois A contém C.")

A é superconjunto de C, pois A contém C.
A é superconjunto de C, pois A contém C.


> As relações `<=` e `>=` são simétricas, então `a >= b` equivale a `b <= a`.

3. `isdisjoint()`: testa se dois conjuntos são disjuntos, ou seja, se a interseção entre eles é vazia.

In [26]:
if c.isdisjoint(a):
  print("C e A são disjuntos, pois sua interseção é vazia.")
else:
  print("C e A não são disjuntos, pois sua interseção não é vazia.")
if c.isdisjoint(b):
  print("C e B são disjuntos, pois sua interseção é vazia.")
else:
  print("C e B não são disjuntos, pois sua interseção não é vazia.")

C e A não são disjuntos, pois sua interseção não é vazia.
C e B são disjuntos, pois sua interseção é vazia.


# Exercícios

1 - Agora que já temos um bom conhecimentos sobre os conjuntos, voltemos ao exemplo da introdução. 

Os dados sobre conhecimento em diversos idiomas pelos estudantes da UFRN são guardados em um banco de dados. 

Após consulta a essa base de dados, a matrícula dos alunos foram salvas nos conjuntos relativos aos idiomas que cada um fala:

In [28]:
ingles = {2017992691, 2014731077, 2016127320, 2017673650, 2017675600, 2016071490, 2015763941,2018124856, 2014240183, 2015069118, 2017397627, 2018257434, 2018146279,2018336479, 2016255160, 2016191681, 2017462010, 2015267990, 2018353177,2016316106, 2017534024, 2017435227, 2018485174, 2017511916, 2018252953, 2018230360, 2015896310, 2016403233, 2018036952, 2018223748, 2017106407, 2018928865, 2015808443, 2015490023, 2014680801, 2016797947, 2017169550, 2017741705, 2016449433, 2018701674, 2018681674, 2018822119, 2015629894, 2018552429, 2014160569, 2014812342, 2015241433, 2015633224, 2015938370, 2014994808, 2018682286, 2014920254, 2017952048, 2014899143, 2018459199, 2015659561, 2018886010, 2016111302, 2018528579, 2017559038, 2018248638, 2015560871, 2014569332, 2018652276, 2016701261, 2016308042, 2016310173, 2017705448, 2014399415, 2016268450, 2017608181, 2015981561, 2014964705, 2014655030, 2017687958, 2016162852, 2017223176, 2014759427, 2017290535, 2017031946, 2017042504, 2018916372, 2017757689, 2014922487, 2016080164, 2014792539, 2016110301, 2015200433, 2015667306, 2014891106, 2014748251, 2018911399, 2015008915, 2014976823, 2018870448}
espanhol = {2017992691, 2014731077, 2016127320, 2017673650, 2017675600, 2016071490, 2015763941, 2015365994, 2014728861, 2014152867, 2018044073, 2015856913, 2018124856, 2014240183, 2017534024, 2017435227, 2018485174, 2017511916, 2018252953, 2018230360, 2015896310, 2016403233, 2018036952, 2018223748, 2017106407, 2018928865, 2015808443, 2015490023, 2014680801, 2016797947, 2017169550, 2017741705, 2016449433, 2018701674, 2018681674, 2018822119, 2015629894, 2018552429, 2014160569, 2014812342, 2015241433, 2015633224, 2015938370, 2014994808, 2018682286, 2014920254, 2017952048, 2014899143, 2018459199, 2015659561, 2018886010, 2016111302, 2018528579, 2017559038, 2018248638, 2015560871, 2014569332, 2018652276, 2016701261, 2016308042, 2016310173, 2017705448, 2014399415, 2016268450}
frances = {2016268450, 2017608181, 2015981561, 2014964705, 2014655030, 2017687958, 2016162852, 2017223176, 2014759427, 2017290535, 2017031946, 2017042504, 2018916372, 2017757689, 2014922487, 2016080164, 2014792539, 2016110301, 2015200433, 2015667306, 2014891106, 2014748251, 2018911399, 2015008915, 2014976823, 2018870448, 2018230360, 2015896310, 2016403233, 2018036952, 2018223748, 2017106407, 2018928865, 2015808443, 2015490023, 2014680801, 2016797947, 2017169550, 2017741705, 2016449433, 2018701674, 2018681674, 2018822119, 2015629894, 2018552429,}
alemao = {2015763941, 2015365994, 2014728861, 2014152867, 2018044073, 2015856913, 2018124856, 2014240183, 2015069118, 2017397627, 2018257434, 2018146279,2018336479, 2016255160, 2016191681, 2017462010, 2015267990, 2018353177,2016316106, 2017534024, 2017435227, 2018485174, 2017511916, 2018252953, 2018230360, 2015896310, 2016403233, 2018036952, 2018223748, 2017106407, 2018928865, 2015808443, 2015490023, 2014680801, 2016797947, 2017169550, 2017741705, 2016449433, 2018701674, 2018681674, 2018822119, 2015629894, 2018552429, 2014160569, 2014812342, 2015241433, 2015633224, 2015938370, 2014994808, 2018682286, 2014920254}

1.1 - Calcule quantos alunos falam apenas inglês e espanhol:

In [29]:
print(ingles | espanhol)

{2014759427, 2017223176, 2018916372, 2018353177, 2018257434, 2016162852, 2015659561, 2014655030, 2018124856, 2014920254, 2018459199, 2015629894, 2017534024, 2017042504, 2018230360, 2017435227, 2014748251, 2014891106, 2015667306, 2018552429, 2018652276, 2018223748, 2017169550, 2015008915, 2015267990, 2018252953, 2014728861, 2016268450, 2014152867, 2015560871, 2018911399, 2018044073, 2018870448, 2015200433, 2014812342, 2016255160, 2014160569, 2016191681, 2016111302, 2016316106, 2018036952, 2015241433, 2016110301, 2018336479, 2018928865, 2014680801, 2015896310, 2014922487, 2017462010, 2016797947, 2017031946, 2015856913, 2016403233, 2016080164, 2017290535, 2017952048, 2014976823, 2016071490, 2015938370, 2018528579, 2014731077, 2015633224, 2018681674, 2016308042, 2016701261, 2017675600, 2016127320, 2014792539, 2015981561, 2018701674, 2015365994, 2014569332, 2014994808, 2018886010, 2017397627, 2017741705, 2017687958, 2016449433, 2016310173, 2018682286, 2017673650, 2018485174, 2014240183, 201

1.2 - Calcule quantos alunos falam apenas um idioma:

In [32]:
print(ingles ^ espanhol ^ alemao ^ frances)

{2018252953, 2016268450, 2018682286, 2018485174, 2014240183, 2018124856, 2014160569, 2014812342, 2014920254, 2015938370, 2017534024, 2015633224, 2015241433, 2017435227, 2015763941, 2017511916, 2014994808}


1.3 - Calcule quantos alunos falam dois idiomas:

In [33]:
print((ingles & espanhol) ^ (ingles & alemao) ^ (ingles & frances) ^ (espanhol & alemao) ^ (espanhol & frances) ^ (alemao & frances))

{2014759427, 2017223176, 2017031946, 2015856913, 2018916372, 2018353177, 2018257434, 2016162852, 2016080164, 2017290535, 2015659561, 2017952048, 2014655030, 2014976823, 2018124856, 2014920254, 2018459199, 2015938370, 2016071490, 2018528579, 2014731077, 2017534024, 2017042504, 2015633224, 2016308042, 2016701261, 2017675600, 2016127320, 2017435227, 2014748251, 2014792539, 2015981561, 2014891106, 2015667306, 2015365994, 2018652276, 2014569332, 2014994808, 2018886010, 2017397627, 2015008915, 2015267990, 2017687958, 2018252953, 2014728861, 2016310173, 2016268450, 2014152867, 2018911399, 2015560871, 2018044073, 2018682286, 2018870448, 2015200433, 2017673650, 2014812342, 2018485174, 2016255160, 2014160569, 2014240183, 2014399415, 2015069118, 2018248638, 2016191681, 2016111302, 2014899143, 2016316106, 2015241433, 2016110301, 2018336479, 2014964705, 2015763941, 2018146279, 2017705448, 2017511916, 2017992691, 2017608181, 2014922487, 2017757689, 2017462010, 2017559038}


Já imaginou realizar esses cálculos sem o ```set()```? Com certeza, teríamos mais trabalho.

Nesse exercício, vimos uma das utilidades dos conjuntos, que é realizar operações. Outra ocasião em que pode ser bastante útil é na remoção de elementos repetidos de uma sequência. Para entender melhor, faça o exercício 2:

2 - **[OBI - 2012]** Certa vez, numa aula, a professora passou um filme para os alunos assistirem. Durante este filme, ela passou uma lista de presença em sua sala para verificar a presença dos alunos, onde cada aluno deveria inserir apenas seu número de registro. Alguns alunos contudo, como possuem amigos que fogem da aula, decidiram ser camaradas e inseriram os números de registro de seus amigos fujões. O problema é que muitos alunos são amigos de alunos que fogem da aula e alguns números de registro acabaram sendo repetidamente inseridos na lista de presença. Além de tudo, alguns dos alunos que se esperava que não estivessem na aula de fato estavam!

A professora, ao notar que a lista de presença continha alguns números repetidos, ficou sem entender, mas decidiu dar um voto de confiança e dar presença a todos os alunos cujos números de registro estavam na lista. Como são muitos alunos na sala e muitos números com repetição, ela pediu a sua ajuda para determinar o total de alunos que receberam presença na aula.

**Entrada**

A primeira linha da entrada contém um número inteiro N , que informa a quantidade de números de registro que apareceram na lista de presença. Cada uma das N linhas seguintes contém um número de registro Vi que foi inserido na lista de presença.

**Saída**
Seu programa deve imprimir uma única linha, contendo apenas um número inteiro, o número de alunos que receberam presença.

| Entrada            	| Saída 	|
|--------------------	|-------	|
| 3<br> 2<br>3<br>1|   3   	|

In [38]:
n = int(input())

alunos = set()
for i in range (n):
    alunos.add(int(input()))

print(len(alunos))

3


3 - **[Continuação]** No dia seguinte, a professora deu um grande sermão para os seus alunos, que se comprometeram a não fugir mais das aulas.
Passada uma semana, a professora passou mais um filme para os seus alunos assistirem e a mesma situação se repetiu. Chateada, ela decidiu que, dessa vez, daria falta nos alunos que tinham registro repetido na lista de presença. Mais uma vez, ela pediu a sua ajuda para determinar o total de alunos que receberam presença na aula.

**Entrada**

A primeira linha da entrada contém um número inteiro N , que informa a quantidade de números de registro que apareceram na lista de presença. Cada uma das N linhas seguintes contém um número de registro Vi que foi inserido na lista de presença.

**Saída**

Seu programa deve imprimir uma única linha, contendo apenas um número inteiro, o número de alunos que receberam presença.


| Entrada            	| Saída 	|
|--------------------	| -------	|
| 15<br>1<br>0<br>5<br>6<br>0<br>12<br>25<br>6<br>2<br>6<br>5<br>0<br>25<br>13<br>2 |    4   	|

In [49]:
n = int(input())

alunos = set()
excluidos = set()
for i in range (n):
    aluno = int(input())
    if aluno in alunos:
        alunos.remove(aluno)
        excluidos.add(aluno)
    elif aluno in excluidos:
        continue
    else:
        alunos.add(aluno)
        
print(len(alunos))

3


3 - João e Maria possuem um dado de 12 faces e gostam de jogar com ele da seguinte forma:
- João lança o dado e o número da face virada para cima é eliminado;
- depois, Maria repete o processo. Caso tire um número que já foi eliminado, nada acontece;
- assim continuam até que não restem mais números para serem eliminados;
- ganha quem conseguir eliminar o último número. <br>
Faça um programa que simule esse jogo

In [55]:
from random import randint

dado = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12}

counter = 0

while len(dado) > 0:
    number = randint(1,12)
    counter += 1
    if number in dado:
        dado.discard(number)
        if(counter % 2 == 0):
            print("Maria descartou o número", number)
        else:
            print("João descartou o número", number)
    else:
        print("Número", number, "já foi descartado")
    print("Números restantes: ", dado)

if(counter % 2 == 0):
    print("Maria venceu!")
else:
    print("João venceu!")

João descartou o número 8
Números restantes:  {1, 2, 3, 4, 5, 6, 7, 9, 10, 11, 12}
Maria descartou o número 7
Números restantes:  {1, 2, 3, 4, 5, 6, 9, 10, 11, 12}
João descartou o número 12
Números restantes:  {1, 2, 3, 4, 5, 6, 9, 10, 11}
Maria descartou o número 10
Números restantes:  {1, 2, 3, 4, 5, 6, 9, 11}
Número 12 já foi descartado
Números restantes:  {1, 2, 3, 4, 5, 6, 9, 11}
Número 8 já foi descartado
Números restantes:  {1, 2, 3, 4, 5, 6, 9, 11}
João descartou o número 11
Números restantes:  {1, 2, 3, 4, 5, 6, 9}
Número 10 já foi descartado
Números restantes:  {1, 2, 3, 4, 5, 6, 9}
João descartou o número 3
Números restantes:  {1, 2, 4, 5, 6, 9}
Maria descartou o número 9
Números restantes:  {1, 2, 4, 5, 6}
Número 10 já foi descartado
Números restantes:  {1, 2, 4, 5, 6}
Maria descartou o número 4
Números restantes:  {1, 2, 5, 6}
João descartou o número 2
Números restantes:  {1, 5, 6}
Número 2 já foi descartado
Números restantes:  {1, 5, 6}
Número 10 já foi descartado
Número

# Extras

**Update**: Modifica o conjunto A para possuir os elementos de A $\cup$ B

In [56]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a)
print(b)
print(a.union(b))
a.update(b)
print(a)
print(b)

{1, 2, 3, 4}
{3, 4, 5, 6}
{1, 2, 3, 4, 5, 6}
{1, 2, 3, 4, 5, 6}
{3, 4, 5, 6}


A função ```update()``` pode ser utilizada com outras funções, sendo escrita como sufixo. 

Nesse caso, ela sobrescreve o conjunto A para ser equivalente a operação desejada. 

Por exemplo:

In [57]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a)
print(b)
print(a.intersection(b))
a.intersection_update(b)
print(a)
print(b)

{1, 2, 3, 4}
{3, 4, 5, 6}
{3, 4}
{3, 4}
{3, 4, 5, 6}


In [58]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a)
print(b)
print(a.difference(b))
a.difference_update(b)
print(a)
print(b)

{1, 2, 3, 4}
{3, 4, 5, 6}
{1, 2}
{1, 2}
{3, 4, 5, 6}


In [59]:
a = {1, 2, 3, 4}
b = {3, 4, 5, 6}
print(a)
print(b)
print(a.symmetric_difference(b))
a.symmetric_difference_update(b)
print(a)
print(b)

{1, 2, 3, 4}
{3, 4, 5, 6}
{1, 2, 5, 6}
{1, 2, 5, 6}
{3, 4, 5, 6}


**Frozenset**: funciona, em linhas gerais, como um conjunto, mas com a diferença de que não pode ser alterado. <br>
Leia mais em: [frozenset](https://www.programiz.com/python-programming/methods/built-in/frozenset)