# Conjuntos - sets

Conceito de conjuntos é agrupar elementos de maneira única, ele segue mesmas premissas da matemática onde não são aceitados elementos repetidos.

In [1]:
usuarios_data_science = [15, 23, 43, 56]
usuarios_machine_learning = [13, 23, 56, 42]

In [2]:
assistiram = usuarios_data_science.copy()
assistiram.extend(usuarios_machine_learning)
assistiram

[15, 23, 43, 56, 13, 23, 56, 42]

In [3]:
len(assistiram)

8

Conforme visto anteriormente, as listas permitem elementos "repetidos". Os conjuntos por sua vez, não permitem elementos repetidos, conforme as regras da matemática.

Podemos declarar conjuntos da seguinte forma:

In [4]:
set(assistiram)

{13, 15, 23, 42, 43, 56}

Podemos passar um **iterável**, como argumento para a função `set()`, que retorna o conjunto dos elementos do iterável, como nosso caso a **lista** `assistiram` é um iterável, temos um cojunto. 

A representação se dá por elementos separados por vírgula `,` entre chaves `{}`. Esse conjunto pode ser facilmente atribuido a uma variável para uso posterior.

Outro detalhe interessante, no nosso exemplo, é que agora temos 6 elementos, pois os conjuntos eliminam a **segunda ocorrência** de determinado elemento, impossibilitando assim repetições. 

In [5]:
conjunto_assistiram = set(assistiram)
conjunto_assistiram

{13, 15, 23, 42, 43, 56}

# União `.union()`

União de dois conjuntos pode ser feito:

In [2]:
usuarios_data_science = {15, 23, 43, 56}
usuarios_machine_learning = {13, 23, 56, 42}

In [3]:
usuarios_data_science | usuarios_machine_learning

{13, 15, 23, 42, 43, 56}

In [6]:
usuarios_data_science = {15, 23, 43, 56}
usuarios_machine_learning = {13, 23, 56, 42}

assistiram = usuarios_data_science.union(usuarios_machine_learning)
assistiram

{13, 15, 23, 42, 43, 56}

# Intersecção `.intersection()`

A intersecção de dois ou mais conjuntos pode ser realizada:

In [7]:
usuarios_data_science = {15, 23, 43, 56}
usuarios_machine_learning = {13, 23, 56, 42}

In [8]:
usuarios_data_science & usuarios_machine_learning

{23, 56}

In [9]:
usuarios_data_science = {15, 23, 43, 56}
usuarios_machine_learning = {13, 23, 56, 42}

assistira_dois = usuarios_data_science.intersection(usuarios_machine_learning)
assistira_dois

{23, 56}

# Diferença `.diference()`

A diferença entre dois ou mais conjuntos pode ser realizada:

In [10]:
usuarios_data_science = {15, 23, 43, 56}
usuarios_machine_learning = {13, 23, 56, 42}

In [11]:
usuarios_data_science - usuarios_machine_learning

{15, 43}

In [12]:
diferenca = usuarios_data_science.difference(usuarios_machine_learning)
diferenca

{15, 43}

# Ou Excusivo

Quando unimos os elementos de dois ou mais conjuntos que não se repetem entre os conjuntos

In [13]:
usuarios_data_science = {15, 23, 43, 56}
usuarios_machine_learning = {13, 23, 56, 42}

In [14]:
usuarios_data_science ^ usuarios_machine_learning

{13, 15, 42, 43}

In [15]:
usuarios = {1, 5, 76, 34, 52, 13, 17}
len(usuarios)

7

Método para adicionar elementos a um conjunto é o `.add()`, por ser uma estrutura de dados mutável ela aceita adicionar, remover e até alterar elementos.

In [16]:
usuarios.add(13)
len(usuarios)

7

In [17]:
usuarios.add(765)
len(usuarios)

8

É possível ter uma estrutura de dados com as caracteristicas dos conjuntos porém imutáveis, para isso utiliza-se o `frozenset()`

In [18]:
usuarios = frozenset(usuarios)

In [19]:
usuarios.add(134)

AttributeError: 'frozenset' object has no attribute 'add'

In [27]:
meu_texto = "agro é vida, agro é ciência, agro é cultura, agro é pop"

In [28]:
meu_texto.split()

['agro',
 'é',
 'vida,',
 'agro',
 'é',
 'ciência,',
 'agro',
 'é',
 'cultura,',
 'agro',
 'é',
 'pop']

In [29]:
set(meu_texto.split())

{'agro', 'ciência,', 'cultura,', 'pop', 'vida,', 'é'}

Podemos trabalhar com textos, o método split cria uma lista com de elementos strings que anteriormente estavam separados por um espaço, criando uma lista com cada palavra. Ao transformarmos a lista em um conjunto, as palavras repetidas são eliminadas, ficando apenas a primeira ocorrência de cada uma delas.