<a href="https://colab.research.google.com/github/strawndri/python-ds-sets/blob/main/Trabalhando_com_sets_no_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Trabalhando com Sets no Python**

Em Python, ***sets*** representam uma coleção de dados não ordenados que não podem se repetir. São parcialmente mutáveis, permitindo a adição e a remoção de elementos.

[Documentação do Python sobre Sets](https://docs.python.org/3/tutorial/datastructures.html#sets)

## **Criação dos sets**

### **Utilizando as chaves `{ }`:**




Sets podem ser criados utilizando chaves, semelhantes à criação de [dicionários](https://docs.python.org/3/tutorial/datastructures.html#dictionaries), mas sem pares chave-valor. Os elementos são simplesmente listados entre as chaves.

In [1]:
carros = {'Jetta Variant', 'Passat', 'Crossfox', 'Dodge Jorney'}

print(carros)

{'Crossfox', 'Dodge Jorney', 'Jetta Variant', 'Passat'}


Sets não precisam, necessariamente, armazenar valores com o mesmo tipo de dado. No exemplo abaixo, utilizou-se de quatro tipos diferentes: `int`, `str`, `float` e `bool`.

In [2]:
# Sets com elementos diferentes

elementos_diferentes = {2017, "Onix", 37123.04, True}
print(elementos_diferentes)

{'Onix', 2017, 37123.04, True}


Pelo fato de não serem estruturas ordenadas, não é possível acessar elementos a partir de um índice, tal qual é feito em listas.

In [3]:
carros[0]

TypeError: ignored

Assim como outros tipos de coleções, os sets são iteráveis. No código abaixo, usamos um `loop for` para apresentar todos os elementos contidos no set `carros`:

In [4]:
for i in carros:
  print(i)

Crossfox
Dodge Jorney
Jetta Variant
Passat


### **Utilizando listas e a função `set()`**

Sets também podem ser criados a partir de listas utilizando a função `set()`. Isso remove elementos duplicados da lista.

[Documentação do Python sobre a função `set()`](https://docs.python.org/3/library/stdtypes.html#set)

In [5]:
lista_escolas = ['Data Science', 'Programação', 'Front-end',
                 'Mobile', 'DevOps', 'UX & Design', 'Inovação e Gestão']

In [6]:
escolas_set = set(lista_escolas)

print(escolas_set)

{'Programação', 'UX & Design', 'Inovação e Gestão', 'Data Science', 'DevOps', 'Front-end', 'Mobile'}


### **Trabalhando com elementos repetidos:**

Sets não aceitam elementos duplicados; ao tentar adicionar um elemento já existente, o conjunto permanece inalterado.

* No exemplo a seguir, foi criada uma lista chamada `lista_carros`. Ela possui dados repetidos, como *Jetta Variant*, *Passat* e *Crossfox*;
* Em `nova_lista`, armazenamos o set referente à `lista_carros`;
* Enquanto `lista_carros` possui 7 elementos, `nova_lista` contém apenas 4 (os não repetidos).

In [7]:
lista_carros = ['Jetta Variant', 'Passat', 'Crossfox', 'Passat', 'Crossfox',
                'Jetta Variant', 'Dodge Journey']
nova_lista = set(lista_carros)

In [8]:
# Utilizando a função len() para verificar a quantidade de elementos
print(len(lista_carros))

7


In [9]:
print(nova_lista)

{'Dodge Journey', 'Crossfox', 'Jetta Variant', 'Passat'}


In [10]:
len(nova_lista)

4

## **Operações com Sets**


Para esse exercício, vamos precisar criar conjuntos com os **acessórios** de alguns modelos de carros, são eles: **Passat**, **Crossfox** e **Jetta Variant**.

In [11]:
acessorios_passat = {'Rodas de Liga', 'Travas Elétricas', 'Piloto Automático',
                     'Central Multimídia'}
print(acessorios_passat)

{'Piloto Automático', 'Rodas de Liga', 'Travas Elétricas', 'Central Multimídia'}


In [12]:
acessorios_crossfox = {'Piloto Automático', 'Teto Panorâmico', '4 X 4',
                       'Central Multimídia'}
print(acessorios_crossfox)

{'Piloto Automático', 'Teto Panorâmico', 'Central Multimídia', '4 X 4'}


In [13]:
acessorios_jetta = {'Controle de Estabilidade', 'Câmbio Automático', 'Travas Elétricas',
                    'Rodas de Liga'}
print(acessorios_jetta)

{'Câmbio Automático', 'Controle de Estabilidade', 'Rodas de Liga', 'Travas Elétricas'}


### **Disjunção**

A disjunção entre dois sets retorna um novo conjunto contendo elementos que estão presentes em **um** dos conjuntos, mas **não em ambos**.

[Documentação do Python sobre `isdisjoint()`](https://www.w3schools.com/python/ref_set_isdisjoint.asp)

<img src='https://i.imgur.com/o2wsgPo.png' width = 50%>

In [14]:
set.isdisjoint(acessorios_passat, acessorios_crossfox)

False

### **Interseção**

A interseção entre dois sets produz um novo conjunto contendo apenas elementos que estão presentes em ambos os conjuntos. Ela pode ser construída utilizando o operador `&` ou a função `intersection().`

[Documentação do Python sobre a função `intersection()`](https://www.w3schools.com/python/ref_set_intersection.asp)

<img src='https://i.imgur.com/6W7bxU1.png' width = 50%>

In [15]:
acessorios_passat & acessorios_crossfox

{'Central Multimídia', 'Piloto Automático'}

In [20]:
acessorios_passat & acessorios_jetta

{'Rodas de Liga', 'Travas Elétricas'}

In [21]:
set.intersection(acessorios_passat, acessorios_crossfox, acessorios_jetta)

set()

### **União**

A união de dois sets cria um novo conjunto contendo todos os elementos únicos de ambos os conjuntos. Ela pode ser construída a partir do operador `|` ou da função `union()`.

[Documentação do Python sobre a função `union()`](https://www.w3schools.com/python/ref_set_union.asp)



<img src='https://i.imgur.com/C3MrKmK.png' width = 50%>

In [22]:
acessorios_passat | acessorios_crossfox

{'4 X 4',
 'Central Multimídia',
 'Piloto Automático',
 'Rodas de Liga',
 'Teto Panorâmico',
 'Travas Elétricas'}

In [23]:
set.union(acessorios_passat, acessorios_crossfox, acessorios_jetta, {'Teto Solar'})

{'4 X 4',
 'Central Multimídia',
 'Controle de Estabilidade',
 'Câmbio Automático',
 'Piloto Automático',
 'Rodas de Liga',
 'Teto Panorâmico',
 'Teto Solar',
 'Travas Elétricas'}

## **Perfomance**

Sets, em Python, podem oferecer uma execução eficiente para **operações adição e remoção de elementos**, especialmente quando comparados a outras estruturas de dados. Além disso, são excelentes estruturas para realizar **iterações**.

In [24]:
carros

{'Crossfox', 'Dodge Jorney', 'Jetta Variant', 'Passat'}

In [25]:
'Crossfox' in carros

True

### **Perfomance com vários elementos**

In [26]:
elementos_set = set(range(10000))
elementos_list = list(range(10000))
elementos_tuple = tuple(range(10000))

In [27]:
def verificar_elemento_in(elemento_iteravel):

  for i in range(10000):
    if i in elemento_iteravel:
      pass

In [28]:
print("Tempo de execução set: ")
%time verificar_elemento_in(elementos_set)
print("="*30)

print("Tempo de execução lista: ")
%time verificar_elemento_in(elementos_list)
print("="*30)

print("Tempo de execução tuplas: ")
%time verificar_elemento_in(elementos_tuple)
print("="*30)

Tempo de execução set: 
CPU times: user 1.21 ms, sys: 0 ns, total: 1.21 ms
Wall time: 2.24 ms
Tempo de execução lista: 
CPU times: user 535 ms, sys: 0 ns, total: 535 ms
Wall time: 555 ms
Tempo de execução tuplas: 
CPU times: user 461 ms, sys: 0 ns, total: 461 ms
Wall time: 467 ms
