# Introdução à Programação para Ciência de Dados

### Aula 11: Sets I

**Professor:** Igor Malheiros

## Sets

Um *set*, ou conjunto, é outra estrutura de dados do tipo de coleção nativa de Python. O *set* nos permite armazenar diversos valores em uma única variável, assim como as listas.

Entretanto, existem diferenças **importantes** entre *sets* e listas que precisam de bastante atenção. Além disso, é fundamental entendermos em quais situações é melhor utilizar *sets* em vez de listas.

### Criando *sets*

Para criarmos um *set* utilizamos o operador de `{}` e passamos os elementos que queremos dentro dele seperados por `,`.

Os elementos, **não precisam ser do mesmo tipo**.

```Python
conjunto_num = {1, 2, 3, 4}

conjunto_str = {"Eu", "amo", "Python"}

conjunto_mix = {1, 2, "Python"}

conjunto_mix_list = {1, [2, 3], "Python"} # Erro!
conjunto_conjunto = {{1, 2}, {3, 4}} # Erro!
```
</br>

Outra forma de criar um *set* é utilizando a função `set()` que recebe como argumento uma lista.

</br>

```Python
conjunto_vazio = set()

# conjunto_num = {1, 2, 3, 4}:
conjunto_num = set([1, 2, 3, 4])

# conjunto_mix = {1, 2, "Python"}:
conjunto_mix = set([1, 2, "Python"])
```

### Dados **não ordenados**

Os *sets* armazenam os dados de forma **não sequencial**. Por isso, **não é possível fazer operações de indexação e, consequentemente, de *slicing***.

```Python
conjunto_num = {1, 2, 3, 4}
print(conjunto_num[0]) # Erro!
```
</br>

Podemos iterar em um *set* com o loop `for`. Porém, **não é garantido** que a ordem em que os elementos foi declarado vai ser a mesma ordem de valores em que o iterador vai assumir.

```Python
conjunto_num = {1, 2, 3, 4, 10, -4, 20}
for num in conjunto_num:
    print(num)
    
# Não é garantida a mesma ordem declarada no momento do print (1, 2, 3, 4, 10, -4, 20)
```

In [6]:
# set vazio - set()
conjunto_vazio = set()
print(conjunto_vazio)

set()


In [3]:
# set de int - {1, 2, 3, 4}
conjunto_int = {1, 2, 3, 4}
print(conjunto_int)

{1, 2, 3, 4}


In [4]:
# set de int - set([1, 2, 3, 4])
conjunto_int = set([1, 2, 3, 4])
print(conjunto_int)


{1, 2, 3, 4}


In [7]:
# Erro de acesso
print(conjunto_int[0])

TypeError: 'set' object is not subscriptable

In [10]:
# Iterando em um set
conjunto = {1, 2, 3, 4, 10, -4, 20}

for num in conjunto:
    print(num)
    

1
2
3
4
20
10
-4


### Não contém elementos repetidos

Os *sets* **não admitem elementos duplicados**. Por isso, podem ser úteis para construir coleções de elementos únicos.

```Python
conjunto_num = {1, 2, 1, 2, 3, 4, 5, 4} # -> {1, 2, 3, 4, 5}

conjunto_mix = {1, 2, "Eu", 2, "Eu"} # -> {1, 2, "Eu"}
```

In [11]:
# Removendo repetições - {1, 2, 1, 3, 2, 4}
conjunto_num = {1, 2, 1, 3, 2, 4}
print(conjunto_num)

{1, 2, 3, 4}


In [12]:
# Removendo elementos repetidos de uma lista
l = [1, 2, 1, 3, 1, 2, 3, 4]
s = set(l)
print(s)

{1, 2, 3, 4}


### Coleção mutável

Os *sets* são **mutáveis**, ou seja, é possível adicionar e remover elementos de um *set* assim como nas listas. Entretanto, **não é possível modificar** um elemento de um *set*, o que poderíamos fazer é removê-lo e adicionar um novo elemento.

Além disso, é necessário que cada elemento **seja mutável**. Por isso, não é admitido listas ou outros conjuntos como elementos de um *set*.

```Python
conjunto = {1, 2, 3, 4}

conjunto.add(10) # -> {1, 2, 3, 4, 10}
conjunto.add("Eu") # -> {1, 2, 3, 4, 10, "Eu"}

conjunto.remove(10) # -> {1, 2, 3, 4, "Eu"}
conjunto.remove("Eu") # -> {1, 2, 3, 4}

conjunto_listas = {[1, 2, 3], [4, 5]} # -> Erro!
conjunto_conjuntos = {{1, 2, 3}, {4, 5}} # -> Erro!
```

In [14]:
conjunto = {1, 2, 3, 4}

In [15]:
# adicionando - 10
conjunto.add(10)
for el in conjunto:
    print(el)

1
2
3
4
10


In [16]:
# adicionando - "Eu"
conjunto.add("Eu")
for el in conjunto:
    print(el)

1
2
3
4
10
Eu


In [17]:
# removendo - 10
conjunto.remove(10)
conjunto

{1, 2, 3, 4, 'Eu'}

In [18]:
# removendo - "Eu"
conjunto.remove("Eu")
conjunto

{1, 2, 3, 4}

In [19]:
# Erro conjunto de listas
conjunto_listas = {[1, 2, 3], [4, 5]}

TypeError: unhashable type: 'list'

In [20]:
# Erro conjunto de conjuntos
conjunto_listas = {{1, 2, 3}, {4, 5}}

TypeError: unhashable type: 'set'

## Exercício 1

Construa uma função que recebe uma lista com emails dos usuários que acessaram um determinado sistema durante uma semana. Sua função deve retornar quem foram esses usuários. Em seguida, imprima o total de usuários que acessou o sistema e seus e-mails de forma ordenada.

**Exemplo**

*input:*

```
['carlos@gmail.com', 'jose@hotmail.com', 'ana@ufpb.br', 'jose@hotmail.com', 'silva.maria@gmail.com', 'carlos@gmail.com', 'bruno@gmail.com', 'silva.maria@gmail.com', 'carvalho.rodrigo@ufpb.br', 'laura@gmail.com', 'carlos@gmail.com']
```

*output:*

```
Total de usuários: 7

Usuários:
['ana@ufpb.br', 'bruno@gmail.com', 'carlos@gmail.com', 'carvalho.rodrigo@ufpb.br', 'jose@hotmail.com', 'laura@gmail.com', 'silva.maria@gmail.com']
```

In [27]:
def get_users(lista):
    conjunto = set(lista)
    lista_sem_duplicatas = list(conjunto)
    return lista_sem_duplicatas

lista = [
    'carlos@gmail.com', 
    'jose@hotmail.com',
    'ana@ufpb.br', 
    'jose@hotmail.com', 
    'silva.maria@gmail.com', 
    'carlos@gmail.com', 
    'bruno@gmail.com', 
    'silva.maria@gmail.com', 
    'carvalho.rodrigo@ufpb.br', 
    'laura@gmail.com', 
    'carlos@gmail.com'
]

l = get_users(lista)
l.sort()

print("Total de usuários:", len(l))
print(l)

Total de usuários: 7
['ana@ufpb.br', 'bruno@gmail.com', 'carlos@gmail.com', 'carvalho.rodrigo@ufpb.br', 'jose@hotmail.com', 'laura@gmail.com', 'silva.maria@gmail.com']


In [28]:
set() == {}

False