In [52]:
import matplotlib.pyplot as plt
plt.style.use('../styles/gcpeixoto-book.mplstyle')

(cap:conjuntos)=
# Conjuntos

<div class="chapter-thumb">
    <div class="chapter-oa">
        <h2>Objetivos de aprendizagem</h2>
        <ul>
        <li>Descrever, em linguagem natural e em Python, os conceitos fundamentais da teoria ingênua de conjuntos;</li>
	    <li>Implementar operações entre conjuntos em Python utilizando o tipo fundamental "set";</li>
	    <li>Identificar e interpretar relações entre conjuntos de dados em contextos aplicados;</li>
	    <li>Projetar soluções computacionais básicas que utilizem estruturas de conjuntos para representar e cruzar informações</li>
        </ul>
    </div>        
    <div class="quote-box">
        <p><em> 
        </p></em>
    </div>        
</div>


## Teoria "ingênua" de conjuntos

A teoria ingênua de conjuntos é o ponto de partida da Matemática moderna. Ela se baseia na ideia intuitiva de que um _conjunto_ é simplesmente uma coleção de objetos bem definidos, chamados _elementos_. O adjetivo *ingênua* é usado porque essa abordagem trata os conjuntos de forma direta, sem recorrer a formalismos lógicos rigorosos — assume-se que qualquer coleção de objetos pode formar um conjunto. 

Essa visão é suficiente para aplicações práticas em ciência da computação, onde conjuntos são usados para representar grupos de dados, categorias, coleções de registros ou relações entre objetos. Ela se contrapõe à teoria axiomática, que fornece estruturas necessária para se provar propriedades fundamentais de forma rigorosa e evitar contradições. Neste capítulo, veremos como expressar a teoria ingênua a partir de exemplos usando a linguagem Python.

```{admonition} Curiosidade: teoria ingênua x teoria axiomática
:class: dropdown

A teoria "ingênua" dos conjuntos trata os conjuntos de forma intuitiva — qualquer coleção de objetos bem definidos pode ser considerada um conjunto. Essa visão é simples e suficiente para a maior parte da matemática discreta e da computação, onde trabalhamos com conjuntos finitos e bem delimitados.

Já a teoria axiomática dos conjuntos, como a de Zermelo-Fraenkel (ZF), ou ZF com Axioma da Escolha (ZFC), surgiu para resolver paradoxos lógicos descobertos na formulação ingênua, como o [Paradoxo de Russell](https://medium.com/@eltonwade/o-que-é-o-paradoxo-de-russell-1c525ba44bc3).

Assim, enquanto a teoria ingênua é conceitualmente acessível e prática para aplicações computacionais, a teoria axiomática fornece a base lógica rigorosa sobre a qual toda a matemática moderna é construída.
```

### Princípios de intuição

A intuição natural sobre o que é um conjunto apoia-se em ideias pouco rigorosas. São três os princípios básicos da teoria ingênua:

- _Princípio da compreensão irrestrita_: 

> "Para toda propriedade $P(x)$, existe um conjunto formado por todos os elementos que a satisfazem."

- _Princípio da extensionalidade_: 

> "Dois conjuntos são iguais se e somente se têm os mesmos elementos."

Este princípio, também usado pela teoria axiomática, diz que um conjunto é definido pela "extensão" de seus elementos.

- _Princípio da liberdade de construção_:

> "Qualquer coleção de objetos bem definidos pode ser reunida em um conjunto."

Este princípio, na verdade, apenas reforça a "ingenuidade" de se definir conjuntos de forma livre.


## Elementos

Em Python, os elementos (ou membros) de um conjunto (finito) serão caracterizados por um objeto que possui um tipo. Aqui, usaremos os seguintes: `int`, `float`, `bool`, `str`, `list`, `tuple` e `set`. 

```{admonition}Convenção de escrita

Na teoria dos conjuntos, segue-se uma convenção de escrita para distinguir _elementos_ de _conjuntos_:

- letras **minúsculas** ($a, b, c, x, y, z, \dots$) representam _elementos individuais_ de um conjunto.
- letras **maiúsculas** ($A, B, C, X, Y, Z, \dots$) representam _conjuntos_.

Essa convenção ajuda a visualizar relações de pertinência de forma clara. Logo, $a \in X$ é preferível a $a \in x$.

Em Python, devemos buscar o mais próximo disso. Por exemplo, `A = {1, 2, 3}` para definir um conjunto e `a = 2` para especificar um elemento do conjunto.

```

Vejamos alguns exemplos:

In [53]:
type(2)

int

In [54]:
type(3.5)

float

In [55]:
type(True)

bool

In [56]:
type(False)

bool

In [57]:
type('palavra')

str

In [58]:
type([1,'a',3.5,True])

list

In [59]:
type((1,2))

tuple

In [60]:
type({1,2,3})

set

## Definição de conjuntos 

De maneira simples, podemos definir uma _coleção_ ou _conjunto_ de elementos por atribuição e listas.

$V = \{ v : v \text{ é uma vogal} \}$

In [61]:
vogais = ['a','e','i','o','u'] # conjunto das vogais
vogais

['a', 'e', 'i', 'o', 'u']

$P = \{ x : x \text{ é ímpar e } 1 \leq x \leq 7 \}$

In [62]:
P = [1,3,5,7] 
P

[1, 3, 5, 7]

Entretanto, para usarmos operações de conjuntos, a estrutura mais adequada para definir conjuntos é `set`.

```{admonition}Coleções vs. conjuntos em Python

Em matemática, uma coleção de elementos pode ser representada de várias formas. Na prática, usamos enumeração (listagem dos elementos) ou especificação (propriedade). Em Python, a ideia de "coleção" se traduz em estruturas que armazenam vários valores, como listas (`list`), tuplas (`tuple`) e conjuntos (`set`). A diferença é que: 

- uma lista (`list`) mantém a ordem dos elementos e permite repetições, funcionando como uma sequência ordenada, o que é algo mais próximo de uma enumeração (p.ex. `[1,2,2,3]`). 
- um conjunto (`set`) elimina duplicatas e não mantém ordem, refletindo a definição matemática de conjunto: uma coleção sem repetição e sem ordem (p.ex. `{1,2,3}`).

Assim, embora possamos usar listas para descrever coleções, a **estrutura `set` é a que realmente implementa o conceito matemático de conjunto em Python**.
```

In [63]:
V = set(vogais)
V

{'a', 'e', 'i', 'o', 'u'}

In [64]:
P = set(P)
P

{1, 3, 5, 7}

### Definição por extensão 

Podemos definir um `set` em Python usando um par de chaves: `{ }`

#### Conjunto vazio

In [65]:
A = {}
A


{}

#### Conjunto unitário

In [66]:
B = {1}
B

{1}

#### Conjunto arbitrário 

In [67]:
C = {'a','b',1,2}
C

{1, 2, 'a', 'b'}

## Pertinência 

```{admonition} Curiosidade: Por que $x \in$?
:class: dropdown
O símbolo $\in$ foi introduzido pelo matemático Giuseppe Peano em 1889. A fim de buscar uma notação lógica e universal para expressar relações entre objetos e coleções, ele escolheu a letra grega _épsilon_ ($\epsilon$), inicial da palavra latina "est", que significa "é". Assim, a expressão $x \in A$ literalmente queria dizer "x _est in_ A", ou "x está em A", que passou a ser lida como "x pertence a A".
```

Considere o conjunto $C$ acima.

$x \in C$

In [68]:
1 in C

True

$x \notin C$

In [69]:
'a' not in C

False

## Continência

Considere o conjunto $D = \{ 1,2 \}$

In [70]:
D = {1,2}

$D \subseteq C$

In [71]:
D <= C

True

$D \subset C$

In [72]:
D < C

True

$C \supseteq D$

In [73]:
C >= D

True

$C \supset D$

In [74]:
C > D

True

## Igualdade

Consideremos $A = \{ 1,4,3,1 \}$, $B = \{ 1,4,3,3,1 \}$, $C = \{ 4,3,1 \}$, $D = \{ 2,1 \}$ e $E = \{ 1,2,1 \}$

In [75]:
A = {1,4,3,1} 
B = {1,4,3,3,1} 
C = {4,3,1}
D = {2,1}
E = {1,2,1}

Então, todas as expressões abaixo são válidas
$$A=B$$
$$A=C$$
$$D=E$$
$$C \neq D$$
$$B \neq E$$

In [76]:
A == B

True

In [77]:
A == C

True

In [78]:
D == E

True

In [79]:
C != D

True

In [80]:
B != E

True

```{admonition} Atribuição vs. comparação
:class: dropdown
Lembre-se que a diferença entre `A = B` e `A == B` em Python está no seguinte: a primeira sentença é uma _atribuição_; a segunda, um _teste lógico_.
```

In [81]:
A == B == C

True

## Cardinalidade

A cardinalidade de um conjunto é o número de elementos que ele contém.


```{admonition}Número de elementos em um conjunto
:class: dropdown
Em Matemática, a cardinalidade é comumente representada por uma das seguintes formas:

- com barras verticais (interpretado como "módulo de"): $|A|$
- com o símbolo cerquilha (informalmente chamado de _tralha_, ou _hash_): $\#A$

Ambas as formas significam "quantos elementos há no conjunto $A$".
```

Para sabermos o número de elementos de um `set`, use a função `len`

In [82]:
len(C)

3

#### Definição por propriedade

Em Python, podemos construir conjuntos usando **compreensão de conjuntos** (*set comprehension*), que é a forma mais próxima da notação matemática $A = \{ x \in U : (x) }\$.

A sintaxe geral é:

```{code}python
{ expressão for variável in sequência if condição },
```

em que `sequência` é um objeto iterável e `condição` é uma condição opcional.

```{admonition}Objetos iteráveis
:class: dropdown
Um objeto iterável em Python é qualquer estrutura de dados que pode fornecer seus elementos um por um, de forma sequencial, permitindo que seja percorrida por um laço `for` ou transformada em outras coleções. Exemplos são `list`, `tuple`, `str`, `range`, `set`, `dict`, `frozenset` (versão imutável de `set`), `file` e `generator`.
```

$F = \{ x \in \mathbb{Z} : 0 \le x < 10 \}$

In [83]:
F = {x for x in range(10)}
F

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

In [84]:
d = range(4)
e = range(6)
D = {-x for x in d[1:3]}
E = {x for x in e}
D

{-2, -1}

In [85]:
{-x for x in d[1:3]}

{-2, -1}

In [86]:
E

{0, 1, 2, 3, 4, 5}

$B = \{ x \in \mathbb{N} : x < 10 \text{ e } x \text{ é par} \}$

In [87]:
B = {x for x in range(10) if x % 2 == 0}
B

{0, 2, 4, 6, 8}

$C = \{ x \in \mathbb{Z} : 0 \le x < 20 \land x^2 < 100 \}$

In [88]:
C = {x for x in range(20) if x**2 < 100}
C

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

## Exemplos aplicados


**I**. Identificar o vocabulário único de um arquivo de texto e contar palavras.

```
# Conteúdo de '1-texto.txt'.

A inteligência artificial está transformando a educação e a pesquisa em ciência de dados.
A pesquisa impulsiona novas descobertas.
```

In [89]:
palavras = set()

with open("../examples/1-texto.txt", "r", encoding="utf-8") as f:
    for linha in f:
        for palavra in linha.lower().split():
            palavras.add(palavra.strip(".,;!?"))

print("Vocabulário distinto:", palavras)
print("Total de palavras únicas:", len(palavras))

Vocabulário distinto: {'pesquisa', 'de', 'ciência', 'transformando', 'dados', 'descobertas', 'educação', 'e', 'artificial', 'está', 'a', 'inteligência', 'em', 'novas', 'impulsiona'}
Total de palavras únicas: 15


Uma descrição matemática possível para o exemplo I é:

"Seja $T$ o conjunto de todas as palavras da Língua Portuguesa que aparecem no fragmento de texto dado e $U$ as palavras que aparecem apenas uma única vez. Determine o número de tais palavras."

Este problema, teve como resultado o número inteiro $q = |U|$, para $U = \{ u_i \in T : i \in \{ 1,2,\ldots, n\} \land q \leq n \}$, com $n = |T|$.

**II.** Capturar somente os esportes cujos diâmetros das bolsas ou discos são menores que um valor limite.

In [90]:
# Dataframe com esportes e seus diâmetros padrão (em milímetros)
dados = {
    "esporte": ["Basquete", "Futebol", "Tênis", "Pingue-pongue", "Golfe", "Beisebol", "Hóquei"],
    "diametro_mm": [240, 220, 67, 40, 43, 74, 76]
    }

# Criação do dataframe
from pandas import DataFrame
df = DataFrame(dados)
df

Unnamed: 0,esporte,diametro_mm
0,Basquete,240
1,Futebol,220
2,Tênis,67
3,Pingue-pongue,40
4,Golfe,43
5,Beisebol,74
6,Hóquei,76


In [91]:
# Valor do limitante (em milímetros)
L = 80 

# Filtragem dos esportes com diâmetro menor que L
E_L = set(df[df["diametro_mm"] < L]["esporte"])

E_L

{'Beisebol', 'Golfe', 'Hóquei', 'Pingue-pongue', 'Tênis'}

Uma descrição matemática possível para o exemplo II é:

"Seja $E$ o conjunto de todos os esportes registrados no banco de dados e $d$ o diâmetro da bola ou disco do esporte correspondente. Determine o subconjunto dos esportes para os quais $d$ é inferior a um valor determinado."

Este problema, que se resume a uma filtragem, teve como resultado o conjunto $E_L= \{ e \in E : d(e) < L\}$ para $L= 80$ mm.

## Quadro-resumo de operações elementares

O quadro abaixo lista as operações elementares com conjuntos que aprendemos e como executá-las em Python.

| Operação | Símbolo matemático | Operador / Método em Python | 
|-----------|--------------------|------------------------------|
| Pertinência | $x \in A$ | `x in A` |
| Não-pertinência | $x \notin A$ | `x not in A` |
| Subconjunto | $A \subseteq B$ | `A <= B` |
| Subconjunto próprio | $A \subset B$ | `A < B` |
| Superconjunto | $A \supseteq B$ | `A >= B` |
| Superconjunto próprio | $A \supset B$ | `A > B`|
| Igualdade | $A = B$ | `A == B` |
| Conjunto vazio | $\varnothing$ | `set()` |

In [92]:
plt.rcdefaults()