## Trabalhando com conjuntos, os sets

In [5]:
usuarios_time_1 = [12, 24, 37, 41]
usuarios_time_2 = [11, 29, 37, 46]

In [6]:
# Pegar os valores e unir os dois times
unidos = usuarios_time_1.copy()
unidos.extend(usuarios_time_2)
unidos

[12, 24, 37, 41, 11, 29, 37, 46]

In [7]:
len(unidos)

8

In [8]:
# As duas listas possuem um elemento repetido
# Quero pegar cada elemento de uma vez
# Transformando a lista em um conjunto
set(unidos)

{11, 12, 24, 29, 37, 41, 46}

In [9]:
# Um conjunto é representado por elementos não repetidos

In [10]:
# Criando um conjunto
set([1,2,3])

{1, 2, 3}

In [11]:
set([1,1,2,3,3])

{1, 2, 3}

In [12]:
{1,2,2,3}

{1, 2, 3}

In [13]:
# Já poderia ter criado os usuários como um conjunto
# Já que a ordem que eu adiciono eles não importa
# E eu quero que não apareçam números repetidos
usuarios_time_1 = {12, 24, 37, 41}
usuarios_time_2 = {11, 29, 37, 46}

In [15]:
# Em conjuntos eu não tenho acesso às posições
usuarios_time_1[2]

TypeError: 'set' object is not subscriptable

In [17]:
for usuario in set(unidos):
    print(usuario)

37
41
11
12
46
24
29


In [18]:
# União de dois conjuntos
usuarios_time_1 = {12, 24, 37, 41}
usuarios_time_2 = {11, 29, 37, 46}

usuarios_time_1 | usuarios_time_2 # um ou outro

{11, 12, 24, 29, 37, 41, 46}

## Mais operações de conjuntos

In [19]:
# Intersecção dos conjuntos
usuarios_time_1 & usuarios_time_2

{37}

In [20]:
# Quem está no time 1 mas não está no time 2
usuarios_time_1 - usuarios_time_2

{12, 24, 41}

In [21]:
time_1_e_nao_2 = usuarios_time_1 - usuarios_time_2
12 in time_1_e_nao_2

True

In [22]:
37 in time_1_e_nao_2

False

## Outro tipo de conjunto e conjuntos de outros tipos

In [2]:
usuarios = {1,5,76,34,52,13,17}
len(usuarios)

7

In [3]:
usuarios.add(13)
len(usuarios)

7

In [4]:
# O comprimento continua o mesmo porque o elemento 13 já estava presente no conjunto 
usuarios.add(44)
len(usuarios)

8

In [5]:
usuarios

{1, 5, 13, 17, 34, 44, 52, 76}

In [6]:
# Usar um conjunto imutável
usuarios = frozenset(usuarios)
usuarios

frozenset({1, 5, 13, 17, 34, 44, 52, 76})

In [7]:
type(usuarios)

frozenset

In [8]:
usuarios.add(99)

AttributeError: 'frozenset' object has no attribute 'add'

In [11]:
meu_texto = "Meu nome é Amanda e gosto de cachorros e gosto de livros"
meu_texto.split()

['Meu',
 'nome',
 'é',
 'Amanda',
 'e',
 'gosto',
 'de',
 'cachorros',
 'e',
 'gosto',
 'de',
 'livros']

In [12]:
set(meu_texto.split())

{'Amanda', 'Meu', 'cachorros', 'de', 'e', 'gosto', 'livros', 'nome', 'é'}

## Dicionários (mapa, etc)

In [13]:
aparicoes = {
    "Amanda" : 1,
    "cachorro" : 1,
    "de" : 2
}

In [14]:
type(aparicoes)

dict

In [15]:
aparicoes["Amanda"]

1

In [16]:
aparicoes["de"]

2

In [17]:
# Quero pegar a chave "opa". Se não tiver essa chave, me devolve 0
aparicoes.get("opa", 0)

0

In [18]:
aparicoes.get("de", 0)

2

In [19]:
# Outra forma de iniciar um dicionário
aparicoes = dict(Amanda = 1, cachorro = 1, de = 2)
aparicoes

{'Amanda': 1, 'cachorro': 1, 'de': 2}

In [20]:
aparicoes = {
    "Amanda" : 1,
    "cachorro" : 1,
    "de" : 2
}

## Mais operações de dicionários

In [21]:
# Adicionar elemento
aparicoes["Ana"] = 3
aparicoes

{'Amanda': 1, 'cachorro': 1, 'de': 2, 'Ana': 3}

In [23]:
# Substituir um elemento
aparicoes["Ana"] = 4
aparicoes

{'Amanda': 1, 'cachorro': 1, 'de': 2, 'Ana': 4}

In [24]:
# Remover um elemento
del aparicoes["Ana"]
aparicoes

{'Amanda': 1, 'cachorro': 1, 'de': 2}

In [25]:
# Verificar se tem um elemento
"cachorro" in aparicoes

True

In [26]:
"dog" in aparicoes

False

In [27]:
# Passar pelos elementos
for elemento in aparicoes:
    print(elemento)

Amanda
cachorro
de


In [28]:
# Passar pelas chaves
for elemento in aparicoes.keys():
    print(elemento)

Amanda
cachorro
de


In [29]:
# Passar pelos valores
for elemento in aparicoes.values():
    print(elemento)

1
1
2


In [31]:
# Passar linha a linha
for elemento in aparicoes.keys():
    valor = aparicoes[elemento]
    print(elemento, valor)

Amanda 1
cachorro 1
de 2


In [32]:
for elemento in aparicoes.items():
    print(elemento)

('Amanda', 1)
('cachorro', 1)
('de', 2)


In [33]:
for chave, valor in aparicoes.items():
    print(chave, "-", valor)

Amanda - 1
cachorro - 1
de - 2


In [34]:
["palavra {}".format(chave) for chave in aparicoes.keys()]

['palavra Amanda', 'palavra cachorro', 'palavra de']

## Default dict

In [37]:
# Contar o número de aparições de cada palavra no texto
meu_texto = "Meu nome é Amanda e gosto de cachorros e gosto de livros"
meu_texto = meu_texto.lower()
meu_texto.split()

['meu',
 'nome',
 'é',
 'amanda',
 'e',
 'gosto',
 'de',
 'cachorros',
 'e',
 'gosto',
 'de',
 'livros']

In [38]:
aparicoes = {}

for palavra in meu_texto.split(): 
    ate_agora = aparicoes.get(palavra, 0)
    aparicoes[palavra] = ate_agora + 1
    
aparicoes

{'meu': 1,
 'nome': 1,
 'é': 1,
 'amanda': 1,
 'e': 2,
 'gosto': 2,
 'de': 2,
 'cachorros': 1,
 'livros': 1}

In [39]:
# Default dict
from collections import defaultdict

aparicoes = defaultdict(int)

for palavra in meu_texto.split(): 
    ate_agora = aparicoes[palavra]
    aparicoes[palavra] = ate_agora + 1
    
aparicoes

defaultdict(int,
            {'meu': 1,
             'nome': 1,
             'é': 1,
             'amanda': 1,
             'e': 2,
             'gosto': 2,
             'de': 2,
             'cachorros': 1,
             'livros': 1})

In [40]:
# Outro exemplo
dicionario = defaultdict(int)
dicionario["Amanda"]

0

In [41]:
dicionario["Amanda"] = 12
dicionario["Amanda"]

12

## Counter

In [42]:
aparicoes = defaultdict(int)

for palavra in meu_texto.split(): 
    aparicoes[palavra] += 1
    
aparicoes

defaultdict(int,
            {'meu': 1,
             'nome': 1,
             'é': 1,
             'amanda': 1,
             'e': 2,
             'gosto': 2,
             'de': 2,
             'cachorros': 1,
             'livros': 1})

In [44]:
class Conta:
    def __init__(self):
        print("Criando uma conta")

In [45]:
# Toda vez que eu buscar uma conta que não está lá ainda, vai chamar o construtor e criar uma conta nova
contas = defaultdict(Conta)

In [46]:
contas[12]

Criando uma conta


<__main__.Conta at 0x245d9504d00>

In [47]:
# Counter
from collections import Counter

aparicoes = Counter()
for palavra in meu_texto.split(): 
    aparicoes[palavra] += 1
    
aparicoes

Counter({'meu': 1,
         'nome': 1,
         'é': 1,
         'amanda': 1,
         'e': 2,
         'gosto': 2,
         'de': 2,
         'cachorros': 1,
         'livros': 1})

In [48]:
from collections import Counter

aparicoes = Counter(meu_texto.split())
aparicoes

Counter({'meu': 1,
         'nome': 1,
         'é': 1,
         'amanda': 1,
         'e': 2,
         'gosto': 2,
         'de': 2,
         'cachorros': 1,
         'livros': 1})

## Colocando tudo em prática

In [49]:
texto_1 = """
Durante o curso experimente usar uma metodologia ágil como o Scrum em algum projeto de disciplina, 
faça as dailies, o planejamento das sprints, o review das sprints e você já terá algo pra comentar com o seu entrevistador
Você não precisa ser um especialista em desenvolvimento ágil pra conseguir uma vaga de jr, 
mas mostrar que você conhece o básico, e até mesmo já utilizou, pode ser um plus.
"""

In [50]:
texto_2 = """
Não se limite somente a procurar vagas na sua região, o que mais surgiu nessa pandemia foram vagas remotas na área de 
T.I e eu sugiro fortemente que você tente essas vagas também. Atualmente eu trabalho como desenvolvedor backend jr de 
forma completamente remota e tem sido uma experiência incrível.

Durante o tempo que fiquei procurando vagas eu enviei curriculos e fiz submissões para muitas empresas, muitas mesmo. 
E tive retorno de várias delas para realizar uma entrevista e para fazer testes práticos. 

Não tenha medo de entrar em contato com outros programadores para fazer perguntas, geralmente todos respondem de 
forma amigável.
"""

In [52]:
# Contar as letras do texto
aparicoes = Counter(texto_1.lower())
aparicoes

Counter({'\n': 5,
         'd': 11,
         'u': 15,
         'r': 22,
         'a': 28,
         'n': 14,
         't': 16,
         'e': 37,
         ' ': 67,
         'o': 32,
         'c': 15,
         's': 26,
         'x': 1,
         'p': 12,
         'i': 21,
         'm': 19,
         'l': 12,
         'g': 7,
         'á': 6,
         'j': 5,
         ',': 6,
         'f': 1,
         'ç': 1,
         'v': 8,
         'w': 1,
         'ê': 3,
         'ã': 1,
         'q': 1,
         'h': 1,
         'b': 1,
         'é': 1,
         'z': 1,
         '.': 1})

In [54]:
# Total de caracteres do texto
total_de_caracteres = sum(aparicoes.values())
total_de_caracteres

398

In [55]:
for letra, frequencia in aparicoes.items():
    tupla = (letra, frequencia / total_de_caracteres)
    print(tupla)

('\n', 0.01256281407035176)
('d', 0.02763819095477387)
('u', 0.03768844221105527)
('r', 0.05527638190954774)
('a', 0.07035175879396985)
('n', 0.035175879396984924)
('t', 0.04020100502512563)
('e', 0.09296482412060302)
(' ', 0.16834170854271358)
('o', 0.08040201005025126)
('c', 0.03768844221105527)
('s', 0.06532663316582915)
('x', 0.002512562814070352)
('p', 0.03015075376884422)
('i', 0.052763819095477386)
('m', 0.04773869346733668)
('l', 0.03015075376884422)
('g', 0.017587939698492462)
('á', 0.01507537688442211)
('j', 0.01256281407035176)
(',', 0.01507537688442211)
('f', 0.002512562814070352)
('ç', 0.002512562814070352)
('v', 0.020100502512562814)
('w', 0.002512562814070352)
('ê', 0.007537688442211055)
('ã', 0.002512562814070352)
('q', 0.002512562814070352)
('h', 0.002512562814070352)
('b', 0.002512562814070352)
('é', 0.002512562814070352)
('z', 0.002512562814070352)
('.', 0.002512562814070352)


In [67]:
def analisa_frequencia_de_letras(texto):
    aparicoes = Counter(texto.lower())
    total_de_caracteres = sum(aparicoes.values())

    proporcoes = [(letra, frequencia / total_de_caracteres)for letra, frequencia in aparicoes.items()]
    proporcoes = Counter(dict(proporcoes))
    for caractere, proporcao in  proporcoes.most_common(10):
        print("{} => {:.2f}%".format(caractere, proporcao * 100))

In [68]:
analisa_frequencia_de_letras(texto_1)

  => 16.83%
e => 9.30%
o => 8.04%
a => 7.04%
s => 6.53%
r => 5.53%
i => 5.28%
m => 4.77%
t => 4.02%
u => 3.77%


In [69]:
analisa_frequencia_de_letras(texto_2)

  => 15.50%
e => 11.78%
a => 9.61%
r => 7.13%
o => 6.36%
s => 6.05%
t => 5.43%
m => 5.12%
i => 4.19%
n => 4.03%
