<a href="https://colab.research.google.com/github/KPxto/python_collections/blob/main/collections_2.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#**Live de Python #29**

[link para aula](https://www.youtube.com/watch?v=3NYHjZwhx-M)

#**Counter, defaultdict e OrderedDict**

**O que são dicionários**

- Estrutura de dados muito poderosa
- Presente também em outras linguagens
- São também chamadas de mapping, hash mapping

**Podemos criar dicionários das duas formas abaixo**

In [9]:
dic_1 = {'chave1':'valor1', 'chave2':'valor2', 'chave3':'valor3'}

dic_2 = dict(chave1='valor1', chave2='valor2', chave3='valor3')

Como sabemos, dicionários são acessíveis por chaves, conforme abaixo:

In [11]:
dic_1['chave1']

'valor1'

In [12]:
dic_2['chave2']

'valor2'

Podemos também mudar ou criar novos valores seguindo a orientação abaixo

In [30]:
# criando novos valores
dic_1['nova_chave'] = 'novo_valor'

In [31]:
dic_1

{'chave1': 'valor1',
 'chave2': 'valor2',
 'chave3': 'valor3',
 'nova_chave': 'novo_valor'}

In [32]:
# mudando valores já existentes
dic_1['chave1'] = 'valor1_0'

In [33]:
dic_1

{'chave1': 'valor1_0',
 'chave2': 'valor2',
 'chave3': 'valor3',
 'nova_chave': 'novo_valor'}

Um método interessante de dicionários é o update.

Ele incorpora um dicionário a outro já existente. Caso as chaves se repitam, o seu valor é atualizado. Caso não existam chaves repetidas, o novo par chave-valor vai ser incorporado ao dicionário.

In [46]:
# criando um dicionário simples para incorporar ao antigo
f =  {7:'sete'}

In [47]:
# atualizando o dicionario dic_1
dic_1.update(f)

In [48]:
dic_1

{7: 'sete',
 'chave1': 'valor1_0',
 'chave2': 'valor2',
 'chave3': 'valor3',
 'nova_chave': 'novo_valor'}

In [49]:
# criando um dicionario com chave existente no dic_1
x = {'chave1':'valor1'}

In [50]:
dic_1.update(x)

In [51]:
dic_1

{7: 'sete',
 'chave1': 'valor1',
 'chave2': 'valor2',
 'chave3': 'valor3',
 'nova_chave': 'novo_valor'}

**Dict Comprehension**

Funciona basicamente como uma list comprehension.

Colocamos um laço dentro de uma estrutura de chaves.

In [68]:
digitos = [0, 1, 2, 3]
strings = ['zero', 'um', 'dois', 'tres']

In [69]:
{stri:dig for dig, stri in zip(digitos, strings)}

{'dois': 2, 'tres': 3, 'um': 1, 'zero': 0}

**OrderedDict**

Problema a ser resolvido: dicionários não mantém chaves de acordo com ordem de inserção. Vc pode inserir pares num dicionário, mas na hora de fazer uma iteração pode não retornar novo dict na ordem desejada

In [22]:
from collections import OrderedDict

In [23]:
# instanciando um objeto
d = OrderedDict()

In [24]:
d

OrderedDict()

In [26]:
# o OrderedDict lembra a ordem de inserção de chaves no dicionário
d[0] = 'zero'
d[999] = 'carro'
d[3] = 'bike'

In [27]:
d

OrderedDict([(0, 'zero'), (999, 'carro'), (3, 'bike')])

In [29]:
c = {}
c[0] = 'zero'
c[999] = 'carro'
c[3] = 'bike'

In [30]:
c

{0: 'zero', 3: 'bike', 999: 'carro'}

**DefaultDict**

Cria um valor default para qualquer chave inexistente no dicionario.

Ou seja, com defaultdict nunca haverá erro se vc procurar por uma chave que não existe. Ele vai atribuir o valor default à qualquer nova chave chamada.


In [78]:
# importando módulo
from collections import defaultdict

In [79]:
# primeiro vamos criar uma função que vai gerar o valor default
# ou seja, toda vez que essa função for chamada ela vai retornar o valor 3
def num(): return 3

In [80]:
# instanciando nosso novo default dict com a função como argumento
d = defaultdict(num)

In [81]:
# chamando uma chave que não existe
d['chave']

3

In [82]:
d

defaultdict(<function __main__.num>, {'chave': 3})

In [83]:
d[1]

3

In [90]:
d

defaultdict(<function __main__.num>, {1: 3, 'chave': 3})

In [92]:
# vamos criar um dicionario para armazenar funcionarios e salarios
# passamos uma função lambda
fun = defaultdict(lambda: 'nao existente')

In [93]:
# procurando por novo funcionario ainda não cadastrado
fun['joao']

'nao existente'

In [95]:
# veja que, como ainda nao existia, ele acaba criando nova chave
# com o valor padrão
fun

defaultdict(<function __main__.<lambda>>, {'joao': 'nao existente'})

In [96]:
# agora vamos atualizar os dados do novo funcionario
fun.update({'joao':'R$ 3000'})

In [105]:
fun

defaultdict(<function __main__.<lambda>>, {'joao': 'R$ 3000'})

**Counter**

Faz uma contagem dos elementos de um iterável.

Por exemplo, ele conta quantas vezes cada item aparece numa lista.

Counter retorna um dicionário com o elemento como chave e sua contagem como valor

In [106]:
from collections import Counter

In [107]:
lista = [1, 2, 3, 1, 1, 2, 3, 4, 5, 6, 4, 3, 2, 3, 5, 6, 7, 5, 4, 3, 3, 2, 2]

In [108]:
Counter(lista)

Counter({1: 3, 2: 5, 3: 6, 4: 3, 5: 3, 6: 2, 7: 1})

In [109]:
s = 'kaio oliveira peixoto'

In [119]:
Counter(s)

Counter({' ': 2,
         'a': 2,
         'e': 2,
         'i': 4,
         'k': 1,
         'l': 1,
         'o': 4,
         'p': 1,
         'r': 1,
         't': 1,
         'v': 1,
         'x': 1})

In [139]:
# podemos fazer operações de interseção, semelhante a de conjuntos (set)
Counter('aabccdd') & Counter('aabcc')

Counter({'a': 2, 'b': 1, 'c': 2})

In [129]:
# vamos agora pegar uma string maior para brincar
st = """
Text messaging, or texting, is the act of composing and sending electronic messages, typically consisting of alphabetic and numeric characters, between two or more users of mobile devices, desktops/laptops, or other type of compatible computer. Text messages may be sent over a cellular network, or may also be sent via an Internet connection.

The term originally referred to messages sent using the Short Message Service (SMS). It has grown beyond alphanumeric text to include multimedia messages using the Multimedia Messaging Service (MMS) containing digital images, videos, and sound content, as well as ideograms known as emoji (happy faces, sad faces, and other icons), and instant messenger applications (usually the term is used when on mobile devices).

Text messages are used for personal, family, business and social purposes. Governmental and non-governmental organizations use text messaging for communication between colleagues. In the 2010s, the sending of short informal messages became an accepted part of many cultures, as happened earlier with emailing.[1] This makes texting a quick and easy way to communicate with friends, family and colleagues, including in contexts where a call would be impolite or inappropriate (e.g., calling very late at night or when one knows the other person is busy with family or work activities). Like e-mail and voicemail and unlike calls (in which the caller hopes to speak directly with the recipient), texting does not require the caller and recipient to both be free at the same moment; this permits communication even between busy individuals. Text messages can also be used to interact with automated systems, for example, to order products or services from e-commerce websites, or to participate in online contests. Advertisers and service providers use direct text marketing to send messages to mobile users about promotions, payment due dates, and other notifications instead of using postal mail, email, or voicemail.
"""

In [130]:
# vamos contar quanto de cada letra tem na string
Counter(st)

Counter({'\n': 6,
         ' ': 300,
         '(': 6,
         ')': 6,
         ',': 28,
         '-': 3,
         '.': 13,
         '/': 1,
         '0': 2,
         '1': 2,
         '2': 1,
         ';': 1,
         'A': 1,
         'G': 1,
         'I': 3,
         'L': 1,
         'M': 6,
         'S': 6,
         'T': 6,
         '[': 1,
         ']': 1,
         'a': 126,
         'b': 21,
         'c': 66,
         'd': 51,
         'e': 213,
         'f': 21,
         'g': 42,
         'h': 39,
         'i': 126,
         'j': 1,
         'k': 11,
         'l': 66,
         'm': 65,
         'n': 119,
         'o': 114,
         'p': 39,
         'q': 2,
         'r': 86,
         's': 132,
         't': 131,
         'u': 41,
         'v': 19,
         'w': 22,
         'x': 12,
         'y': 21,
         'z': 1})

In [132]:
# vamos aplicar o metodo split que vai separar cada palavra da string
# e armazenar numa lista
# split vai usar o espaço como delimitador padrão
# e assim consegue separar cada palavra
# dessa forma Counter conta o ocorrencia de cada palavra
Counter(st.split())

Counter({'(MMS)': 1,
         '(SMS).': 1,
         '(e.g.,': 1,
         '(happy': 1,
         '(in': 1,
         '(usually': 1,
         '2010s,': 1,
         'Advertisers': 1,
         'Governmental': 1,
         'In': 1,
         'Internet': 1,
         'It': 1,
         'Like': 1,
         'Message': 1,
         'Messaging': 1,
         'Multimedia': 1,
         'Service': 2,
         'Short': 1,
         'Text': 4,
         'The': 1,
         'This': 1,
         'a': 3,
         'about': 1,
         'accepted': 1,
         'act': 1,
         'activities).': 1,
         'alphabetic': 1,
         'alphanumeric': 1,
         'also': 2,
         'an': 2,
         'and': 14,
         'applications': 1,
         'are': 1,
         'as': 4,
         'at': 2,
         'automated': 1,
         'be': 5,
         'became': 1,
         'between': 3,
         'beyond': 1,
         'both': 1,
         'business': 1,
         'busy': 2,
         'call': 1,
         'caller': 2,
         'callin

In [133]:
# vamos atribuir esse valor para uma variável
# dessa forma teremos acesso aos métodos de Counter
x = Counter(st.split())

In [134]:
# quais sao as 20 palavras mais comuns
x.most_common(20)

[('and', 14),
 ('the', 11),
 ('or', 10),
 ('to', 10),
 ('of', 7),
 ('messages', 7),
 ('be', 5),
 ('with', 5),
 ('Text', 4),
 ('other', 4),
 ('as', 4),
 ('is', 3),
 ('between', 3),
 ('mobile', 3),
 ('sent', 3),
 ('a', 3),
 ('using', 3),
 ('text', 3),
 ('used', 3),
 ('for', 3)]

In [141]:
help(x)

Help on Counter in module collections object:

class Counter(builtins.dict)
 |  Counter(*args, **kwds)
 |  
 |  Dict subclass for counting hashable items.  Sometimes called a bag
 |  or multiset.  Elements are stored as dictionary keys and their counts
 |  are stored as dictionary values.
 |  
 |  >>> c = Counter('abcdeabcdabcaba')  # count elements from a string
 |  
 |  >>> c.most_common(3)                # three most common elements
 |  [('a', 5), ('b', 4), ('c', 3)]
 |  >>> sorted(c)                       # list all unique elements
 |  ['a', 'b', 'c', 'd', 'e']
 |  >>> ''.join(sorted(c.elements()))   # list elements with repetitions
 |  'aaaaabbbbcccdde'
 |  >>> sum(c.values())                 # total of all counts
 |  15
 |  
 |  >>> c['a']                          # count of letter 'a'
 |  5
 |  >>> for elem in 'shazam':           # update counts from an iterable
 |  ...     c[elem] += 1                # by adding 1 to each element's count
 |  >>> c['a']                          