# Dicionários (avançado)

In [1]:
from collections import OrderedDict

In [3]:
dicionario = OrderedDict()
dicionario['a'] = 1
dicionario['b'] = 2
dicionario['c'] = 3
dicionario['d'] = 4
dicionario['e'] = 5
print(dicionario)

OrderedDict([('a', 1), ('b', 2), ('c', 3), ('d', 4), ('e', 5)])


In [4]:
for k, v in dicionario.items():
    print(k, v)

a 1
b 2
c 3
d 4
e 5


Internamente é gerado um mapeamento da ordem aos quais os itens foram inseridos. Caso uma nova entrada tente atualizar uma chave:valor do dicionário, a posição  # original é mantida, esse log de alterações pode ser visualizado via MyPy.



# DefaultDict 
##### Mesmas funcionalidades de um dicionário padrão, porém caso o usuário tente  consultar uma entrada inexistente, ao invés de um erro é retornado um valor padrão



In [5]:
from collections import defaultdict
dicionario = defaultdict(int)
dicionario['ano'] = 2021
dicionario['mes'] = 5

print(dicionario.items())
print(dicionario['dia'])

dict_items([('ano', 2021), ('mes', 5)])
0


# Expressões Regulares
#### r'String

In [3]:
import re

In [7]:
minha_string = 'O flamengo será Campeão!'
print(re.findall(r'meng.', minha_string))

# Método findall( ) irá buscar na origem uma string específica,  
# o ponto no lugar do o em 'meng.'' é um validador regular, 
# permitindo que neste ponto esteja todo e qualquer caractere.

['mengo']


In [8]:
# meta caractere
texto1 = '''No dia trinta de março de dois mil e vinte  foi inaugurado o novo ginásio 
            de esportes da escola  estatual Professor Annes Dias, na cidade de Cruz Alta,  
            no estado do Rio Grande do Sul. A obra inicialmente   orçada em um milhão de, 
            reais acabou não utilizando de  todo o recurso, uma vez que dois grandes 
            empresários da   cidade, João Fagundes e Maria Terres doaram juntos em   
            torno de duzentos mil reais. João Fagundes se manifestou  dizendo que apoiou a 
            obra pois acredita no desenvolvimento  da cidade, assim investe regularmente 
            para hospitais e  escolas da mesma. maria Terres não quis se pronunciar   
            sobre o assunto.'''

In [10]:
print(re.findall(r'.oão', texto1))

['João', 'João']


In [14]:
print(re.findall(r'.erres', texto1))

['Terres', 'Terres']


##### O metacaractere " . " no início de uma sentença serve para validar o caractere inicial sa string, que nesse caso poderia ser uma letra maiúscula ou minúscula.



In [15]:
print(re.findall(r'.oão|.aria', texto1))

['João', 'Maria', 'João', 'maria']


#### Meta caractere " | " significa "ou"  | significa ou, e tem suporte a número de palavras ilimitadas



In [19]:
print(re.findall(r'.oão|.aria|.nnes', texto1))

['Annes', 'João', 'Maria', 'João', 'maria']


In [20]:
print(re.findall(r'[Jj]oão|.aria', texto1))  
# Suponto que toos os caracteres possíveis no início de João são J  
# maiúsculo e j minúsculo. Nesse caso sabemos que os possíveis caracteres  
# são J ou j, mas em outras strings precisaremos ampliar a abordagem.

['João', 'Maria', 'João', 'maria']


In [21]:
# pode conter quantos possíveis caracteres forem necessarios  
print(re.findall(r'[AaBbCcDdEeFfGgHhIiJj]oão', texto1))

['João', 'João']


In [22]:
# otimizado com um intervalo predefinido  
print(re.findall(r'[a-z]oão|[A-Z]oão', texto1))  
print(re.findall(r'[a-zA-Z]oão', texto1))

['João', 'João']
['João', 'João']


## Alterando o comportamento de uma expressão regular via flags

In [24]:
# ignore case
print(re.findall(r'jOãO|maRIA', texto1, flags = re.I))
# Flags serve para passar uma instrução local, nesse caso, re.I  
# significa ignore case (não diferenciar letras maiúsculas de minúsculas)

['João', 'Maria', 'João', 'maria']


# Metacaracteres quantificadores 
##### * significa 0 ou ilimitado número de vezes + significa 1 ou ilimitado número de vezes ? significa 0 ou 1, apenas uma vez  {} significa um número específico, por exemplo {8} define 8 repetições  {} com dois parâmetros justapostos definem um intervalo, por exemplo {0,15} define que algo será repetido 15 vezes, iniciando o contador em 0.



In [26]:
mensagem = 'Nããããããããããooooooo esquecer de pagar a conta, não deixar para depois'  
print(re.findall(r'não', mensagem, flags = re.I))  
print(re.findall(r'Nã+o', mensagem))  

# o operador " + " ao lado de ã diz que esse caractere, naquela posição  
# pode se repetir uma ou mais vezes 

print(re.findall(r'Nã+o+', mensagem))  
print(re.findall(r'[Nn]ã+o+', mensagem))

['não']
['Nãããããããããão']
['Nããããããããããooooooo']
['Nããããããããããooooooo', 'não']


### Metacaracteres aplicados a um intervalo de caracteres de uma expressão regular
##### [A-Za-z0-9]+ significa que vai permitir qualquer caractere,  # quantas vezes o mesmo estiver repetido...  



In [27]:
chamando_nome = 'Fernnnnnnnannnnndo'  
print(re.findall(r'fer[a-z]+a[Nn]+do', chamando_nome, flags = re.I)) 

['Fernnnnnnnannnnndo']


## Substituindo um elemento de uma string via expressão regular



In [28]:
texto1 = '''No dia trinta de março de dois mil e vinte  foi inaugurado o novo ginásio 
            de esportes da escola  estatual Professor Annes Dias, na cidade de Cruz Alta, 
            no estado do Rio Grande do Sul. A obra inicialmente orçada em um milhão de, 
            reais acabou não utilizando de  todo o recurso, uma vez que dois grandes 
            empresários da   cidade, João Fagundes e Maria Terres doaram juntos em   
            torno de duzentos mil reais. João Fagundes se manifestou  dizendo que apoiou 
            a obra pois acredita no desenvolvimento  da cidade, assim investe regularmente
            para hospitais e  escolas da mesma. maria Terres não quis se pronunciar   
            sobre o assunto.'''

In [29]:
print(re.sub(r'jOãO', 'Carlos', texto1, flags = re.I))  
# método sub( ) recebe três parâmetros, sendo o primeiro a string a ser  
# substituída, seguido da string substituta, seguido da fonte onde serão  
# lidas e feitas as devidas alterações.

No dia trinta de março de dois mil e vinte  foi inaugurado o novo ginásio 
            de esportes da escola  estatual Professor Annes Dias, na cidade de Cruz Alta, 
            no estado do Rio Grande do Sul. A obra inicialmente orçada em um milhão de, 
            reais acabou não utilizando de  todo o recurso, uma vez que dois grandes 
            empresários da   cidade, Carlos Fagundes e Maria Terres doaram juntos em   
            torno de duzentos mil reais. Carlos Fagundes se manifestou  dizendo que apoiou 
            a obra pois acredita no desenvolvimento  da cidade, assim investe regularmente
            para hospitais e  escolas da mesma. maria Terres não quis se pronunciar   
            sobre o assunto.


# Separando uma string em partes



In [35]:
minha_string = """A obra inicialmente orçada em um milhão de,
reais acabou não utilizando de  todo o recurso, uma vez que dois grandes 
empresários da   cidade, João Fagundes e Maria Terres doaram juntos em   
torno de duzentos mil reais"""

In [36]:
print(re.split(r',', minha_string))

['A obra inicialmente orçada em um milhão de', '\nreais acabou não utilizando de  todo o recurso', ' uma vez que dois grandes \nempresários da   cidade', ' João Fagundes e Maria Terres doaram juntos em   \ntorno de duzentos mil reais']
