<h3>Python Essentials for DevOps</h3>

<h2 style='color:gold'>Using regular Expressions</h2>

In [15]:
import re

cc_list = '''Ezra Koenig <ekoenig@vpwk.com>, Rostam Batmanglij <rostam@vpwk.com>, Chris Tomson <ctomson@vpwk.com, Bobbi Baio <bbaio@vpwk.com'''


<h4 style='color:DodgerBlue'>Searching</h4>
<p>O uso da flag <b>r</b> antes de 'Rostam' é para informar o compilador  que caracteres dentro das aspas são considerados parte de uma regex e não precisam ser escapados com "\"

In [16]:
re.search(r'Rostam', cc_list)

<re.Match object; span=(32, 38), match='Rostam'>

Pode ser usado como condicional

In [17]:
if re.search(r'Rostam', cc_list):
    print('Found Rostam')

Found Rostam


<h4 style='color:DodgerBlue'>Character Sets</h4>

In [21]:
re.search(r'[a-zA-Z]+',cc_list)

<re.Match object; span=(0, 1), match='E'>

In [22]:
re.search(r'[a-zA-Z]{6}',cc_list)

<re.Match object; span=(5, 11), match='Koenig'>

In [36]:
re.findall(r'[a-zA-Z]+@[a-zA-Z]+\.com+',cc_list)

['ekoenig@vpwk.com', 'rostam@vpwk.com', 'ctomson@vpwk.com', 'bbaio@vpwk.com']

<h4 style='color:DodgerBlue'>Character Classes</h4>
<p> These are characters that represent a whole class of characters, like \w for character alphanumeric [a-zA-Z0-9] or \d for numbers

In [38]:
re.search(r'\w+',cc_list)

<re.Match object; span=(0, 4), match='Ezra'>

In [40]:
re.findall(r'\w+\@\w+\.\w+',cc_list)

['ekoenig@vpwk.com', 'rostam@vpwk.com', 'ctomson@vpwk.com', 'bbaio@vpwk.com']

<h4 style='color:DodgerBlue'>Groups</h4>
<p>Podemos criar grupos entre parenteses () , eles podem ser acessados com o objeto matched em ordem de aparecimento na regex

In [66]:
matched = re.search(r'(\w+)\@(\w+)\.(\w+)',cc_list)
print(matched.group(1))
print(matched.group(2))
print(matched.group(3))

ekoenig
vpwk
com


<h4 style='color:DodgerBlue'>Named Groups</h4> 
<p>Podemos dar nomes a esses grupos usando o ?P< nome >

In [65]:
matched = re.search(r'(?P<prim>\w+)\@(?P<segu>\w+)\.(?P<terc>\w+)',cc_list)
print(matched.group('prim'))
print(matched.group('segu'))
print(matched.group('terc'))

ekoenig
vpwk
com


<h4 style='color:DodgerBlue'>Find All</h4> 
<p Com o metodo finall a gente consegue encontrar todos os matches da regex

In [91]:
matched = re.findall(r'\w+@\w+.\w+',cc_list)
matched

['ekoenig@vpwk.com', 'rostam@vpwk.com', 'ctomson@vpwk.com', 'bbaio@vpwk.com']

In [90]:
matched = re.findall(r'(\w+)@(\w+).(\w+)',cc_list)
matched

[('ekoenig', 'vpwk', 'com'),
 ('rostam', 'vpwk', 'com'),
 ('ctomson', 'vpwk', 'com'),
 ('bbaio', 'vpwk', 'com')]

In [86]:
names = [ match[0] for match in matched  ]
names

['ekoenig', 'rostam', 'ctomson', 'bbaio']

<h4 style='color:DodgerBlue'>Find Iterator</h4> 
<p> Quando trabalhamos com arquivos longos como logs, não queremos analisar tudo de uma vez, para isso usamos o 'finditer'.
Esse metodo nos retorna o resultado quando encontrado para so apos retornar ao processamento para encontrar o proximo resultado. Isso é uma grande chance de deixar o nosso codigo mais rapido e menos clusterfucked.

In [102]:
matched = re.finditer(r'\w+@\w+.\w+',cc_list)
matched

<callable_iterator at 0x7fe8944ee2f0>

In [99]:
next(matched)

<re.Match object; span=(13, 29), match='ekoenig@vpwk.com'>

In [100]:
next(matched)

<re.Match object; span=(51, 66), match='rostam@vpwk.com'>

<b><p>Podemos tambem utilizar o metodo findint dentro de um for loop</p></b>

In [114]:
matched = re.finditer(r'(?P<name>\w+)@(?P<itc>\w+).(?P<com>\w+)',cc_list)

x = []
for i in matched:
    print(i.groupdict())


{'name': 'ekoenig', 'itc': 'vpwk', 'com': 'com'}
{'name': 'rostam', 'itc': 'vpwk', 'com': 'com'}
{'name': 'ctomson', 'itc': 'vpwk', 'com': 'com'}
{'name': 'bbaio', 'itc': 'vpwk', 'com': 'com'}


<h4 style='color:DodgerBlue'>Substitution</h4> 
<p>Alem de procurar e comparar tambem podemos substituir com a classe 're' e o metodo 'sub'

In [117]:
password = 1234
re.sub('\d' , '#' , f"O password que voce digitou é {password}")

'O password que voce digitou é ####'

In [123]:
matched = re.sub(r'(?P<nam>\w+)@(?P<itc>\w+).(?P<com>\w+)',r'\g<com>@\g<itc>.\g<nam>',cc_list)
print(matched)

Ezra Koenig <com@vpwk.ekoenig>, Rostam Batmanglij <com@vpwk.rostam>, Chris Tomson <com@vpwk.ctomson, Bobbi Baio <com@vpwk.bbaio


<h4 style='color:DodgerBlue'>Compiling</h4> 
<p> Ate agora usamos o modulo 're' diretamente com seus metodos, mas para performance (em caso de multiplas buscas no arquivo) a melhor opção é usar um objeto isntanciado do modulo. Para isso usamos o metodo 'compile'

In [127]:
regex = re.compile(r'(\w+)@(\w+).(\w+)')
regex.findall(cc_list)

[('ekoenig', 'vpwk', 'com'),
 ('rostam', 'vpwk', 'com'),
 ('ctomson', 'vpwk', 'com'),
 ('bbaio', 'vpwk', 'com')]

In [130]:
regex.search(cc_list)

<re.Match object; span=(13, 29), match='ekoenig@vpwk.com'>

<h2 style='color:gold'>Lazy Evaluation</h2>
<p>Lazy eval é usado para grandes quantidades de dados, é a ideia de ter apenas um resultado em memoria, sendo o espaço de memoria ser substituido pelo proximo resultado.

<h4 style='color:DodgerBlue'>Generators</h4> 
<p> Funçoes generator are similares ao builtin metodo range, onde os dados são resolvidos em partes, usamos o yeld ao inves do return.
<p> A função é chamada, o yeld dela é armazenado para ser utilizado na proxima chamada da função, objetivamernte salvando o valor da variavel para reprocessamento.

In [149]:
def fib():
    first = 0 
    last = 1
    while True:
        first , last = last , first + last
        yield first

f = fib()

In [150]:
next(f)

1

In [None]:
f = fib()

<p>Podemos tambem usar num loop setando um fim.

In [151]:
for x in f:
    print(x)
    if x > 12:
        break

1
2
3
5
8
13


<h4 style='color:DodgerBlue'>Generator Comprehensions</h4> 
<p>Podemos criar one-liner generators, a synthax é similar a list comprehessions, mas usamos () ao inves de [] 

In [158]:
list_nums = [ x for x in range(100)]

In [159]:
gen_nums = ( x for x in range(100))

In [160]:
gen_nums

<generator object <genexpr> at 0x7fe884d59cb0>

<p> Mesmo com um exmeplo pequeno podemos ver a diferença na memoria

In [163]:
import sys
sys.getsizeof(list_nums)

920

In [164]:
sys.getsizeof(gen_nums)

104

<h2 style='color:gold'>More IPython Features</h2>
<p>

<h4 style='color:DodgerBlue'>Using IPython to Run Unix Shell Commands</h4> 
<p>Provavelmente a ferramenta mais poderosa do ipython, usamos o character ! para identificar comandos do shell

In [165]:
var_ll = !ls -la

In [167]:
type(var_ll)

IPython.utils.text.SList

In [168]:
var_ll

['total 32',
 'drwxr-xr-x 3 andre andre  4096 Mar 15 10:27 .',
 'drwxr-xr-x 8 andre andre  4096 Mar 14 09:22 ..',
 'drwxr-xr-x 2 andre andre  4096 Mar 14 22:03 .ipynb_checkpoints',
 '-rw-r--r-- 1 andre andre 20451 Mar 15 10:27 Python Essentials for DevOps.ipynb']

<h4 style='color:DodgerBlue'>Using IPython magic commands</h4> 
<p> magic commands são atalhos bem poderosos que estão disponiveis no ipython, eles comecam com a tag %%

In [169]:
%%bash
uname -a
tail -n5 /etc/passwd

Linux vidalme-pc 5.15.133.1-microsoft-standard-WSL2 #1 SMP Thu Oct 5 21:02:42 UTC 2023 x86_64 x86_64 x86_64 GNU/Linux
_apt:x:105:65534::/nonexistent:/usr/sbin/nologin
uuidd:x:106:112::/run/uuidd:/usr/sbin/nologin
tcpdump:x:107:113::/nonexistent:/usr/sbin/nologin
andre:x:1000:1000:,,,:/home/andre:/bin/bash
dnsmasq:x:108:65534:dnsmasq,,,:/var/lib/misc:/usr/sbin/nologin


<p> O %%writefile é outro magic commando realmente é magico, voce pode escrever bash ou python commands e testa-lo de dentro do codigo, kkk, coisas que eu nem sabia que precisava... 

In [170]:
%%writefile print_time.py
#!/usr/bin/env python
import datetime
print(datetime.datetime.now().time())

Writing print_time.py


In [171]:
cat print_time.py

#!/usr/bin/env python
import datetime
print(datetime.datetime.now().time())


In [172]:
!python print_time.py

11:31:06.121544


<h2 style='color:firebrick'>Exercises</h2>
<p>

<p>Write a Python function that takes a name as an argument and prints that name.

In [175]:
def sayhi(n):
    print(f'Oi {n}, bom dia')
def namin():
    x = input('escreva seu nome: ')
    sayhi(x)
namin()

escreva seu nome:  asdasd


Oi asdasd, bom dia


<p>Write a Python function that takes a string as an argument and prints whether it
is upper- or lowercase.

In [176]:
def up_or_lo(n):
    if(n.islower()): print('o texto é lowercase')
    else: print('o texto é uppercase')

In [180]:
up_or_lo('andre')

o texto é lowercase


<p>Write a list comprehension that results in a list of every letter in the word smog‐
tether capitalized.

In [181]:
cap = [ l.upper() for l in 'smog-tether' ]

In [182]:
print(cap)

['S', 'M', 'O', 'G', '-', 'T', 'E', 'T', 'H', 'E', 'R']


<p>Write a generator that alternates between returning Even and Odd.

In [248]:
def parouimpar():
    par = 0
    while True:
        if par % 2 == 0: print('Essa é a vez do impar')
        else: print('Essa é a vez do par')
        par = par + 1
        yield par

    
valor = parouimpar()

In [249]:
next(valor)

Essa é a vez do impar


1

In [250]:
next(valor)

Essa é a vez do par


2

In [251]:
next(valor)

Essa é a vez do impar


3