# Capítulo 8 - Strings e dados do tipo texto

Esse capítulo fala de strings da biblioteca padrão do Python. Colocarei aqui apenas as partes que acho mais relevantes (ou mais fáceis de esquecer).

## Seção 8.5 - Formatação de strings

###  usando placeholders:

In [1]:
v = 'algo qualquer'
s = 'Aqui vai aparecer {}'

print(s.format(v))

Aqui vai aparecer algo qualquer


In [2]:
v0 = 'var0'
v1 = 'var1'
s = 'Aqui está a primeira variável: {0}. Aqui, a segunda: {1}. E agora vamos ver a primeira novamente: {0}'

print(s.format(v0, v1))

Aqui está a primeira variável: var0. Aqui, a segunda: var1. E agora vamos ver a primeira novamente: var0


In [3]:
s = f'Aqui está a primeira variável: {v0}. Aqui, a segunda: {v1}. E agora vamos ver a primeira novamente: {v0}'
print(s)

Aqui está a primeira variável: var0. Aqui, a segunda: var1. E agora vamos ver a primeira novamente: var0


### de números:

In [4]:
print('Pi: {}'.format(3.141592654))
print('Separador de milhar: {:,}'.format(3232))
print('{0:.2} e {0:.2%} significam a mesma coisa'.format(0.01))
print('{:08d}'.format(123))
print('{:07.2f}'.format(123.1))

Pi: 3.141592654
Separador de milhar: 3,232
0.01 e 1.00% significam a mesma coisa
00000123
0123.10


## Seção 8.6 - Expressões regulares (RegEx)

### correspondência de padrão

In [5]:
import re

num_tel = '123 456 7890'

m = re.match(pattern='\d{3}\s?\d{3}\s?\d{4}', string=num_tel)

print(m)
print('Encontrou?', bool(m))
print('Índice em que começa o match:', m.start())
print('Índice em que acaba o match:', m.end())
print('Span do match:', m.span())
print('A string encontrada:', m.group())

<re.Match object; span=(0, 12), match='123 456 7890'>
Encontrou? True
Índice em que começa o match: 0
Índice em que acaba o match: 12
Span do match: (0, 12)
A string encontrada: 123 456 7890


### encontrando todas as ocorrências

In [6]:
texto = 'Esse é um texto que 1 tem alguns dígitos 123 espalhados no meio. Vamos 34124 tentar pegar os números 13111'

m = re.findall(pattern='\d+', string=texto)

print(m)
print(type(m))

['1', '123', '34124', '13111']
<class 'list'>


### substituindo um padrão

In [7]:
texto = 'Esse é um texto que 1 tem alguns dígitos 123 espalhados no meio. Vamos 34124 tentar pegar os números 13111'

print(texto)

texto = re.sub(pattern='\d+', string=texto, repl='_')

print(texto)

Esse é um texto que 1 tem alguns dígitos 123 espalhados no meio. Vamos 34124 tentar pegar os números 13111
Esse é um texto que _ tem alguns dígitos _ espalhados no meio. Vamos _ tentar pegar os números _


### compilando um padrão

Em vez de usar diretamente, podemos pegar a expressão regular e compilá-la antes de utilizá-la. Isso é útil para aumentar o desempenho quando aplicado em bases de dados grandes:

In [8]:
texto = 'Esse é um texto que 1 tem alguns dígitos 123 espalhados no meio. Vamos 34124 tentar pegar os números 13111'

padrao = re.compile('\d+')

texto = padrao.sub(string=texto, repl='_')

print(texto)

Esse é um texto que _ tem alguns dígitos _ espalhados no meio. Vamos _ tentar pegar os números _
