**Objetivos**

Este capítulo abordará:
1. Obtenção de subconjuntos de strings.
2. Métodos de string.
3. Formatação de strings.
4. Expressões regulares.

**Nota**: consulte os *links* a seguir:
* www.rexegg.com/regex-python.html
* www.rexegg.com/regex-best-trick.html

In [1]:
word = "Python para psicólogos"
word[::2]

'Pto aapióoo'

In [2]:
"black Knight".capitalize()

'Black knight'

In [3]:
"Uma uva é uma fruta muito engraçada".count("u")

4

In [4]:
"Python para psicólogos".startswith("Python")

True

In [5]:
"Python para psicólogos".endswith("ogos")

True

In [6]:
"Python".find("h")

3

In [7]:
"Python".index("a")

ValueError: substring not found

In [8]:
"Python is fun".isalpha()

False

In [9]:
"42".isdecimal()

True

In [10]:
"tartaro14".isalnum()

True

In [11]:
"Python para psicólogos".lower()

'python para psicólogos'

In [12]:
"Python para psicólogos".upper()

'PYTHON PARA PSICÓLOGOS'

In [13]:
"Python para psicólogos".replace("Python", "JavaScript")

'JavaScript para psicólogos'

In [14]:
" minhasenhacomespaços   ".strip()

'minhasenhacomespaços'

In [16]:
"minha-senha-com-hífens".split(sep = "-")

['minha', 'senha', 'com', 'hífens']

In [20]:
"vamos centralizar este texto?".center(50)

'          vamos centralizar este texto?           '

In [23]:
"42".zfill(5)

'00042'

In [25]:
dia = "22"
mes = "08"
ano = "2022"
hora = "10"
minuto = "07"
segundo = "00"

data = "-".join([dia, mes, ano, hora, minuto, segundo])
data

'22-08-2022-10-07-00'

In [28]:
# o 0 em {0:.4} e em {0:.4%} refere-se ao índice 0 nesse formato
# 0 .4 refere-se à quantidade de valores decimais, 4;
# se especificarmos um %, o decimal será formatado com uma porcentagem
print("Eu lembro de {0:.4} ou {0:.4%} do que Lu Chao recitou." .format(7/67890))

Eu lembro de 0.0001031 ou 0.0103% do que Lu Chao recitou.


In [29]:
print("Meu número de ID é {0:05d}." .format(42))

Meu número de ID é 00042.


| Sintaxe | Descrição |
| :-: | :- |
| . | Faz a correspondência com qualquer caractere único. |
| ^ | Faz a correspondência no início de uma string. |
| $ | Faz a correspondência no final de uma string. |
| * | Faz a correspondência com zero ou mais repetições do caractere anterior. |
| + | Faz a correspondência com uma ou mais repetições do caractere anterior. |
| ? | Faz a correspondência com zero ou uma repetição do caractere anterior. |
| {m} | Faz a correspondência com `m` repetições do caractere anterior. |
| {m,n} | Faz a correspondência com o caractere anterior, qualquer número de vezes de `m` a `n`. |
| \ | Caractere de escape. |
| [ ] | Um conjunto de caracteres (por exemplo, `[a-z]` fará correspondência com todas as letras de `a` a `z`. |
| `I` | OU; A`I`B fará a correspondência com A ou com B. |
| ( ) | Faz a correspondência exata com o padrão especificado nos parênteses. |






| Função | Descrição |
| :-: | :- |
| search | Encontra a primeira ocorrência de uma string. |
| match | Faz a correspondência no íncio de uma string. |
| fullmatch | Faz a correspondência com toda a string. |
| split | Divide a string de acordo com o padrão. |
| findall | Encontra todas as correspondências de uma string que não se sobreponham. |
| finditer | Semelhante a `findall`, mas devolve um iterador Python. |
| sub | Substitui o padrão correspondente pela string especificada. |

In [30]:
import re
tele_num = "1234567890"

# busca padrão de 10 dígitos consecutivos
m = re.match(pattern = "\d\d\d\d\d\d\d\d\d\d", string = tele_num)
print(type(m))

<class 're.Match'>


In [31]:
print(m)

<re.Match object; span=(0, 10), match='1234567890'>


In [32]:
# houve correspondência?
print(bool(m))

True


In [33]:
# deve exibir match
if m:
    print("match")
else:
    print("no match")

match


In [34]:
# onde começa a correspondência?
print(m.start())

0


In [35]:
# onde termina a correspondência?
print(m.end())

10


In [36]:
# onde começa e termina a correspondência?
print(m.span())

(0, 10)


In [37]:
# qual é a string que deu match com o padrão buscado?
print(m.group())

1234567890


In [38]:
tele_num_spaces = "61 98160 2897"

m = re.match(pattern = "\d{10}", string = tele_num_spaces)
print(m)

None


In [39]:
if m:
    print("match")
else:
    print("no match")

no match


In [41]:
# modificando a RegEx anterior
my_pattern = "\d{2}\s?\d{5}\s?\d{4}"
m = re.match(pattern = my_pattern, string = tele_num_spaces)
print(m)

<re.Match object; span=(0, 13), match='61 98160 2897'>


In [42]:
my_number = "(61) 98160-2897"

my_pattern = "\(?\d{2}\)?\s?\d{5}\s?-?\d{4}"
m = re.match(pattern = my_pattern, string = my_number)
print(m)


<re.Match object; span=(0, 15), match='(61) 98160-2897'>


In [43]:
p = "\d+"
# python concatenará duas strings uma ao lado da outra
s = """"13 Jodie Whittaker, war John Hurt, 12 Petter Capaldi,
11 Math Smith, 10 David Tennant, 9 Christopher Eccleston"""

m = re.findall(pattern = p, string = s)
print(m)

['13', '12', '11', '10', '9']


In [45]:
multi_str = """Guard: What? Ridden on a horse?
King Arthur: Yes!
Guard: You're using coconuts!
King Arthur: What?
Guard: You've got... coconut[s] and you're bangin' 'em together."""

p = "\w+\s?\w+:\s?"
s = re.sub(pattern = p, string = multi_str, repl = "")
print(s)

What? Ridden on a horse?
Yes!
You're using coconuts!
What?
You've got... coconut[s] and you're bangin' 'em together.


In [46]:
# imprime falas do guarda
guard = s.splitlines()[::2]
print(guard)

['What? Ridden on a horse?', "You're using coconuts!", "You've got... coconut[s] and you're bangin' 'em together."]


In [47]:
# imprime falas do rei arthur
kinga = s.splitlines()[1::2]
print(kinga)

['Yes!', 'What?']
