<div align="right" style="text-align:right"><a rel="license" href="http://creativecommons.org/licenses/by-nc-nd/4.0/"><img alt="Licença Creative Commons" style="border-width:0; float:right" src="https://i.creativecommons.org/l/by-nc-nd/4.0/88x31.png" /></a><br><br><i>Prof. Marcelo de Souza</i><br>marcelo.desouza@udesc.br</div>

# Manipulação de strings

Neste material, veremos diversas operações úteis sobre strings.

---

## Tamanho de uma string

In [1]:
print(len('abc'))
print(len(''))
print(len('Um texto um pouco maior!'))

3
0
24


## Acesso a caracteres

In [2]:
s = 'Minha string!'
print(s[0])
print(s[1])
print(s[2])
print('[...]')
print(s[len(s)-2])
print(s[len(s)-1])

M
i
n
[...]
g
!


## Fatiamento de strings

O comando ``s[i:j]`` acessa a fatia da string ``s`` compreendendo os caracteres de ``i`` até ``j-1``.

In [4]:
s = 'Ibirama'
print(s[0:2])
print(s[2:6])

Ib
iram


Podemos omitir o primeiro índice, ``s[:j]``, fatiando a string desde seu início até o índice ``j-1``. Da mesma forma, ao omitir o segundo índice, ``s[i:]``, fatiamos a string desde o índice ``i`` até o final.

In [5]:
s = 'Programar é legal!'
print(s[:8])
print(s[5:])

Programa
amar é legal!


Ao usar índices negativos, indicamos posições a partir da direita (i.e. do final da string). A posição -1 é o último caractere, -2 é o penúltimo, etc.

In [6]:
s = 'Palmeiras'
print(s[0:-2]) # Removendo os dois últimos caracteres
print(s[-1:])  # Fatiando do último caractere até o final da string
print(s[-3:])  # Mesma operação com os três últimos caracteres
print(s[-6:7])

Palmeir
s
ras
meir


## Verificação parcial de strings

In [1]:
nome = 'Maria da Silva'

print(nome.startswith('Mari'))
print(nome.startswith('mari'))
print(nome.endswith('Silv'))
print(nome.endswith('Silva'))

True
False
False
True


## Conversão de maiúsculas a minúsculas

In [2]:
texto = 'O céu é azul'

print(texto.upper())
print(texto.lower())

print(texto.upper().startswith('O CÉU'))
print(texto.lower().startswith('O céu'))

O CÉU É AZUL
o céu é azul
True
False


## Verificação de conteúdo

In [9]:
texto = 'O céu é azul'

print('céu' in texto)
print('Céu' in texto)
print('a' in texto)

palavra = 'azul'
if palavra in texto:
    print(f'A palavra {palavra} aparece no texto!')
    
print('verde' not in texto)
print(palavra not in texto)
print('Céu'.upper() in texto.upper())

True
False
True
A palavra azul aparece no texto!
True
False
True


## Contagem de conteúdo

In [10]:
texto = 'O céu é azul'
print(texto.count('a'))
print(texto.count('é'))
print(texto.count('e'))

num = texto.count('u')
print(f'Existem {num} ocorrências da letra u no texto')

palavra = 'azul'
print(texto.count('azul'))
texto = 'O céu é azul. O planeta terra é azul!'
print(texto.count('azul'))

1
2
0
Existem 2 ocorrências da letra u no texto
1
2


## Busca de conteúdo

In [11]:
texto = 'O céu é azul'
print(texto.find('céu'))   # retorna o índice onde o conteúdo (string) foi encontrado
print(texto.find('Céu'))   # retorna -1 se o conteúdo (string) não foi encontrado

texto = 'O céu é azul. O céu é bonito.'
print(texto.find('céu'))   # retorna o índice da primeira ocorrência do conteúdo

# podemos iniciar a busca pelo fim (direita), encontrando a última ocorrência do conteúdo
print(texto.rfind('céu'))

# podemos limitar a busca, informando uma posição de início
print(texto.find('céu', 3))

# podemos limitar a busca, informando uma posição de início e outra de fim
print(texto.find('céu', 3, 15))

# se quisermos buscar todas as ocorrências, usamos os comandos acima com um laço de repetição
texto = 'O céu é azul. O céu é bonito. O céu é demais!'
indice = 0
while indice != -1:
    indice = texto.find('céu', indice)
    if indice >= 0:
        print(f'Palavra encontrada na posição {indice}.')
        indice += 1

2
-1
2
16
16
-1
Palavra encontrada na posição 2.
Palavra encontrada na posição 16.
Palavra encontrada na posição 32.


## Alinhamento de strings

In [12]:
palavra = 'UDESC'
centralizado = palavra.center(10)
esquerda = palavra.ljust(10)
direita = palavra.rjust(10)
print('|' + centralizado + '|')
print('|' + esquerda + '|')
print('|' + direita + '|')

# podemos preencher os espaços em branco com um caractere desejado
print('Universidade:' + palavra.rjust(15, '.'))

|  UDESC   |
|UDESC     |
|     UDESC|
Universidade:..........UDESC


## Quebra/separação de strings

In [26]:
texto = 'O céu é azul'
separado = texto.split(' ')
print(separado)
separado = texto.split()
print(separado)
print()

texto = 'O@céu@é@azul'
separado = texto.split('@')
print(separado)
print(separado[0])
print(separado[2])
print()

texto = 'O céu\né azul\ne bonito!'
print(texto)
linhas = texto.split('\n')
print(linhas)
linhas = texto.splitlines()
print(linhas)
print()

# considere a seguinte string contendo idades de pessoas 'José: 43; Maria: 38; Ana: 21'
dados = 'José: 43; Maria: 38; Ana: 21'
dados = dados.split('; ')
print(dados)
for dado in dados:
    dado = dado.split(': ')
    nome = dado[0]
    idade = int(dado[1])
    print(dado[0], dado[1])

['O', 'céu', 'é', 'azul']
['O', 'céu', 'é', 'azul']

['O', 'céu', 'é', 'azul']
O
é

O céu
é azul
e bonito!
['O céu', 'é azul', 'e bonito!']
['O céu', 'é azul', 'e bonito!']

['José: 43', 'Maria: 38', 'Ana: 21']
José 43
Maria 38
Ana 21


## Substituição de strings

In [36]:
texto = 'O céu é azul'
print(texto.replace('céu', 'mar'))
print(texto)   # perceba que a variável não é alterada
texto = texto.replace('céu', 'mar')
print(texto)   # agora sobrescrevemos o conteúdo da variável, alterando-a
print()

print(texto.replace('a', '*'))
print(texto.replace('O', 'The'))
print(texto)
print()

# podemos definir quantas ocorrências serão substituídas
texto = 'O céu é azul. O céu é bonito. O céu é demais!'
print(texto.replace('céu', '---', 1))
print(texto.replace('céu', '---', 2))
print(texto.replace('céu', '---', 3))
print(texto.replace('céu', '---', 4))

O mar é azul
O céu é azul
O mar é azul

O m*r é *zul
The mar é azul
O mar é azul

O --- é azul. O céu é bonito. O céu é demais!
O --- é azul. O --- é bonito. O céu é demais!
O --- é azul. O --- é bonito. O --- é demais!
O --- é azul. O --- é bonito. O --- é demais!


## Remoção de caracteres das extremidades

In [53]:
# remoção de espaços em branco
texto = '   UDESC  '
print('|' + texto + '|')
print('|' + texto.strip() + '|')
print('|' + texto.lstrip() + '|')
print('|' + texto.rstrip() + '|')
print('|' + texto + '|')
print()

# remoção de outros caracteres
texto = '---...UDESC---...'
print(texto)
print(texto.strip('.'))
print(texto.strip('-'))
print(texto.strip('-.'))
print(texto.lstrip('-.'))
print(texto.rstrip('-.'))

|   UDESC  |
|UDESC|
|UDESC  |
|   UDESC|
|   UDESC  |

---...UDESC---...
---...UDESC---
...UDESC---...
UDESC
UDESC---...
---...UDESC


## Validação de conteúdo

In [14]:
vazio = ''
numero = '132'
numero_ponto = '132.7'
frase = 'O céu é azul'
palavra = 'Pacífico'

# verificar se todos os caracteres são letras ou números
print(vazio.isalnum(), end = ' ')
print(numero.isalnum(), end = ' ')
print(frase.isalnum(), end = ' ')
print(palavra.isalnum(), end = ' ')
print()

# verificar se todos os caracteres são letras (incluindo acentuadas)
print(vazio.isalpha(), end = ' ')
print(numero.isalpha(), end = ' ')
print(frase.isalpha(), end = ' ')
print(palavra.isalpha(), end = ' ')
print()

# verificar se todos os caracteres são números
print(vazio.isdigit(), end = ' ')
print(numero.isdigit(), end = ' ')
print(frase.isdigit(), end = ' ')
print(palavra.isdigit(), end = ' ')
print()

# verificar se os caracteres são minúsculos ou maiúsculos
a = 'Olá'
b = 'OLÁ'
c = 'olá'

print(a.isupper(), end = ' ')
print(b.isupper(), end = ' ')
print(c.isupper(), end = ' ')
print()

print(a.islower(), end = ' ')
print(b.islower(), end = ' ')
print(c.islower(), end = ' ')
print()

# verificar se todos os caracteres são de espaçamento
a = '\t\n\r  '
b = '\tOlá\n '
print(a.isspace(), end = ' ')
print(b.isspace(), end = ' ')
print()

# verificar se algum caractere não é impresso em tela
a = 'Texto\n'
b = 'Olá'
print(a.isprintable(), end = ' ')
print(b.isprintable(), end = ' ')

False True False True 
False False False True 
False True False False 
False True False 
False False True 
True False 
False True 

## Composição de strings

Consiste em criar um modelo através de uma string, no qual inserimos dados para compor a string final que será apresentada em tela ou armazenada.
+ A composição substitui a concatenação de strings e é útil em muitos casos, como para apresentar dados em tela.

Primeiro, definimos a string modelo, usando o símbolo ``%`` para indicar posições que serã completadas com dados. Após o símbolo ``%`` devemos indicar o tipo de dado que será inserido, usando um dos seguintes caracteres de idenficiação:
+ ``%d``: inteiro
+ ``%s``: string
+ ``%f``: float

Finalmente, usamos mais um caractere ``%`` para separar a string modelo dos dados para preenchimento, os quais são informados (quando mais que um) entre parêntesis e separados por vírgula.

In [7]:
nome = 'Maria'
idade = 31
salario = 8237.61

s = 'Seu nome é %s. Ela tem %d anos de idade e seu salário é de R$ %f' % (nome, idade, salario)
print(s)

a = 8.5
b = 9
print('A multiplicação de %f por %f é %f!' % (a, b, a * b))

Seu nome é Maria. Ela tem 31 anos de idade e seu salário é de R$ 8237.610000
A multiplicação de 8.500000 por 9.000000 é 76.500000!


Podemos definir configurações para a forma de apresentação dos dados inserindo comandos entre o caractere ``%`` e o caractere de definição do tipo (``d``, ``s`` ou ``f``).

Exemplos:
+ ``%03d`` define que o número ocupe 3 dígitos e adicione zeros à esquerda, quando necessário;
+ ``%3d`` é similar ao anterior, mas sem adicionar os zeros;
+ ``%5.2f`` define que o float vai ocupar 5 posições, sendo duas delas para a parte decimal.

In [8]:
numero = 12
valor = 7.3

print('[%d]' % numero)
print('[%03d]' % numero)
print('[%3d]' % numero)
print('[%-3d]' % numero) # Usando o símbolo - inserimos o espaço à direita do número

print('%f' % valor)
print('[%5.2f]' % valor)
print('[%-10.3f]' % valor)
print('[R$ %.2f]' % valor)

[12]
[012]
[ 12]
[12 ]
7.300000
[ 7.30]
[7.300     ]
[R$ 7.30]
