# Strings

No passado foi mencionado que temos quatro tipos de dados: inteiro, real, lógico e texto/literal (_string_). Na verdade, o quarto tipo básico seria um _caractere_. Uma _string_ é uma **coleção** de caracteres - como se fosse uma lista, mas aceitando apenas elementos textuais.
Vamos verificar algumas propriedades das _strings_!

## Acessando elementos em uma _string_
No capítulo sobre Listas, vimos que podemos acessar elementos individuais de uma lista utilizando um índice entre colchetes. Vamos testar a mesma lógica com _strings_?

In [None]:
frase = "Let's Code"
print(frase[0])
print(frase[1])
print(frase[2])
print(frase[3])
print(frase[4])

Note que o programa acima imprime "Let's", com um caractere por linha. Ou seja, ele considerou frase[0] como "L", frase[1] como "e", e assim sucessivamente. Uma _string_ é, de fato, uma coleção de caracteres.

Porém, ao contrário de uma lista, dizemos que uma _string_ é **imutável**. Isso significa que não podemos alterar um elemento individual da _string_.
O programa abaixo produz um erro:

In [None]:
frase = "let's code"
frase[0] = 'L'

Para alterar uma _string_, é necessário **redefini-la**, de modo que a _string_ original será descartada e a nova (alterada) será escrita por cima da original. Ou, alternativamente, podemos gerar uma cópia da _string_ com alterações. Veremos mais detalhes adiante.

## Operações entre _strings_
Alguns operadores aritméticos funcionam com _strings_ também. Naturalmente, eles não servem para fazer contas, mas nos permitem fazer de forma intuitiva algumas operações bastante úteis.

O operador **+** serve como um operador de **concatenação** de _strings_: unir duas _strings_. Observe o exemplo abaixo: 

In [None]:
string1 = 'Olá'
string2 = 'Mundo'
resultado = string1 + string2
print(resultado) # Na tela: 'OláMundo'

Outro operador que funciona é o operador **\***. Este operador não é usado entre duas _strings_, mas entre uma _string_ e um **int**. Ele repetirá a _string_ o número de vezes dado pelo **int**.

In [None]:
string = 'Olá mundo!'
multi = string * 3
print(multi) # Na tela: 'Olá mundo!Olá mundo!Olá mundo!'

### Copiando uma _string_ através de concatenação
Caso você já tenha resolvido problemas de somatório (a essa altura, espera-se que tenha resolvido vários!), você já deve estar acostumado a utilizar um _loop_ onde novos valores são somados em uma mesma variável. Somar os números de uma lista, por exemplo, tem mais ou menos essa carinha:

```python
soma = 0
for numero in lista:
	soma = soma + numero
```

A mesma lógica pode ser aplicada a uma _string_:

In [None]:
string_inicial = 'Olá Mundo'
string_final = '' # cria uma string vazia
for letra in string_inicial:
	string_final = string_final + letra
print(string_final)

Isso é útil porque antes de "somar" cada letra à _string_ final podemos fazer alterações (como transformar em maiúscula ou minúscula, acrescentar caracteres entre 2 letras etc). É um jeito de fazer tratamento de _strings_. Veremos mais sobre tratamento de _strings_ no capítulo de funções de _strings_.


# Transformando uma _string_ em lista
_Strings_ são imutáveis, e isso pode nos dar um pouco de trabalho quando queremos fazer pequenas alterações, como forçar um caractere a ser maiúsculo ou acrescentar um caractere à _string_. Uma das formas de fazer envolve a "soma cumulativa" apresentada acima. Outra forma envolve transformar a nossa _string_ em lista, que é uma estrutura mutável. Execute o programa abaixo:

In [None]:
string = "let's Code"
lista = list(string)
lista[0] = 'L'
lista.append('!')
print(lista) 

Como a lista é mutável, nela conseguimos alterar uma letra e adicionar um símbolo ao final sem dificuldades! Porém, infelizmente nosso resultado é uma lista, o que não ficou muito legível para o usuário. Podemos resolver isso utilizando a função _join_. Veremos em breve como ele realmente funciona, mas por hora podemos utilizá-lo da seguinte maneira para transformar lista em _string_:

In [None]:
string_original = "let's Code"
lista = list(string_original)
lista[0] = 'L'
lista.append('!')
string_final = ''.join(lista) # antes do . temos uma string vazia
print(string_final)

Para as modificações mais comuns, temos algumas funções prontas que poderão ser bastante úteis!

## Símbolos especiais
Além de letras, números, sinais de pontuação, símbolos matemáticos etc, uma _string_ pode conter alguns operadores especiais de controle. Esses operadores podem indicar, por exemplo, uma quebra de linha ou uma tabulação. Vejamos os mais comuns:

### Quebra de linha
Uma quebra de linha indica que o programa exibindo a _string_ deverá quebrar a linha atual e exibir o restante da _string_ na linha seguinte, e é representada na maioria dos sistemas e na _web_ pelo símbolo ```\n```. Execute o programa abaixo e veja o resultado na tela:


In [None]:
print('Olá\nMundo')

### Tabulação
A tabulação indica um recuo equivalente ao da tecla _Tab_ - um recuo de início de parágrafo, ou o recuo que usamos para aninhar linhas de código em Python. Ela é representada pelo símbolo ```\t```. Verifique o resultado do exemplo abaixo:

In [None]:
aprovados = ['Mario', 'Peach', 'Luigi']
reprovados = ['Wario', 'Bowser']

print('Candidatos aprovados:')
for nome in aprovados:
    print('\t', nome)

print('Candidatos reprovados:')
for nome in reprovados:
    print('\t', nome)

### Barra
E se nós quiséssemos representar uma _string_ que explica o significado de ```\n```, por exemplo, como proceder? Afinal, ao ver o símbolo ```\n``` o programa entenderá que é uma quebra de linha e fará isso ao invés de escrever ```\n``` na tela. 

Podemos utilizar 2 barras: ```\\```. Ao fazermos isso, o programa entende que é para representar a barra na tela ao invés de interpretá-la como início de outro símbolo especial.

In [None]:
print('Utilizamos o \\n para quebrar linhas.')

### Aspas
Um problema que você deve ter se deparado é que parece impossível representar o símbolo ```'``` em uma _string_ que foi aberta por esse símbolo, já que a segunda ocorrência dele fechará a string. Idem para o símbolo ```"```. Podemos resolver isso da mesma forma que fizemos com a barra: ```\'``` irá sempre representar o símbolo ```'``` e ```\"``` irá sempre representar o símbolo ```"``` ao invés de fechar uma _string_.

In [None]:
print('Imprimindo uma aspa simples(\') dentro de uma string sem problemas')
print("Imprimindo aspas duplas(\") dntro de uma string sem problemas")

# Funções de strings

## Funções de _strings_
É possível fazer várias operações com _strings_ utilizando técnicas como concatenação ou converter em listas. Porém, certas operações são muito comuns e podem ser muito trabalhosas de fazer na mão. Por isso, temos diversas funções prontas para nos ajudar.

Note que como _strings_ são imutáveis, nenhuma dessas funções irá alterar a _string_ original. Elas sempre **retornarão** uma _string_ nova com as modificações desejadas.

Vejamos algumas das mais usadas.

### Maiúsculas e minúsculas
Temos algumas funções prontas para alterar a capitalização das letras. Uma delas é a função _upper_, que transforma todas as letras da _string_ original em maiúsculas:

In [None]:
frase = 'vAmOs PrOgRaMaR'
maiuscula = frase.upper()
print(maiuscula) # resultado: 'VAMOS PROGRAMAR'

Analogamente, temos a função _lower_ para transformar todas as letras em minúsculas:

In [None]:
frase = 'vAmOs PrOgRaMaR'
minuscula = frase.lower()
print(minuscula) # resultado: 'vamos programar'

Também é possível formatar a _string_ inteira como um nome próprio: primeira letra de cada palavra maiúscula, todo o restante minúscula. Para isso temos a função _title_:

In [None]:
frase = 'vAmOs PrOgRaMaR'
titulo = frase.title()
print(titulo) # resultado: 'Vamos Programar'

E, por fim, é possível tratar nossa _string_ como uma frase gramaticalmente correta: primeira letra maiúscula, todo o resto minúscula. Essa função é a _capitalize_:

In [None]:
frase = 'vAmOs PrOgRaMaR'
correta = frase.capitalize()
print(correta) # resultado: 'Vamos programar'

Uma utilidade para essas funções é padronizar entrada de usuário. Quando pedimos para o usuário digitar 'sim' caso ele deseje fazer algo, ele pode digitar 'SIM', 'sim', 'Sim', 'sIm', 'siM',  'SIm', 'sIM' ou 'SiM'. Prever todas essas condições em uma condicional pode ser bastante trabalhoso, ou mesmo impossível. Imagine se fosse uma _string_ de várias letras... Porém, podemos forçar um padrão para a entrada do usuário e comparar com esse padrão:

In [None]:
usuario = input('Digite "sim" se aceita os termos de uso: ')
if usuario.upper() == 'SIM':
    print('Seja bem-vindo!')
else:
    print('Que pena.') 

### Quebrando uma _string_
É possível separar uma _string_ em uma lista de _substrings_. Isso pode ser particularmente útil quando precisamos separar um texto em palavras individuais. A função que realiza essa quebra é o _split_:

In [None]:
texto = 'uma frase qualquer'
palavras = texto.split()
print(palavras) # resultado: ['uma', 'frase', 'qualquer']

O _split_ é mais do que apenas uma função para separar palavras. Podemos opcionalmente passar como parâmetro uma _string_ para ser usada como critério de separação: ao invés de quebrar no espaço em branco, a _string_ principal será quebrada nos pontos onde o parâmetro aparece (e ele será apagado do resultado final). 

Uma utilidade interessante para isso seria quando estamos interessados em ler dados formatados do teclado ou de um arquivo e pegar as informações que nos interessam. Imagine, por exemplo, que você queira que o usuário digite uma data no formato 'dd/mm/aaaa' e em seguida você precise separar dia, mês e ano em três variáveis do tipo **int**. Isso é possível com o _split_:

In [None]:
data = input('Digite uma data: ')
lista_data = data.split('/')
dia = int(lista_data[0])
mes = int(lista_data[1])
ano = int(lista_data[2])
print('Dia: ', dia)
print('Mês: ', mes)
print('Ano: ', ano)

### Substituindo elementos na _string_
Uma das ferramentas mais úteis em qualquer editor de texto é o _localizar e substituir_, onde podemos buscar por todas as ocorrências de uma expressão no texto e trocar por outra expressão.
Em Python temos uma função análoga, o _replace_. Ele recebe 2 parâmetros: a expressão a ser substituída e a expressão que a substituirá. Veja o exemplo:

In [None]:
frase = 'Python é difícil. Por ser difícil, devemos estudar.'
corrigida = frase.replace('difícil', 'fácil')
print(corrigida)

Em Python não existe uma função para deletar um pedaço de uma _string_. Porém, podemos usar o replace para substituir uma expressão por uma _string_ vazia, o que tem o mesmo resultado:



In [None]:
palavra = 'batata'
consoantes = palavra.replace('a', '')
print(consoantes)

### Concatenando _strings_ em uma coleção
Imagine que você tem uma coleção (por exemplo, uma lista) de _strings_ e precisa unir todas elas utilizando algum símbolo padrão como separador entre elas. Para isso temos o _join_. Ele soa pouco intuitivo no começo, então convém executar o exemplo e observar com atenção seu resultado:

In [None]:
lista = ['a', 'b', 'c']
separador = '123'
resultado = separador.join(lista)
print(resultado)

Já vimos o _join_ antes sendo usado para converter uma lista de volta em _string_. Para isso, utilizávamos uma _string_ vazia como separador. Assim, os elementos da lista eram concatenados sem separador. 
> **Dica:** um jeito de memorizar facilmente como o _join_ funciona é pensar que o separador entrará no lugar das vírgulas na visualização da lista.


## Formatando _strings_

### A função _format_

Todo mundo que já preencheu um contrato ou uma ficha de cadastro está familiar com textos nesse estilo:
> Eu, __________, portador do CPF ___________, residente no endereço _________________________ autorizo o procedimento.

Esse é o texto genérico que vale para todos, e cada um de nós em particular entende que deve preencher os campos em brancos com dados específicos (nome, CPF e endereço, no exemplo acima). 

Existe uma função em Python para realizar esse tipo de preenchimento de texto: o _format_. Suponha que você tenha dados em diferentes variáveis e precisa que todos eles apareçam em uma _string_.  Basta criar uma _string_ com os "espaços em branco" para serem preenchidos e passar as variáveis para a função. Os espaços em branco são representados por chaves (**{}**).


In [None]:
nome = input('Digite seu nome: ')
cpf = input('Digite seu cpf: ')
endereco = input('Digite seu endereço: ')
contrato = 'Eu, {}, portador do CPF {}, residente no endereço {} autorizo o procedimento.'
contrato_preenchido = contrato.format(nome, cpf, endereco)
print(contrato_preenchido)

Porém, o grande charme não está apenas em preencher - isso poderia ser feito concatenando com o operador **+**. Nós podemos colocar opções de formatação nos nossos dados, como número de casas em um número. 

Imagine que você queira exibir uma data no formato dd/mm/aaaa. Em situações normais, dias e meses inferiores a 10 apareceriam com apenas 1 casa (**int** não é representado com zeros à esquerda). Porém, podemos especificar no _format_ que gostaríamos de representar um inteiro com 2 casas, preenchendo com zero casas em branco.

In [None]:
dia = 1
mes = 2
ano = 2020
data = '{:02d}/{:02d}/{:04d}'.format(dia, mes, ano)
print(data)

Vamos entender o que está dentro das chaves: o símbolo **:** indica que passaremos opções. O símbolo 'd' indica que estamos representando números inteiros em base decimal (dígitos de 0 a 9). Os símbolos '2' e '4' indicam, respectivamente, 2 casas ou 4 casas. E o símbolo '0' indica que se faltar dígitos, os espaços devem ser preenchidos com zero.

Vejamos outro exemplo, dessa vez com casas decimais. É normal postos de gasolina mostrarem o preço do litro com 3 casas decimais. Mas o preço final a ser cobrado deverá ter 2 casas. Porém, ao multiplicar o preço por litro pelo valor em litros, é provável que o total dê várias casas decimais. Usaremos o _format_ para representar com apenas 2 casas.

In [None]:
preco_litro = 5.234
litros = 29.5
total = preco_litro * litros
print(total) 

preco_final = 'R$ {:.2f}'.format(total)
print(preco_final) 

Neste caso, o 'f' indica que o número é **float**.  Já o '.2' indica que queremos 2 casas após o ponto decimal. Note que ele não apenas descarta as casas excedentes, e sim arredonda corretamente o número.
> O _format_ possui tantas opções diferentes que existe um site inteiro dedicado a explicar e dar exemplos: [https://pyformat.info/](https://pyformat.info/)

### _f-strings_
A função _format_ já se mostrou bastante poderosa, e vimos como ela facilita muito nossa vida. Ela não apenas diminui nosso trabalho para concatenar múltiplas informações em uma única string, como ainda aceita opções diversas de formatação para cada uma das informações. Mas dá para ir um passo além.

Ao colocarmos o caractere ```f``` imediatamente antes de abrir aspas para criar uma string, essa string irá se comportar de maneira muito semelhante à máscara de um _format_, e não será necessário chamar o _format_. Podemos colocar o nome de variáveis entre chaves para inseri-las automaticamente na string:

In [None]:
nome = input('Digite seu nome: ')
cpf = input('Digite seu cpf: ')
endereco = input('Digite seu endereço: ')
contrato = f'Eu, {nome}, portador do CPF {cpf}, residente no endereço {endereco} autorizo o procedimento.'
print(contrato)

Inclusive podemos utilizar as mesmas opções de formatação do _format_ diretamente nas _f-strings_:

In [None]:
preco_litro = 5.234
litros = 29.5
total = preco_litro * litros
print(total) # resultado: 154.403

preco_final = f'R$ {total:.2f}'
print(preco_final) # resultado: R$ 154.40

Desde o seu lançamento, as _f-strings_ vem se tornando cada vez mais populares, tornando o uso do _format_ menos comum.

# Exercícios

Faça um programa que peça para o usuário digitar uma palavra e imprima cada letra em uma linha.

In [1]:
palavra = input("Digite uma palavra: ")

for letra in palavra:
    print(letra)

o
l
a


Faça um programa que pede para o usuário digitar uma palavra e cria uma nova string igual, copiando letra por letra a palavra digitada, depois imprima a nova string.

In [4]:
palavra = input("Digite uma palavra: ")
nova_palavra = ""

for letra in palavra:
    nova_palavra += letra

print(nova_palavra)

ola


Altere o exercício anterior para que a string copiada alterne entre letras maiúsculas e minúsculas.

Exemplo: se o usuário digitar "latex" o programa deve imprimir "LaTeX".

In [6]:
palavra = input("Digite uma palavra: ").lower()
nova_palavra = ""

for indice in range(len(palavra)):
    nova_palavra += palavra[indice] if indice % 2 == 1 else palavra[indice].upper()

print(nova_palavra)

LaTeX


Faça um programa que pede para o usuário digitar uma palavra e cria uma nova string igual, porém com espaço entre cada letra, depois imprima a nova string:

Exemplo: se o usuário digitar "python" o programa deve imprimir "p y t h o n "

In [7]:
palavra = input("Digite uma palavra: ")
nova_palavra = " ".join(list(palavra))
print(nova_palavra)

p y t h o n


Faça uma função que receba uma string e retorne uma nova string substituindo:

'a' por '4'

'e' por '3'

'I' por '1'

't' por '7'

In [11]:
def sustitui_letras(texto):
    dict_substituicao = {
        "a": "4",
        "e": "5",
        "I": "1",
        "t": "7"
    }
    for letra in dict_substituicao:
        texto = texto.replace(letra, dict_substituicao[letra])
    return texto

In [12]:
sustitui_letras("Inicio Bem teto ola")

'1nicio B5m 757o ol4'

Faça uma função que recebe uma string e retorna ela ao contrário.

Exemplo: Recebe "teste" e retorna "etset".

Agora faça uma função que recebe uma palavra e diz se ela é um palíndromo, ou seja, se ela é igual a ela mesma ao contrário.

Dica: use a função do exercício anterior.

Faça uma função que receba um texto e uma palavra, então verifique se a palavra está no texto, retornando True ou False.



In [25]:
def is_word_in_text(text, word):
    return word.lower() in text.lower().split()

In [26]:
is_word_in_text("ola Mundo", "mu")

['ola', 'mundo']


False

Faça uma função que receba uma string que contém tanto números quanto letras e caracteres especiais, e que separe as letras em uma variável e os números em outra (os caracteres especiais podem ser descartados). Ao final a função deve imprimir as duas variáveis.

In [29]:
def filtra_numeros_letras(texto):
    letras = ""
    numeros = ""

    for caracter in texto:
        if caracter.isdigit():
            numeros += caracter
        elif caracter.isalpha():
            letras += caracter

    print(numeros)
    print(letras)

In [40]:
def filtra_numeros_letras(texto):
    letras = ""
    numeros = ""

    for caracter in texto:
        if "0" <= caracter <= "9":
            numeros += caracter
        elif "a" <= caracter <= "z" or "A" <= caracter <= "Z":
            letras += caracter

    print(numeros)
    print(letras)

In [41]:
filtra_numeros_letras("A5@a5@a5@")

555
Aaa


Desafio - Faça uma função que receba uma string e uma letra e:

a. imprima quantas vezes a letra aparece na string;

b. imprima todas as posições em que a letra aparece na string;

c. retorne a distância entre a primeira e a última aparição dessa letra na string.

In [46]:
def desafio1(texto, letra):
    posicoes = []
    lista_texto = list(texto)
    offset = 0

    while letra in lista_texto:
        posicoes.append(lista_texto.index(letra) + offset)
        lista_texto.remove(letra)
        offset += 1

    distancia = posicoes[-1] - posicoes[0]

    print(texto.count(letra))
    print(posicoes)
    print(distancia)


In [47]:
desafio1("abcabcabc", "a")

3
[0, 3, 6]
6


Desafio - faça uma função que criptografa uma mensagem substituindo cada letra pela letra oposta do dicionário:

'a' por 'z'

'b' por 'y'

'c' por 'x'

In [50]:
def criptografa(mensagem):
    alfabeto = list("abcdefghijklmnopqrstuvwxyz")
    alfabeto_invertido = list(alfabeto[::-1])

    mensagem_criptografada = ""
    for letra in mensagem:
        mensagem_criptografada += alfabeto_invertido[alfabeto.index(letra)]

    return mensagem_criptografada

In [51]:
criptografa("abc")

'zyx'