## Trabalhando com Strings

### O que são strings?

Começaremos explorando as strings. As strings são sequências de caracteres que utilizamos para representar algum texto. Elas podem ser delimitadas por aspas simples ou duplas, a depender da preferência ou do contexto de uso. Além disso, podemos utilizar aspas triplas para representar strings maiores, que incluem múltiplas linhas e quebras de linha.

In [None]:
mensagem = 'Olá, mundo!'
mensagem = "Python é incrível!"

texto = """Essa é uma string
que pode ter múltiplas
linhas."""


### Métodos de manipulação

Ao trabalhar com strings, é comum querer alterar ou manipular o texto de alguma forma. Para isso, o Python oferece métodos de manipulação responsáveis por transformar, modificar ou analisar o texto das strings. A tabela abaixo apresenta os principais métodos de manipulação:  

![image.png](attachment:image.png)

Inicialmente, temos o método strip(), que remove espaços em branco ou caracteres especificados do início e do final da string. Em seguida, temos o método lower(), que converte todos os caracteres da string para letras minúsculas.  

Abaixo, o método upper() converte para letras maiúsculas, e por fim, temos o método replace(), que substitui uma substring por outra na string.  

Lembre-se! Uma substring é uma string menor dentro de uma string maior.  

### O que são f-strings?  

Além desses métodos de manipulação, podemos incluir uma expressão ou variável em uma string. Para isso, usamos as f-strings do Python, que possuem a sintaxe da letra f e, entre aspas duplas e chaves, inserimos a variável desejada. Vamos entender isso melhor com um exemplo de código?



In [None]:
estudante = "Pedro"
nota = 10
mensagem = f"{estudante} tirou a nota {nota}!"

print(mensagem)


Pedro tirou a nota 10!


Criamos um código que informa o estudante e sua respectiva nota, colocando tudo em uma única string. Para representar isso, criamos uma variável responsável por armazenar o nome da pessoa estudante e outra por armazenar a nota.

A variável mensagem contém a string formatada, então usamos o f e, entre aspas duplas, passamos a string com as variáveis estudante e nota entre chaves.

Ao chamar print(mensagem), o texto "Pedro tirou a nota 10" será exibido.

### Indexação de strings  

Além de métodos e f-strings, podemos acessar um caractere individual de uma string usando a indexação de strings por meio de índices. Os índices começam no valor 0, representando o primeiro caractere da string, e utilizamos colchetes para declará-los:

In [None]:
texto = "Python"

print(texto[5])
print(texto[-1])


n
n


![image.png](attachment:image.png)

Temos a variável texto armazenando a string "Python". No primeiro print(), chamamos a variável texto e passamos, entre colchetes, o valor 5, que corresponde ao último índice da string. A palavra "Python" tem os índices 0, 1, 2, 3, 4, 5. Ao imprimir o índice 5, obtemos a letra "n".

Observação: também podemos trabalhar com índices negativos, como -1, por exemplo. Nesse caso específico, acessaremos o mesmo caractere "n" utilizando os índices 5 e -1.

### O que é slicing?  

A operação de slicing (fatiamento) permite extrair um pedaço da string.

A sintaxe do slicing envolve uma string seguida de abertura e fechamento de colchetes, que envolvem um valor inicial separado de um valor final por dois pontos (:). Também podemos definir um passo, que é o intervalo entre os índices, sendo essa uma informação opcional.

O índice de fim não está incluso na string final.

**string[início:fim:passo]**   

Vamos analisar um exemplo prático de slicing?

In [None]:
texto = "Python"

print(texto[1:4])
print(texto[:3])
print(texto[::2])


yth
Pyt
Pto


O código começa com a declaração da variável texto armazenando a string "Python", seguida de alguns print() que realizam a operação de slicing.  

- No primeiro print(), extraímos os caracteres da posição 1 até a posição 3, definindo o início como 1 e o final como 4, resultando na string "yth".

![image.png](attachment:image.png)

- Já no segundo slicing, não definimos o início, então o Python interpreta como se começasse no índice 0. Nesse caso, definimos o fim como 3, extraindo os três primeiros caracteres, o que resulta na string "Pyt" como retorno.

Para concluir, no último print(), realizamos o slicing sem definir início ou fim, mas com um passo definido como 2, resultando na string "Pto".  

![image-2.png](attachment:image-2.png)  

### Conhecendo o operador in  

Outro operador interessante é o in, que verifica se uma substring está presente em uma string.

In [None]:
texto = "Python"

print("Py" in texto)

print("Java" in texto)


True
False


Novamente, temos texto armazenando "Python". No primeiro print(), verificamos se a substring "Py" está presente usando in texto. Como essa informação é verdade, o print() retorna True. No último print(), verificamos se "Java" está presente; como é falso, o print() exibe False.

### Conhecendo o método startswith()  

O método startswith() verifica se a string começa com uma substring específica, retornando True ou False como resposta.

In [None]:
texto = "Python"

print(texto.startswith("Py"))

print(texto.startswith("py"))


True
False


No código acima, o primeiro print() verifica se texto começa com "Py", e o resultado é True. Já no segundo print(), verificamos com "py" em minúsculo, resultando em False devido à diferenciação entre maiúsculas e minúsculas no Python.

### Conhecendo o método endswith()  

Por fim, o método endswith() verifica se a string termina com uma substring específica.

No exemplo de código abaixo, verificamos se a string termina com "on", resultando em True. Da mesma forma, verificamos se ela termina com "ton", resultando em False.

In [None]:
texto = "Python"

print(texto.endswith("on"))

print(texto.endswith("ton"))


True
False


## Trabalhando com Regex

Regex significa expressões regulares

In [None]:
import re

texto = "Entre em contato pelo email support@example.com"

padrao_email = r'[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}' # esse código é um padrão

resultado = re.search(padrao_email, texto)

if resultado:
    print("Email encontrado:", resultado.group())
else:
    print("Nenhum email encontrado.")


Email encontrado: support@example.com


## Exercícios

### Ajustando nomes de produtos
#### Colocando tudo em minúsculo

Victor trabalha em um sistema de e-commerce e precisa organizar os nomes dos produtos que estão sendo cadastrados pelos lojistas.    
Esses nomes geralmente vêm com letras misturadas entre maiúsculas e minúsculas, além de espaços desnecessários no início e no final.  

Ajude Victor a criar um programa que receba um nome de produto e o padronize, deixando todas as letras minúsculas e removendo os espaços extras.  

- Exemplo de Entrada:  

Digite o nome do produto: ChocoLAte Branco  

Saída esperada: chocolate branco


----------------------------------------------------

Podemos usar os métodos strip() e lower() para resolver o problema. O método strip() remove os espaços extras no início e no final da string, enquanto o método lower() transforma todas as letras em minúsculas.

In [None]:
produto = input('Digite o nome do produto: ')
produto_padronizado = produto.strip().lower()
print(produto_padronizado)


nininho


### Formatando uma saudação

Rafaela trabalha na área de marketing e quer criar mensagens personalizadas para os clientes. Ela precisa de um programa que permita exibir saudações baseadas no nome do cliente e na cidade onde ele mora.

Crie um programa que solicite o nome e a cidade de um cliente e exiba uma mensagem de boas-vindas personalizada.

**Exemplo de Entrada:**

- Digite o nome do cliente: Laura  
- Digite a cidade do cliente: Rio de Janeiro

**Saída esperada:**

Olá, Laura! Bem-vinda ao sistema da cidade de Rio de Janeiro.  

-----------------------------

Para esse desafio podemos utilizar as F-strings, com elas podemos incluir variáveis em strings sem precisar concatenar manualmente. Com a ajuda de uma F-string, montamos uma mensagem personalizada automaticamente.

In [None]:
nome = input('Digite o nome do cliente: ')
cidade = input('Digite a cidade do cliente')

print(f'Olá, {nome}! Bem vinda ao sistema da cidade de {cidade}.')


Olá, Débora! Bem vinda ao sistema da cidade de São Paulo.


### Decifrando pistas com palavras-chave

Imagine que você precisa criar uma funcionalidade para um jogo, onde os jogadores recebem dicas baseadas em partes específicas de uma palavra-chave.   
Sua missão é desenvolver um programa que extraia trechos importantes de qualquer palavra digitada.  

Escreva um programa que solicite ao usuário uma palavra e exiba as três primeiras e as três últimas letras.  

**Exemplo de Entrada:**  

- Digite a palavra-chave: Misterioso  

**Saída esperada:**  

Primeiras: Mis  
Últimas: oso

--------------------

Nesta atividade você pode utilizar o slicing para extrair partes específicas de uma string.   
Neste caso utilizamos, texto[:3] para pegar os três primeiros caracteres, enquanto texto[-3:] pega os três últimos.

In [None]:
texto = input('Digite a palavra chave: ')
primeiras = texto[:3]
ultimas = texto[-3:]

print(f'Primeiras: {primeiras}')
print(f'Últimas: {ultimas}')

# palavra chave = cachorro


Primeiras: cac
Últimas: rro


### Verificando o início e o fim de uma String

Renan está desenvolvendo um sistema que verifica se os links de sites parceiros começam com https:// e terminam com .com.  
Esses critérios são obrigatórios para que o site seja aprovado no cadastro.   
Ajude Renan a criar um programa que realize essa validação de forma automática.  

*Como você escreveria um programa que peça ao usuário uma URL e informe se ela é válida ou inválida?*  

**Exemplo de Entrada:**

Digite a URL para validação: https://monitorrenan.com

**Saída esperada:**

URL válida!


------------

Podemos usar os métodos startswith() e endswith() para verificar se a string começa ou termina com os valores esperados. Assim, o programa valida URLs com base nos padrões especificados.

In [19]:
url = input('Digite a URL para validação')
if url.startswith('https://') and url.endswith('.com'):
    print('URL válida!')
else:
    print('URL inválida')


URL válida!


### Encontrando números em um texto

João é atendente em uma farmácia e precisa verificar se um cliente forneceu um número de receita válido em uma descrição. O número da receita é sempre o único número presente no texto fornecido pelo cliente. Ele quer um programa que extraia esse número diretamente e confirme se o texto está correto, sem a necessidade de trabalhar com listas ou loops.

Com base nesse cenário, crie um programa que receba um texto com uma descrição e exiba uma mensagem com o número encontrado.

**Exemplo de Entrada:**

Digite a descrição da receita: A receita 1087568 foi enviada pelo cliente.

**Saída esperada:**

O número da receita é: 1087568

--------------

Utilizamos re.findall() para capturar números no texto e acessamos diretamente o número com o índice [0]. Esse valor é exibido como o número da receita.

In [None]:
import re

texto = input('Digite a descrição da receita: ')
numero = re.findall(r'\d+', texto)[0]

print(f'O número da receita é: {numero}')


O número da receita é: 1087568


### Substituindo palavras específicas

Nathalia é uma escritora que está revisando um texto para publicação. Durante o processo, ela percebeu que usou a palavra "bom" repetidamente, quando queria expressar algo mais forte, como "ótimo". Para economizar tempo, Nathalia quer substituir automaticamente todas as ocorrências da palavra "bom" por "ótimo" no texto.

Ajude Nathalia a criar um programa que solicite um texto, a palavra que será substituída e a nova palavra. O programa deve exibir o texto com as alterações aplicadas.

**Exemplo de Entrada:**

![image.png](attachment:image.png)

**Saída esperada:**

O dia está ótimo, tudo está ótimo.

------------

Podemos explorar o método re.sub() para substituir todas as ocorrências da palavra antiga pela palavra nova. Utilizamos ainda a regex \b para garantir que apenas palavras completas sejam substituídas, evitando alterações em partes de palavras maiores (como "bombom").

In [None]:
texto = input('Digite o texto a ser revisado: ')
palavra_antiga = input('Qual palavra deseja substiuir? ')
palavra_nova = input('Qual é a nova palavra? ')

nova_frase = re.sub(rf'\b{palavra_antiga}\b', palavra_nova, texto)
print(nova_frase)


O dia está ótimo, tudo está ótimo.


### Validando nomes com Regex

Lorena trabalha no setor de cadastros de uma empresa e precisa garantir que os nomes inseridos pelos clientes estejam no formato correto.   
O padrão esperado é que os nomes comecem com uma letra maiúscula e contenham apenas letras (sem números ou caracteres especiais).   
Para facilitar o trabalho, ela quer um programa que valide automaticamente os nomes fornecidos.  

Ajude a Lorena criando um programa que solicite um nome ao usuário e verifique se ele atende às regras.  

**Exemplo de Entrada:**

Digite o nome do cliente para validação: maria123

**Saída esperada:**

Nome inválido!

----

Utilizamos o método re.fullmatch() para verificar se a string inteira corresponde ao padrão especificado. A regex, [A-Z] exige que o nome comece com uma letra maiúscula, e [a-z]* aceita qualquer quantidade de letras minúsculas a seguir. Se o nome não corresponder ao padrão, o programa informa que ele é inválido.


In [24]:
nome = input('Digite o nome do cliente para validação: ')
if re.fullmatch(r'[A-Z][A-Z]*', nome):
    print('Nome válido!')
else:
    print('Nome inválido!')
    

Nome inválido!


### Verificando o formato de um CPF

Sara trabalha no setor de atendimento de uma empresa e precisa verificar rapidamente se os clientes estão digitando seus números de CPF no formato correto antes de registrar os dados no sistema.

O formato esperado do CPF é: três blocos de 3 dígitos separados por pontos (.), seguidos por um bloco de 2 dígitos separados por um traço (-).

Ajude Sara a criar um programa que solicite o CPF de um cliente e verifica se ele está no formato correto.

**Exemplo de Entrada:**

Digite o CPF no formato XXX.XXX.XXX-XX: 123.456.789-00

**Saída esperada:**

O CPF está no formato correto.

----

A regex \d{3}\.\d{3}\.\d{3}-\d{2} garante que o CPF siga o formato esperado. Em seguida, podemos utilizar o método re.search para verificar se o padrão da regex está presente na string.

In [None]:
cpf = input('Digite o CPF no formato XXX.XXX.XXX.-XX')
padrao = r'\d{3}\.\d{3}\.\d{3}-\d{2}'

if re.search(padrao, cpf):
    print('O CPF está no formato correto.')
else:
    print('O CPF está no formato incorreto.')


O CPF está no formato correto.


### Encontrando palavras que começam com uma letra específica

Você trabalha em uma biblioteca e está organizando os títulos de livros no sistema.   
Você precisa identificar todos os títulos que possuem palavras iniciadas por uma determinada letra, para criar coleções temáticas baseadas em letras específicas.   

Por exemplo, você poderia usar isso para agrupar livros com palavras que começam com a mesma letra, ajudando na organização ou em campanhas como “Livros com A para você!”.

Como você criaria um programa que solicita um texto e uma letra inicial e retorna todas as palavras do texto que começam com essa letra?

**Exemplo de Entrada:**

Digite o título dos livro: As Aventuras de Alice no País das Maravilhas   
Digite a letra inicial para pesquisa: A  

**Saída esperada:**

["As", "Aventuras", "Alice"]

-----

Neste desafio utilizamos o método re.findall() para encontrar todas as palavras que começam com a letra informada.   
A regex \b{letra}[a-zà-ÿ]* captura todas palavras, incluindo aquelas com caracteres acentuados e o parâmetro re.IGNORECASE permite que o programa funcione tanto com maiúscula quanto minúscula.

In [None]:
texto = input('Digite o título do livro: ')
letra = input('Digite a letra inicial para pesquisa: ')
palavras = re.findall(rf'\b{letra}[a-zà-ÿ]*', texto, re.IGNORECASE)
print(palavras)


['As', 'aventuras', 'Alice']


### Agrupando informações dos pacientes

Carlos é analista de dados em um hospital e está organizando informações de pacientes em um banco de dados.  
Ele recebe os dados no formato: "PrimeiroNome Sobrenome - Ano". Por exemplo, “Monalisa Silva - 1994”.

Carlos precisa de um programa que leia as informações, capture cada parte separadamente, nome, o sobrenome e o ano de nascimento para preencher os campos do sistema.

Ajude Carlos criando um programa que solicite o nome completo e o ano de nascimento de um paciente e exiba-os separadamente.

Exemplo de Entrada:

Digite o nome completo e o ano de nascimento do paciente: Ana Silva - 1990

Saída esperada:

Primeiro Nome: Ana
Sobrenome: Silva
Ano de Nascimento: 1990

-----

Utilizamos a regex (\w+) (\w+) - (\d{4}) para capturar três partes: o primeiro nome, o sobrenome e o ano de nascimento. Em seguida, podemos usar o re.search para encontrar esse padrão especificado. E por fim, podemos acessar cada grupo correspondente com o método group.

In [32]:
dados = input('Digite o nome completo e o ano de nascimento do paciente: ')
padrao = r'(\w+) (\w+) (\d{4})'

resultado = re.search(padrao, dados)

if resultado:
    primeiro_nome = resultado.group(1)
    sobrenome = resultado.group(2)
    ano_nascimento = resultado.group(3)
    
    print(f'Primeiro Nome: {primeiro_nome}')
    print(f'Sobrenome: {sobrenome}')
    print(f'Ano de Nascimento: {ano_nascimento}')
else:
    print('Formato inválido!')

    

Primeiro Nome: Debora
Sobrenome: Pascoarelli
Ano de Nascimento: 1976


In [None]:
# entrada do usuário
nome_completo = input("Digite seu nome completo: ").strip()

# transforma em lista de palavras
partes = nome_completo.split()

# pega o primeiro “nome”
primeiro = partes[0]

# se tiver mais de uma parte, o sobrenome é a última; senão, deixamos em branco
sobrenome = partes[-1] if len(partes) > 1 else ''

# exibe
print("Nome:     ", primeiro)
if sobrenome:
    print("Sobrenome:", sobrenome)
else:
    print("Sobrenome: (não informado)")


Nome:      Debora
Sobrenome: Pascoarelli
