# Aula 4 - Strings
 
## 1. Strings
No primeiro capítulo mencionamos quatro tipos primitivos de dados: inteiro, real, lógico e texto/literal (_string_). Na verdade, o quarto tipo básico seria um _caractere_. Uma _string_ é uma **coleção** de caracteres - como se fosse uma lista, mas aceitando apenas elementos textuais.
Vamos verificar algumas propriedades das _strings_!
 
### 1.1. Acessando elementos em uma _string_
No capítulo sobre Listas, vimos que podemos acessar elementos individuais de uma lista utilizando um índice entre colchetes. Vamos testar a mesma lógica com _strings_?

In [11]:
frase = "Ada é uma escolha legal"

print(frase[0])

A


In [3]:
lista = ['I', 'D', 'U']

lista[1]

'D'

In [6]:
lista[1] = "abacate"

In [7]:
lista

['I', 'abacate', 'U']

Note que o programa acima imprime "Ada", com um caractere por linha. Ou seja, ele considerou frase[0] como "A", frase[1] como "d", e assim sucessivamente. Uma _string_ é, de fato, uma coleção de caracteres.
 
Porém, ao contrário de uma lista, dizemos que uma _string_ é **imutável**. Isso significa que não podemos alterar um elemento individual da _string_.
O programa abaixo produz um erro:

In [5]:
frase[5] = 'abacate'

TypeError: 'str' object does not support item assignment

In [8]:
frase = frase.split()

In [9]:
frase

['Ada', 'é', 'uma', 'escolha', 'legal']

In [13]:
frase_caracteres = []
for char in frase:
    frase_caracteres.append(char)

In [14]:
frase_caracteres

['A',
 'd',
 'a',
 ' ',
 'é',
 ' ',
 'u',
 'm',
 'a',
 ' ',
 'e',
 's',
 'c',
 'o',
 'l',
 'h',
 'a',
 ' ',
 'l',
 'e',
 'g',
 'a',
 'l']

In [15]:
frase2 = [letra for letra in frase]
frase2

['A',
 'd',
 'a',
 ' ',
 'é',
 ' ',
 'u',
 'm',
 'a',
 ' ',
 'e',
 's',
 'c',
 'o',
 'l',
 'h',
 'a',
 ' ',
 'l',
 'e',
 'g',
 'a',
 'l']

In [20]:
lista_list = list(frase)
lista_list[2] = 'Vytor'
lista_list

['A',
 'd',
 'Vytor',
 ' ',
 'é',
 ' ',
 'u',
 'm',
 'a',
 ' ',
 'e',
 's',
 'c',
 'o',
 'l',
 'h',
 'a',
 ' ',
 'l',
 'e',
 'g',
 'a',
 'l']

Para alterar uma _string_, é necessário **redefini-la**, de modo que a _string_ original será descartada e a nova (alterada) será escrita por cima da original. Ou, alternativamente, podemos gerar uma cópia da _string_ com alterações. Veremos mais detalhes adiante.
 
### 1.2. Operações entre _strings_
 
#### 1.2.1. Operadores aritméticos
Alguns operadores aritméticos funcionam com _strings_ também. Naturalmente, eles não servem para fazer contas, mas nos permitem fazer de forma intuitiva algumas operações bastante úteis.
 
O operador **+** serve como um operador de **concatenação** de _strings_: unir duas _strings_. Observe o exemplo abaixo:

In [22]:
string1 = 'Olá'
string2 = ' Mundo!'
resultado = string1 + string2
print(resultado)

Olá Mundo!


Outro operador que funciona é o operador **\***. Este operador não é usado entre duas _strings_, mas entre uma _string_ e um **int**. Ele repetirá a _string_ o número de vezes dado pelo **int**.

In [26]:
string1 = input("Digite algo")
multiplicacao = string1 * 10

print(multiplicacao)

Olá Mundo! Olá Mundo! Olá Mundo! Olá Mundo! Olá Mundo! Olá Mundo! Olá Mundo! Olá Mundo! Olá Mundo! Olá Mundo! 


In [25]:
string1 = 'Olá Mundo!'
multiplicacao = string1 * 10

print(multiplicacao)

Olá Mundo!Olá Mundo!Olá Mundo!Olá Mundo!Olá Mundo!Olá Mundo!Olá Mundo!Olá Mundo!Olá Mundo!Olá Mundo!


In [27]:
if "Jorge" > "Jarge":
    print("Funcionou!")

Funcionou!


#### 1.2.2. Operadores lógicos
 
Os operadores lógicos (```<```, ```>```, ```<=```, ```=>```, ```!=``` e ```==```) também funcionam com strings. Esses operadores são _case sensitive_, ou seja, diferenciam maiúsculas de minúsculas.
 
De maneira muito simplificada e desconsiderando diferenças entre maiúsculas e minúsculas, podemos dizer que eles consideram ordem alfabética: 'banana' é maior do que 'abacaxi'.
 
A explicação mais completa é a seguinte: internamente, cada caractere é armazenado como um número. Quando utilizamos qualquer tipo de aplicação que irá exibir um texto (um editor de textos, navegador de internet, ou mesmo os nossos programinhas em Python rodando no terminal), a aplicação usa esses números como índices em uma **tabela de codificação de caracteres**.
 
Temos diversos esquemas diferentes de codificação de caracteres em uso pelo mundo, e quando você está usando um programa ou navegando por um site e você nota símbolos estranhos no texto (frequentemente onde teríamos caracteres especiais, como letras com acento), é provável que o autor do texto tenha utilizado uma tabela e o seu computador esteja usando outra.
 
Vários programas permitem a conversão entre essas tabelas, e você já deve ter visto essa "sopa de letrinhas" em alguma aba ou janela de configuração em algum editor de textos: **utf-8**, **utf-16**, **windows-1252** (ou **cp-2152**), e até mesmo alguns padrões ISO.
 
Para ilustrar a ideia, vamos colocar aqui uma das tabelas mais simples, a tabela ASCII:
 
![](https://upload.wikimedia.org/wikipedia/commons/thumb/1/1b/ASCII-Table-wide.svg/1200px-ASCII-Table-wide.svg.png)
 
Fonte: https://upload.wikimedia.org/wikipedia/commons/thumb/1/1b/ASCII-Table-wide.svg/1200px-ASCII-Table-wide.svg.png
 
Note que o caractere 'A' está no índice 65, o 'B' está no índice 66, e assim sucessivamente. Por isso, 'Abacate' < 'Banana' é verdadeiro: a primeira string começa com uma letra no índice 65 da tabela, a segunda com uma letra no índice 66.
 
No caso de 'Abacate' e 'Abacaxi', temos um "empate" das 5 primeiras letras. Então é a sexta letra que vai mandar: 'x' é maior do que 't', por estar em uma posição superior na tabela.
 
Note que a ordem não é exatamente alfabética: entre os caracteres maiúsculos, seguimos ordem alfabética. Entre os minúsculos, idem. E entre os dígitos numéricos, também temos ordem crescente correspondente aos valores. Mas todos os minúsculos são "maiores" do que qualquer maiúsculo, que por sua vez são "maiores" do que qualquer dígito numérico. Símbolos, operadores e sinais de pontuação estão em posições diversas.

O Python disponibiliza 2 funções que são bastante uteis quando estamos trabalhando com o sistema ASCII. A primeira é a função ord() , que recebe uma letra como parâmetro e retorna o código ASCII da mesma. A segunda função, é a chr() , onde passamos o código ASCII e nos é retornado a respectiva letra.

A seguir, temos 2 exemplos utilizando as funções builtin do Python ord() e chr().
 


In [42]:
print(ord('a'))
print(chr(97))
print(ord('A'))
valor = 65 + 32
print(chr(valor))

print(chr(ord('A') + 32))

97
a
65
a
a


In [31]:
alfabeto = {'A', 'Z', 'a', 'z'}
alfabeto

{'A', 'Z', 'a', 'z'}

#### 1.2.3. Copiando uma _string_ através de concatenação
Caso você já tenha resolvido problemas de somatório (a essa altura, espera-se que tenha resolvido vários!), você já deve estar acostumado a utilizar um _loop_ onde novos valores são somados em uma mesma variável. Somar os números de uma lista, por exemplo, tem mais ou menos essa carinha:

In [46]:
lista = [1, 2 ,3]
soma = 0
for numero in lista:
    soma += numero 
soma

6

In [47]:
lista = [1, 2, 3]
soma = sum([numero for numero in lista])
soma

6

In [49]:
sum(lista)

6

In [51]:
string_inicial = 'Olá Mundo'
string_final = ''

for letra in string_inicial:
    if letra == 'O':
        string_final = string_final + 'o'
    else:
        string_final = string_final + letra

print(string_final)

olá oooo Mundo


Isso é útil porque antes de "somar" cada letra à _string_ final podemos fazer alterações (como transformar em maiúscula ou minúscula, acrescentar caracteres entre 2 letras etc.). É um jeito de fazer tratamento de _strings_. Veremos mais sobre tratamento de _strings_ no capítulo de funções de _strings_.
 
## 1.3. Transformando uma _string_ em lista
_Strings_ são imutáveis, e isso pode nos dar um pouco de trabalho quando queremos fazer pequenas alterações, como forçar um caractere a ser maiúsculo ou acrescentar um caractere à _string_. Uma das formas de fazer envolve a "soma cumulativa" apresentada acima. Outra forma envolve transformar a nossa _string_ em lista, que é uma estrutura mutável. Execute o programa abaixo:

In [57]:
vitamina = 'Vitamina de Abacate'
lista_vitamina = list(vitamina)
lista_vitamina[0] = 'v'
lista_vitamina.append('!')
lista_vitamina

['v',
 'i',
 't',
 'a',
 'm',
 'i',
 'n',
 'a',
 ' ',
 'd',
 'e',
 ' ',
 'A',
 'b',
 'a',
 'c',
 'a',
 't',
 'e',
 '!']

Como a lista é mutável, nela conseguimos alterar uma letra e adicionar um símbolo ao final sem dificuldades! Porém, infelizmente nosso resultado é uma lista, o que não ficou muito legível para o usuário. Podemos resolver isso utilizando a função _join_. Veremos em breve como ele realmente funciona, mas por hora podemos utilizá-lo da seguinte maneira para transformar lista em _string_:

In [66]:
vitamina = 'Vitamina de Abacate'
lista_vitamina = list(vitamina)
lista_vitamina[0] = 'v'
lista_vitamina.append('!')
string_vitamina = ''.join(lista_vitamina)
print(string_vitamina)

vitamina de Abacate!


In [65]:
vitamina = 'Vitamina de Abacate'
lista_vitamina = list(vitamina)
lista_vitamina[0] = 'v'
lista_vitamina.append('!')
string_vitamina = ''.join(';'.join(lista_vitamina).split(';'))
print(string_vitamina)

vitamina de Abacate!


Para as modificações mais comuns, temos algumas funções prontas que poderão ser bastante úteis!
 
## 2. Símbolos especiais
Além de letras, números, sinais de pontuação, símbolos matemáticos etc., uma _string_ pode conter alguns operadores especiais de controle. Esses operadores podem indicar, por exemplo, uma quebra de linha ou uma tabulação. Vejamos os mais comuns:
 
### 2.1. Quebra de linha
Uma quebra de linha indica que o programa exibindo a _string_ deverá quebrar a linha atual e exibir o restante da _string_ na linha seguinte, e é representada na maioria dos sistemas e na _web_ pelo símbolo ```\n```. Execute o programa abaixo e veja o resultado na tela:

In [62]:
print("Olá \n Mundo")

Olá 
 Mundo


### 2.2. Tabulação
A tabulação indica um recuo equivalente ao da tecla _Tab_ - um recuo de início de parágrafo, ou o recuo que usamos para aninhar linhas de código em Python. Ela é representada pelo símbolo ```\t```. Verifique o resultado do exemplo abaixo:

In [77]:
aprovados = ["Mario", "Luigi", "Peach"]
reprovados = ["Bowser", "Wario", "Waluigi"]

print("Candidatos aprovados:")
for aprovado in aprovados:
    print(f"{aprovado:^23}")

print("\nCandidatos reprovados:")
for reprovado in reprovados:
    print("\t", reprovado)

Candidatos aprovados:
         Mario         
         Luigi         
         Peach         

Candidatos reprovados:
	 Bowser
	 Wario
	 Waluigi


### 2.3. Barra
E se nós quiséssemos representar uma _string_ que explica o significado de ```\n```, por exemplo, como proceder? Afinal, ao ver o símbolo ```\n``` o programa entenderá que é uma quebra de linha e fará isso ao invés de escrever ```\n``` na tela.
 
Podemos utilizar 2 barras: ```\\```. Ao fazermos isso, o programa entende que é para representar a barra na tela ao invés de interpretá-la como início de outro símbolo especial.

In [81]:
print('Utilizamos o \\n para demonstrar as quebras de linha')

Utilizamos o \n para demonstrar as quebras de linha


In [82]:
print(r'Utilizamos o \n para demonstrar as quebras de linha')

Utilizamos o \n para demonstrar as quebras de linha


### 2.4 Aspas
Um problema que você deve ter se deparado é que parece impossível representar o símbolo ```'``` em uma _string_ que foi aberta por esse símbolo, já que a segunda ocorrência dele fechará a string. Idem para o símbolo ```"```. Podemos resolver isso da mesma forma que fizemos com a barra: ```\'``` irá sempre representar o símbolo ```'``` e ```\"``` irá sempre representar o símbolo ```"``` ao invés de fechar uma _string_.

In [89]:
print("Aspas simples \' \"")
print('Aspas simples \' \"')

Aspas simples ' "
Aspas simples ' "


### 2.5 Funções úteis

**1. split()**

A função split() divide um texto todas as vezes que a String passada como argumento for localizada. No código a seguir, definimos uma frase e sem seguida, invocamos a função split(), definindo como argumento, uma String que contém um único espaço em branco.

In [91]:
string = "Toda string do python é imutável"
lista = string.split(" ")
lista

['Toda', 'string', 'do', 'python', 'é', 'imutável']

**2. replace()**

A função replace() substitui uma parte do texto por uma outra String. A palavra replace(), do Inglês, siginifca substituir e é isso que a função replace() da classe String do Python faz.

No código a seguir, iremos definir uma String e em seguida, substituiremos uma parte do texto por outra.

In [93]:
string_replace = "a função replace substitui parte do texto por outro texto"

string_marcelo = string_replace.replace("replace", "marcelo")
string_marcelo

'a função marcelo substitui parte do texto por outro texto'

**3. Outras funções:**

Agora vamos contar o numero de vezes que a palavra especificada aparece na string, nesse caso estou apenas procurando por um caracter 'r'.

In [96]:
string_contador = "Este é um EXEMPLO de string"

num_ocorrencias = string_contador.count("e")
num_ocorrencias

2

Podemos também achar em que posição está certa levra ou palavra.

In [101]:
posicao = string_contador.find("é")
print(posicao)

posicao = string_contador.find("E")
print(posicao)

posicao = string_contador.find("EXEMPLO")
print(posicao)

5
0
10


Separar uma string é uma coisa que eu frequentemente faço.O método split é usado para isso.

In [102]:
string_contador.split()

['Este', 'é', 'um', 'EXEMPLO', 'de', 'string']

Podemos escolher o ponto a ser separado.

In [109]:
resultado = string_contador.split("EXEMPLO")

In [110]:
resultado.insert(1, "EXEMPLO")

In [111]:
resultado

['Este é um ', 'EXEMPLO', ' de string']

In [113]:
string_contador.split("EXEMPLO")

['Este é um ', ' de string']

In [112]:
nara = "Este é um, EXEMPLO, de string"
nara.split(',')

['Este é um', ' EXEMPLO', ' de string']

In [114]:
lauro = "lauro|costa |28"
lauro.split("|")

['lauro', 'costa ', '28']

Para juntar nossa string separada, podemos usar o método join.

In [117]:
''.join(string_contador.split('EXEMPLO'))

'Este é um  de string'

Podemos brincar com a caixa das letras (maiúsculo ou minúsculo). Vamos deixar tudo maiúsculo.


In [118]:
string_contador.upper()

'ESTE É UM EXEMPLO DE STRING'

Agora vamos deixar tudo minúsculo.

In [None]:
string_contador.lower()

Vamos deixar apenas a primeira letra maiúscula de uma string minúscula.

In [119]:
string_contador.capitalize()

'Este é um exemplo de string'

Podemos usar o método title, que deixa as letras de cada palavra da string maiúscula.

In [120]:
string_contador.title()

'Este É Um Exemplo De String'

Uma troca também é possível.O que for maiúsculo vira minúsculo e vice-versa.

In [121]:
string_contador.swapcase()

'eSTE É UM exemplo DE STRING'

Podemos rodar alguns testes numa string usando poucos métodos. Vamos ver se a string dada é totalmente maiúscula.

In [125]:
print('UPPER'.isupper())
print('upper'.isupper())

True
False


Do mesmo modo, podemos checar se a string dada é minúscula.

In [126]:
print('LOWER'.islower())
print('lower'.islower())

False
True


Checando se ela é um title, no caso, todas as palavras com a primeira letra maiúscula.

In [127]:
"This Is A Title".istitle()

True

In [128]:
"This Is a Title".istitle()

False

Podemos checar se a string é alfa-numérica, ou seja, contém apenas letras e números, sem caracteres especiais.

In [129]:
'aa44'.isalnum()

True

In [130]:
'aa$44'.isalnum()

False

É possível checar se uma string contém apenas letras.

In [131]:
'aa44'.isalpha()

False

In [132]:
'aaAA'.isalpha()

True

Agora checando se ela contém apenas números.

In [133]:
'44'.isdigit()

True

In [134]:
'aaa'.isdigit()

False

Podemos checar se uma string contém apenas espacos.

In [136]:
print("                 ".isspace())

True


In [137]:
print("qweqweqweqwe".isspace())

False


Falando em espços, podemos adicionar espacos em ambos os lados de uma string.Vamos adicionar espacos no lado direito de uma string.

In [150]:
str_a = 'A string.'.ljust(15)
print(str_a)

texto = 'A string.'
print(f"{texto:<16}")

A string.      
A string.       


Para adicionar espacos do lado esquerdo, o método rjust é usado.

In [148]:
str_a = 'A string.'.rjust(15)
print(str_a)

texto = "A string."
print(f"{texto:>15}")

      A string.
      A string.


O método center é usado para centralizar uma string dentro de espacos.

In [151]:
str_a = 'A string.'.center(15)
print(str_a)

   A string.   


Podemos separar os espacos de ambos os lados de uma string.

In [152]:
"   A string.   ".strip()

'A string.'

In [153]:
"   A string.   ".lstrip()

'A string.   '

In [154]:
"   A string.   ".rstrip()

'   A string.'

In [156]:
if "Bruno" == "Bruno       ".strip():
    print("são iguais")
else:
    print("Não são iguais")

são iguais


### Exercício 1:

Dado um endereço IP válido (IPv4), retorne uma versão 'desativada' desse endereço IP.

Um endereço IP desativado substitui cada ponto "." com "[.]".

Exemplo 1:

- **Entrada:** endereço = "1.1.1.1"
- **Saída:** "1[.]1[.]1[.]1"

Exemplo 2:

- **Entrada:** endereço = "255.100.50.0"
- **Saída:** "255[.]100[.]50[.]0"

In [157]:
ip_valido = input("Entre com um IPv4 valido").strip()

lista_ip = list(ip_valido)

ip_invalido = ''.join([v if v != '.' else f'[.]' for v in lista_ip])

ip_invalido

'123[.]234[.]342[.]312'

In [161]:
ip_original = '312.534.52.0'
ip_desativado = ip_original.replace('.', '[.]')
print(ip_desativado)

312[.]534[.]52[.]0


In [160]:
ENDERECO_IP =  "255.100.50.0"
ip_desativado = ENDERECO_IP.replace('.', '[.]')
print(ip_desativado)

255[.]100[.]50[.]0


In [159]:
ip = '255.100.50.0'
print(ip.replace('.', '[.]'))

255[.]100[.]50[.]0


In [158]:
entrada = "1.1.1.1"
entrada = entrada.replace('.', '[.]')

entrada

'1[.]1[.]1[.]1'

### Exercício 2:

Um pangrama é uma frase em que cada letra do alfabeto aparece pelo menos uma vez.

Dada uma frase de string contendo apenas letras minúsculas, retorne true se a frase for um pangrama ou false caso contrário.

Exemplo 1:

- **Entrada:** frase = "thequickbrownfoxjumpsoverthelazydog"
- **Saída:** verdadeiro

Explicação: a frase contém pelo menos uma de cada letra do alfabeto.

Exemplo 2:

- **Entrada:** frase = "letscode"
- **Saída:** falso

In [165]:
frase = "thequickbrownfoxjumpsoverthelazydog"
set(frase)

{'a',
 'b',
 'c',
 'd',
 'e',
 'f',
 'g',
 'h',
 'i',
 'j',
 'k',
 'l',
 'm',
 'n',
 'o',
 'p',
 'q',
 'r',
 's',
 't',
 'u',
 'v',
 'w',
 'x',
 'y',
 'z'}

In [164]:
frase = "thequickbrownfoxjumpsoverthelazydog"
if len(set(frase)) == 26:
  print('verdadeiro')
else:
  print('false')

verdadeiro


In [None]:
frase = str(input("Entre com uma frase "))

if len(set(frase)) == 26:
    print("verdadeiro")
else:
    print("falso")