# Aula 4 - strings

Na aula de hoje, vamos explorar os seguintes tópicos em Python:

- 1) Strings
- 2) Funções de Strings
    - 2.1) Formatação de strings
_______

### Objetivos

Apresentar o conceito de strings de forma mais aprofundada, como uma coleção de caracteres, fazendo a ligação com o conceito de listas, que já foi estudado, mostrando as semelhanças e diferenças. Depois, apresentar as principais funções e métodos que atuam sobre strings, frisando a importância de utilizá-las no pré-processamento de dados textuais.

### Habilidades a serem desenvolvidas

Ao final da aula o aluno deve:

- Reconhecer strings como coleções de caracteres;
- Saber acessar elementos individuas e slices de strings;
- Saber iterar sobre strings;
- Conhecer os principais métodos e funções que atuam sobre strings;
- Entender a inportância de processar strings;
- Saber formatar strings com o `format()`

____
____
____

## 1) Strings

Desde a primeira aula, temos trabalhado com strings, que, como vimos, representam **dados textuais**

Vamos, agora, olhar pra strings um pouco mais a fundo, e aprender algumas funções para trabalharmos com strings

Uma string nada mais é do que uma **coleção de caracteres**!

Assim, podemos acessar caracteres específicos ou então um intervalo de caracteres de uma string, como se fosse uma lista!

**OBS.: Para strings também, o índice começa em 0, e podemos usar índices negativos!**

In [None]:
nome = "André   ++++"

In [None]:
print(nome[0])
print(nome[-1])
print(nome[3])
print(nome[:3])
print(nome[::2])
print(nome[0:len(nome):2])
print(nome[::-1])

A
+
r
And
Adé ++
Adé ++
++++   érdnA


Para saber o comprimento de uma string (quantos caracteres ela tem, incluindo espaços e pontuações), use a função len():

In [None]:
len(nome)

12

Como poderíamos implementar a função `len()`?

In [None]:
def length(string):
  tamanho = 0
  for letra in string:
    tamanho += 1
  return tamanho

length("Essa turma tá que tá!")

21

Podemos também percorrer cada caractere da string com o `for` -- strings são objetos **iteráveis**:

In [None]:
for char in nome:
    print(char)

A
n
d
r
é
 
 
 
+
+
+
+


Dá pra fazer o mesmo com o range() e o len():

In [None]:
for i in range(len(nome)):
    print(i, nome[i])

0 A
1 n
2 d
3 r
4 é
5  
6  
7  
8 +
9 +
10 +
11 +


Apesar de se parecer com uma lista, a string não tem exatamente as propriedades de uma lista. Por exemplo, **não podemos alterar** caracteres individualmente:

In [None]:
nome = "Andrezin"

In [None]:
nome[-1] = "nnnnn..."

TypeError: ignored

Mas nós conseguimos **alterar caracteres (ou palavras)** com o método "replace()":

In [None]:
nome = "André Piiiicolé, é é"

In [None]:
nome = nome.replace("iiii", "i")
nome.replace("é", "e....")

'Andre.... Picole...., e.... e....'

In [None]:
# ultimo parametro: quantidade de primeiras aparições do caractere a ser substituido
nome.replace("é", "e....", 1)

'Andre.... Picolé, é é'

Queremos implementar a função replace (inicialmente só conseguindo substituir UM ÚNICO caracter por outro caracter ou string).

In [None]:
def replace(string, ant, novo):
  novaString = ""
  for letra in string:
    if letra == ant:
      novaString += novo
    else:
      novaString += letra
  return novaString

replace("ABBBBCDDDDE", "BBBB", "N")

'ABBBBCDDDDE'

Agora sim, vamos implementar a função replace de verdade:

In [None]:
# def replaceDeVdd(string, ant, novo):
#   if ant not in string:
#     return string

#   i = 0
#   j = 0
#   while i < len(string):
#     charAtual = string[i]
#     if charAtual != ant[j]:
#       i += 1
#     else:
#       i += 1



Podemos **transformar uma string em uma lista de caracteres**, explicitamente, usando a fução "list()"

In [None]:
lista_nome = list(nome)

In [None]:
lista_nome

['A',
 'n',
 'd',
 'r',
 'é',
 ' ',
 'P',
 'i',
 'c',
 'o',
 'l',
 'é',
 ',',
 ' ',
 'é',
 ' ',
 'é']

Agora sim, podemos alterar um elemento da lista:

In [None]:
lista_nome[-6] = "e......."

In [None]:
lista_nome

['A',
 'n',
 'd',
 'r',
 'é',
 ' ',
 'P',
 'i',
 'c',
 'o',
 'l',
 'e.......',
 ',',
 ' ',
 'é',
 ' ',
 'é']

E, pra trasnformar a lista de volta pra string, usamos a função "join()":

In [None]:
string = "".join(lista_nome)

['A',
 'n',
 'd',
 'r',
 'é',
 ' ',
 'P',
 'i',
 'c',
 'o',
 'l',
 'e.......',
 ',',
 ' ',
 'é',
 ' ',
 'é']

Um exemplo do uso do .join() pra juntar os números de uma lista em um único numero

In [None]:
lista_num = [2, 0, 2, 1]

num = int("".join([str(elemento) for elemento in lista_num]))

print(num)
print(int("".join([str(elemento) for elemento in [2, 0, 2, 1]])))

2021
2021


Porém não usamos só string vazia para dar join em uma lista de caracteres:

In [None]:
string = ".".join(['T', 'V', 'A'])
print(string)
string.split(".")

T.V.A


['T', 'V', 'A']

Como já vimos, podemos fazer **operações com strings**:

Soma de strings: ao somar duas strings, elas são concatenadas:

In [None]:
"André " + "Picolé"

'André Picolé'

Multiplicação de string por inteiro: ao multiplicar uma string por um número inteiro, a string é repetida:

In [None]:
"André " * 3

'André André André '

__________
__________
__________

## 2) Funções de strings

Como listas, strings também têm algumas funções específicas. Algumas delas são:

.upper(): transforma todos os caracteres em maiúscula

In [None]:
nome = "André"

In [None]:
nome = nome.upper()
print(nome)

ANDRÉ PICOLÉ, É É


.lower(): trasnforma todos os caracteres em minúscula

In [None]:
nome.lower()

'andré'

.title(): deixa a primeira letra de cada palavra em maiúscula

In [None]:
escola = "lets code de sao paulo"

escola.title()

'Lets Code De Sao Paulo'

Como faríamos para implementar uma função equivalente da função title?

In [None]:
def title(string):
  stringNova = string[0].upper()
  for i in range(1, len(string)):
    if string[i-1] == ' ':
      stringNova += string[i].upper()
    else:
      stringNova += string[i]
  return stringNova

title("essa turma é braba!")

'Essa Turma É Braba!'

Como fazer a função title com list comprehension?

In [None]:
def titleOneLine(string):
  return string[0].upper() + "".join([ string[i].upper() if string[i-1] == ' ' else string[i] for i in range(1, len(string)) ])

titleOneLine("fazendo com list comprehension")

'Fazendo Com List Comprehension'

Outra forma de fazer:

In [None]:
print(' '.join([palavra.capitalize() for palavra in "fazendo com list comprehension".split()]))

Fazendo Com List Comprehension


.capitalize(): deixa a primeira letra da primeira palavra em maiúscula

In [None]:
escola.capitalize()

'Lets code de sao paulo'

É possível quebrar uma string em determinado caractere, tendo como resultado uma **lista com os caracteres além da quebra**.

- Para quebrar nos espaços, use a função ".split()", sem argumento

In [None]:
oi = "oi, tudo bem?"

In [None]:
oi.split()

['oi,', 'tudo', 'bem?']

- Para quebrar em algum caracter, use o caractere como argumento:

In [None]:
oi.split(",")

['oi', ' tudo bem?']

__Tirar espaços que tão sobrando no fim e no início da string__

Utilize a função strip()

In [None]:
cor = "  vermelho e azul      "

cor.strip()

'vermelho e azul'

Mas essa função não elimina espaços extrar no "meio" da string -- apenas no início e no fim!

In [None]:
cor = "vermelho            rosa"
cor.strip()

'vermelho            rosa'

__Pra tirar espaços do meio, podemos fazer:__

In [None]:
print(cor.split())
" ".join(cor.split())

['vermelho', 'rosa']


'vermelho rosa'

Ou:

In [None]:
cor.replace(" ", "", cor.count(" ") - 1)

'vermelho rosa'

Outras funções interessantes...

- isdigit()
- isalpha()
- isalnum()
- isspace()

In [None]:
frase = "ele disse: vamos nos encontrar às 13:00"

num = []
letra = []
spaces = []
pontos = []

for char in frase:
    if char.isdigit():
        num.append(char)
    elif char.isalpha():
        letra.append(char)
    elif char.isspace():
        spaces.append(char)
    else:
        pontos.append(char)

print(num)
print(letra)
print(spaces)
print(pontos)

['1', '3', '0', '0']
['e', 'l', 'e', 'd', 'i', 's', 's', 'e', 'v', 'a', 'm', 'o', 's', 'n', 'o', 's', 'e', 'n', 'c', 'o', 'n', 't', 'r', 'a', 'r', 'à', 's']
[' ', ' ', ' ', ' ', ' ', ' ']
[':', ':']


E se quisermos preencher uma string ao invés de um array?

In [None]:
stringInicial = 'Olá Mundo'
stringFinal = '' # cria uma string vazia
for letra in stringInicial:
  if letra.lower() in 'aeiou':
    stringFinal += letra
print(stringFinal)

Oauo


Como verificar se a string contém pelo menos uma vogal?

In [None]:
def possuiVogais(string):
  for letra in string:
    if letra.lower() in 'aeiou':
      return True
  return False

def possuiVogaisInLine1(string):
  return len([letra.lower() for letra in string if letra.lower() in 'aeiou']) > 0

def possuiVogaisInLine2(string):
  return True if True in [letra.lower() in 'aeiou' for letra in string] else False

possuiVogaisInLine2("pss vgs")

False

Podemos usar as funções acima para padronizar a resposta de um usuário!

Utilizamos a função 

```unicodedata.normalize("NFD", minha_string).encode("ascii", "ignore").decode("utf-8")```

Para tirar acentos da string "minha_string"

E o ```strip()``` é usado pra tirar espaços desnecessários do início e do fim de uma string

In [None]:
import unicodedata

# mais um exemplo

minha_string = "Coração"

print("string original:", minha_string)
print("string padronizada:", unicodedata.normalize("NFD", minha_string).encode("ascii", "ignore").decode("utf-8").upper().strip())

string original: Coração
string padronizada: CORACAO
Coracao


Como pudemos ver acima, processar a string para que ela esteja em **determinado padrão** (por exemplo: em letras maiúsculas e sem acentos) é um passo muito importante para que operações de comparação entre strings funcionem perfeitamente sem erros!

In [None]:
# modificando a solução de um dos exercícios pra deixá-la mais robusta...

import unicodedata

resposta = input("Você trabalhava com ele? ")

ponto = 0

if unicodedata.normalize("NFD", resposta).encode("ascii", "ignore").decode("utf-8").upper().strip() == "NAO":

    ponto = ponto + 1
    
print(ponto)

Você trabalhava com ele? não
1


___
___

### 2.1) Formatação de strings

Também podemos **formatar strings**. Isso pode ser super útil tanto ao receber dados do usuário (input) quando ao exbibir dados pro usuário (print)

Um dos usos mais legal do format é para **exibir** strings formatadas.

Imagine que você queira exibir uma data no formato dd/mm/aaaa.

Em situações normais, dias e meses inferiores a 10 apareceriam com apenas 1 dígito (int não é representado com zeros à esquerda). Porém, podemos especificar no format que gostaríamos de representar um inteiro com 2 dígitos, preenchendo com zero dígitos em branco (à esquerda): 

```python

dia = 1
mes = 2
ano = 2020
data = '{}/{}/{}'.format(dia, mes, ano)
print(data) # resultado: 01/02/2020
```

O símbolo 'd' indica que estamos representando números **inteiros** em base decimal (dígitos de 0 a 9). 

Os símbolos '2' e '4' indicam, respectivamente, 2 dígitos ou 4 dígitos. 

o símbolo '0' indica que se faltar dígitos, os espaços devem ser preenchidos com zero

In [1]:
dia = 11
mes = 12
ano = 2020

data = "{}/{}/{}".format(dia, mes, ano)

print(data)

11/12/2020


Imagina que você queira exibir algum valor monetário, por exemplo, o preço de alguma coisa.

Utilizando float, pode ser que seu resultado tenha apenas uma casa decimal.

Mas, se tratando de dinheito, sempre queremos mostrar duas casas decimais!

Usaremos o format para representar com apenas 2 casas.

```python
preco = 1500.5

print(preco) 

precoFinal = 'R$ {:.2f}'.format(preco)

print(precoFinal)
```

Neste caso, o 'f' indica que o número é float. 

Já o '.2' indica que queremos 2 casas após o ponto decimal. 

Note que a função não apenas descarta as casas excedentes, e sim arredonda corretamente o número.

In [None]:
preco = 1500.5678

preco_final = "R$ {:.2f}".format(preco)

print(preco_final)

R$ 1500.57
