# Strings

## $ \S 1 $ Strings
Uma __string__ é uma sequência de caracteres delimitada por aspas simples `'` ou duplas `"`. O tipo correspondente às strings é chamado `str`.

__Exemplo:__

In [None]:
a = "It is time for all good men"
b = 'to come to the aid of their country.'
print(a, type(a))   # Imprimindo a string a e seu tipo.
print(b, type(b))   # Fazendo o mesmo para a string b.

Note que o par de aspas que delimita uma string não aparece na tela quando ela é impressa.

📝 Se uma string contém caracteres de nova linha, ela pode ser delimitada por `"""` (aspas duplas triplas). Isso pode ser usado para dividir uma string mais longa em várias linhas.

In [None]:
poema =  """
Whose woods these are I think I know.   
His house is in the village though;   
He will not see me stopping here   
To watch his woods fill up with snow.
"""
print(poema, type(poema))

Diferentemente de várias outras linguagens, Python não possui um tipo especial para caracteres: um caractere é representado simplesmente como uma string de comprimento $ 1 $.

In [None]:
letter = 'a'
print(letter, type(letter))    # Note que letter é do tipo str.

Para obter o caractere na posição $ i $ de uma string chamada, digamos, $ s $, use `s[i]`; a saída também é uma string (ainda que tenha apenas $ 1 $ caractere).

<div class="alert alert-warning">Em Python, os índices são <i>sempre</i> contados começando de <b>0 (zero)</b>, não 1. Para evitar confusão, adaptamos nossa terminologia de acordo. Por exemplo, nos referimos a 'm' como o caractere na posição 0 da string 'magic', 'a' como seu primeiro caractere, e assim por diante... Em particular, se uma string tem comprimento n (ou seja, se ela consiste de n caracteres), então seu último índice é n - 1.</div>

__Exemplo:__

In [None]:
g = "Gandalf"
s = "Sauron"

print(g[0], type(g[0]))
print(g[3], type(g[3]))

# Como s contém 6 letras, a última é indexada por 5:
print(s[5])

Ao prefixar um índice com um sinal de menos -, começamos a contar para a
'esquerda' a partir do caractere na posição $ 0 $. Por exemplo, `s[-1]` é o _último_
caractere de $ s $, `s[-2]` é seu _penúltimo_ caractere, e assim por diante.

__Exemplo:__ Aqui está uma representação das letras na string "rocket" e seus respectivos índices:

$$
\begin{array}{r|r|r|r|r|r|r|}
\text{string} &  \text{r} & \text{o} & \text{c} & \text{k} & \text{e} & \text{t} \\ \hline
\text{índices} & 0 & 1 & 2 & 3 & 4 & 5 \\
 & -6 & -5 & -4 & -3 & -2 & -1 \\
\end{array}
$$

__Exercício:__ No exemplo anterior, o que acontece se você tentar acessar o 6º elemento da string? E o elemento na posição -7?

📝 Se quisermos criar uma string que tenha uma aspa simples como um de seus caracteres, podemos delimitar a string com aspas duplas, e vice-versa.

In [None]:
explosion = "'BOOM!'"
last = explosion[-1]
print(last)

next_to_last = explosion[-2]
print(next_to_last)

Finalmente, qualquer caractere Unicode pode ser usado em uma string:

In [None]:
fruits = "🍉🫐🍓🥝🍎🍍"
print(fruits)

greeting = "こんにちは"
print(greeting)

## § $ 2 $ Operações com strings

Strings podem ser __concatenadas__ usando o operador binário __+__.

__Exemplo:__

In [None]:
string_1 = "ancient"
string_2 = "magic"
string_3 = "spells"

print(string_1 + string_2)
print(string_1 + " " + string_2 + " " + string_3)

__Exercício:__ Suponha que as instruções `a = "hello"` e `b = 'world'` acabaram de ser executadas pelo interpretador. Determine a saída de cada uma das seguintes instruções:

(a) `a + a`

(b) `b + " " + a`

(c) `a * 3`

(d) `2 * b`

(e) `(-1) * a`

(f) `1 + "1"`

(g) `a * b`

(h) `a - a`

(i) `0 == '0'`

(j) `True == "True"`

In [None]:
a = "hello"
b = 'world'

📝 Estendendo a interpretação de `+` como concatenação de strings, se usarmos `*` para "multiplicar" uma string por um inteiro positivo $ n $, então o resultado é uma nova string que consiste em n cópias da string original, concatenadas uma após a outra. De forma mais concisa, para strings, `*` denota __repetição__. Os demais operadores aritméticos (`-`, `**`, `/`, `//` e `%`) não podem ser aplicados a strings.

In [None]:
word = "foo"
print(word * 3)
print(3 * word)

A função `len` aplicada a uma string retorna seu **comprimento**, isto é, o número de caracteres que ela contém, que é sempre um inteiro não-negativo.

__Exemplo:__

In [None]:
s = "Look to Windward"
print(s)
print(len(s), type(len(s)))

In [None]:
# A string vazia é a única string que tem comprimento 0:
print(len(""))

# Note que espaços em branco também contam como caracteres válidos:
print(len("   "))    # <--- Esta string consiste em três espaços.

🚫 Uma string é um objeto __imutável__, significando que seus caracteres individuais _não podem ser modificados_. Tentar fazer isso fará o interpretador lançar um `TypeError`.

In [None]:
boat = "Boat"
# Vamos tentar modificar o primeiro caractere:
boat[0] = 'C'

O __operador dois-pontos `:`__, como em `[i:j]`, é usado para fazer um
__fatiamento__ de uma string do seu caractere na posição $ i $ (inclusive) até seu
caractere na posição $ j $ (exclusive). Esta operação não modifica a string (afinal,
strings são imutáveis); em vez disso, ela cria uma _nova_ string que consiste
nos caracteres com índices variando de $ i $ até $ j - 1 $, inclusive.

__Exemplo:__

In [None]:
string = 'magic'

# Fatia do caractere na posição 0 até o 2º (não incluindo o 2º):
init = string[0:2]
print(init, type(init))

# Fatia do 2º caractere até o 5º (não incluindo o 5º):
final = string[2:5]   
print(final, type(final))

print(init + final)

Omitir o primeiro índice em uma fatia tem o mesmo efeito que fatiar desde o início. De forma similar, se omitirmos o segundo índice, então a string será fatiada até o fim.

In [None]:
word = 'automaton'
print(word[:4])
print(word[4:])

Frequentemente é necessário criar uma cópia independente de uma string. Para fazer isso, uma _fatia completa_ `[:]` pode ser usada.

__Exemplo:__

In [None]:
string_1 = 'potion'

# Omita ambos os índices na fatia para criar uma cópia da string original:
string_2 = string_1[:]    

string_1 = 'magic'
print(string_1, string_2)

__Exercício:__ Seja $s$ uma variável cujo valor é uma string. Verdadeiro ou Falso? Explique.

(a) `s[:] == s[0:]`

(b) `s[:] == s[0:len(s)]`

(c) `s[:] == s[0:-1]`

O construtor de fatia também admite um terceiro argumento, que especifica o __tamanho do passo__ na operação de fatiamento. A sintaxe de uma fatia que faz uso de todos os três argumentos é, portanto:
`[<índice inicial (inclusive)> : <índice final (exclusive)> : <tamanho do passo>]`. Se omitido, o tamanho do passo é definido como $1$ por padrão. Tamanhos de passo também podem ser negativos, o que faz com que a string seja fatiada na direção da direita para a esquerda.

__Exemplo:__

In [None]:
s = "magic"
print(s[::1])   # Fatia completa, tamanho do passo 1 explícito.
print(s[::2])   # Fatia consistindo de caracteres com índices pares.
print(s[1::2])  # Fatia consistindo de caracteres com índices ímpares.
print(s[::-1])  # Fatia que resulta na string invertida.

📝 Como acima, para criar uma cópia de uma string $s$ com seus caracteres invertidos, usamos `s[::-1]`.

__Exercício:__ Suponha que a variável $p$ contém a string "thought". Qual é a saída das seguintes instruções?

(a) `p[::2]`

(b) `p[1::4]`

(c) `p[2:4:2]`

(d) `p[2:5:2]`

(e) `p[2:6:2]`

(f) `p[2:7:2]`

(g) `p[::-1]`

(h) `p[4:0:-1]`

(i) `p[4::-2]`

(j) `p[1::-1]`

Aqui está um resumo das operações com strings que consideramos até agora:

| Operação       | Significado                |
| :--------------| :-------------------------|
| `+`             | concatenação              |
| `*`             | repetição                 |
| `<string>[]`    | indexação (acesso)        |
| `<string>[:]`   | fatiamento               |
| `len(<string>)` | comprimento              |

## $ \S 3 $ Comparando strings

Todos os operadores de comparação introduzidos no notebook anterior funcionam para strings também. As strings são ordenadas de acordo com a __ordem lexicográfica__ (ou __ordem de dicionário__). Portanto:

* Os operadores `==` e `!=` indicam se duas strings têm o mesmo valor ou não, isto é, se elas consistem exatamente dos mesmos caracteres na mesma ordem (isso inclui distinguir letras maiúsculas de minúsculas).
* Quando aplicado a duas strings $a$ e $b$, `a < b` retorna `True` se e somente se $a$ vem antes de $b$ na ordem do dicionário. De forma similar para `<=`, `>` e `>=`.

__Exercício:__ Sejam $a,\,b,\,q,\,r$ como definidos na célula de código abaixo. Determine o valor de:

(a) `a != b`

(b) `a < b`

(c) `b < q`

(d) `q >= r`

(e) `b < a < q < r`

In [None]:
a = "potion"
b = "portion"
q = "quarterstaff"  
r = "robe"

## $ \S 4 $ Alguns métodos úteis de string

Um __método__ é uma função que está associada a todo objeto de uma determinada classe. Um método pode acessar e modificar diretamente o estado de um objeto sem que os dados correspondentes precisem ser passados explicitamente como argumento, como no caso das funções. No entanto, métodos também podem retornar valores para quem os chamou (não simplesmente modificar o objeto associado). Métodos são chamados usando a notação `<objeto>.<método>`.

Como exemplo, suponha que precisamos projetar uma classe Python para representar contas bancárias. Alguns candidatos naturais para métodos (com nomes autodescritivos) que poderiam ser associados a instâncias desta classe são:

* `depositar`
* `sacar`
* `transferir`
* `conferir_extrato`
* `imprimir_extrato`

Sempre que instanciamos um membro desta classe (isto é, criamos uma nova conta),
digamos `acc1`, ela automaticamente herdará todos os métodos associados àquela
classe. A instrução `acc1.depositar(10)` modificaria algum atributo interno desta
conta específica refletindo seu saldo para que $10$ seja adicionado a ele.
Claro, isso não tem efeito sobre o estado de qualquer outra instância da classe,
digamos `acc2`. Em contraste, a chamada `acc1.transferir(5, acc2)` modificaria os
estados de ambas as contas (adicionando $5$ ao saldo da segunda enquanto subtrai
$5$ do saldo da primeira) e também poderia retornar algum valor como uma string
indicando sucesso ou falha da operação ou a data e hora.

Como texto é uma das formas mais comuns de dados, ser capaz de manipulá-lo e processá-lo efetivamente é essencial para muitas aplicações. Python fornece vários métodos incorporados para o tipo string. Mencionamos alguns dos mais importantes muito brevemente para que o leitor possa ter uma ideia aproximada do que é possível (não tente memorizar seus nomes!).

Para obter uma lista completa dos métodos e atributos associados a um determinado objeto $x$ (como uma string), você pode executar `dir(x)` (note que a saída pode ser truncada se for muito longa). Para mais detalhes e explicações sobre métodos de string especificamente, por favor consulte a [documentação](https://docs.python.org/3/library/stdtypes.html#string-methods) oficial.

__Exemplos de métodos de string:__

In [None]:
# Criar uma string:
s = "Shall I compare thee to a summer's day? Thou art more lovely and more temperate."
print(s)

In [None]:
# replace -- Substitui ocorrências de uma substring por outra substring:
s_quite = s.replace("more", "quite")
print(s_quite)

In [None]:
# find -- Retorna o índice da primeira ocorrência de uma substring:
index = s.find("I")
print(index)

In [None]:
# count -- Conta as ocorrências de uma substring:
c = s.count("more")
print(c)

In [None]:
# strip, lstrip e rstrip -- Remove caracteres/espaços em branco iniciais ou finais:
s_with_spaces = "\t\n   " + s + "   "

# lstrip remove os caracteres especificados do início da string.
# Por padrão, remove todos os caracteres de espaço em branco (incluindo '\n' e '\t'):
s_lstripped = s_with_spaces.lstrip()     
print(s_lstripped)

# 'rstrip' remove os caracteres especificados do final da string:
s_rstripped = s.rstrip('et.')
print(s_rstripped)

In [None]:
# split -- Divide a string em uma lista usando um delimitador (padrão = espaço):
words = s.split()
print(words)

In [None]:
# join -- Une elementos de um iterável (ex.: lista) usando a string:
separator = " "    # Esta é a string à qual join será aplicado.
list_of_words = ["Parallel", "lines", "have", "so", "much", "in", "common."]

sentence = separator.join(list_of_words)
print(sentence)

__Exercício:__ Dada a string `gentle` abaixo, estude os efeitos dos seguintes métodos de string sobre ela:

(a) `capitalize`

(b) `title`

(c) `upper`

(d) `title`

(e) `centered(<width>)`

In [None]:
gentle = "dO NoT gO geNTLe iNtO thAt gOOd nIGHt."