<a href="https://colab.research.google.com/github/bitwoman/pense-em-python/blob/main/capitulo_8.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **ESTUDO DO LIVRO "Pense em Python", DO AUTOR ALLEN B. DOWNEY**

<p> Estudos iniciados em 20-06-2024. </p>

# Capítulo 8: Strings

Strings não são como números inteiros, de ponto flutuante ou booleanos. Uma string é uma sequência, ou seja, uma coleção ordenada de outros valores.

<h2> 8.1 - Uma string é uma sequência </h2>

Uma string é uma sequência de caracteres. Você pode acessar um caractere de cada vez com o operador de colchete:

In [None]:
fruta = 'banana'
letra = fruta[1] # A expressão entre colchetes chama-se índice, que aponta qual caractere da sequência
                 # você quer (daí o nome).

print(fruta)
print(letra)

banana
a


Para a maior parte das pessoas, a primeira letra de ‘banana’ é b, não a. Mas para os cientistas da computação, o índice é uma referência do começo da string, e a referência da primeira letra é zero.

Você pode usar uma expressão que contenha variáveis e operadores como índice:

In [None]:
i = 1

print(fruta[i])

a


In [None]:
print(fruta[i+1])

n


Porém, o valor do índice tem que ser um número inteiro. Se não for, é isso que aparece:

**TypeError: string indices must be integers**

In [None]:
letra = fruta[1.5]

TypeError: string indices must be integers

<h2> 8.2 - len </h2>

**len** é uma função integrada que devolve o número de caracteres em uma string:

In [None]:
len(fruta) # 6

6

Para obter a última letra de uma string, pode parecer uma boa ideia tentar algo assim:

In [None]:
length = len(fruta)
last = fruta[length]

IndexError: string index out of range

A razão de haver um IndexError aqui é que não há nenhuma letra em ‘banana’ com o
índice 6. Como a contagem inicia no zero, as seis letras são numeradas de 0 a 5. Para obter o último caractere, você deve subtrair 1 de length:

In [None]:
last = fruta[length-1]
print(last)

a


Ou você pode usar índices negativos, que contam de trás para a frente a partir do fim da string. A expressão fruit[-1] apresenta a última letra, fruit[-2] apresenta a segunda letra de trás para a frente, e assim por diante.

<h2> 8.3 - Travessia com loop for </h2>

Muitos cálculos implicam o processamento de um caractere por vez em uma string.
Muitas vezes começam no início, selecionam um caractere por vez, fazem algo e
continuam até o fim. Este modelo do processamento chama-se travessia. Um modo de
escrever uma travessia é com o loop while:

In [None]:
index = 0

# Este loop atravessa a string e exibe cada letra sozinha em uma linha.
while index < len(fruta):
  letra = fruta[index]
  print(letra)
  index = index + 1

b
a
n
a
n
a


Como exercício, escreva uma função que receba uma string como argumento e exiba as letras de trás para a frente, uma por linha.


In [None]:
def backToFront(s):
  index = len(s) - 1

  while index >= 0:
    letra = s[index]
    print(letra)
    index = index - 1

In [None]:
backToFront('brenda')

a
d
n
e
r
b


Outra forma de escrever uma travessia é com um loop for:

Cada vez que o programa passar pelo loop, o caractere seguinte na string é atribuído à variável letter. O loop continua até que não sobre nenhum caractere.


In [None]:
for letra in fruta:
  print(letra)

b
a
n
a
n
a


O próximo exemplo mostra como usar a concatenação (adição de strings) e um loop for para gerar uma série abecedária (isto é, em ordem alfabética).

```
prefixes = 'JKLMNOPQ'
suffix = 'ack'
for letter in prefixes:
print(letter + suffix)
A saída é:
Jack
Kack
Lack
Mack
Nack
Oack
Pack
Qack

```



Claro que não está exatamente certo porque “Ouack” e “Quack” foram mal soletrados.
Como exercício, altere o programa para corrigir este erro.


In [None]:
prefixes = 'JKLMNOPQ'
suffix = 'ack'

for letter in prefixes:
  print(letter + suffix)

Jack
Kack
Lack
Mack
Nack
Oack
Pack
Qack


**COMPARAÇÃO DE SOLUÇÕES:**

**SOLUÇÃO PRÓPRIA:**

In [None]:
prefixes = 'JKLMNOPQ'
suffix = 'ack'

for letter in prefixes:
  if letter == 'O' or letter == 'Q':
    print(letter + 'u' + suffix)
  else:
    print(letter + suffix)

Jack
Kack
Lack
Mack
Nack
Ouack
Pack
Quack


**SOLUÇÃO CHATGPT:**

In [None]:
prefixes = 'JKLMNOPQ'
suffix = 'ack'

for letter in prefixes:
    if letter == 'O' or letter == 'Q':
        print(letter + 'u' + suffix)  # Adiciona "u" após "O" e "Q"
    else:
        print(letter + suffix)

Jack
Kack
Lack
Mack
Nack
Ouack
Pack
Quack


<h2> 8.4 - Fatiamento de strings </h2>

Um segmento de uma string é chamado de fatia. Selecionar uma fatia é como selecionar um caractere:

In [1]:
 s = 'Monty Python'

In [2]:
s[0:5]

'Monty'

In [3]:
s[6:12]

'Python'

O operador [n:m] retorna a parte da string do “enésimo” caractere ao “emésimo”
caractere, incluindo o primeiro, mas excluindo o último.

Se você omitir o primeiro índice (antes dos dois pontos), a fatia começa no início da string.

In [4]:
fruta = 'banana'
fruta[:3]

'ban'

Se omitir o segundo índice, a fatia vai ao fim da string:

In [5]:
fruta[3:]

'ana'

Se o primeiro índice for maior ou igual ao segundo, o resultado é uma string vazia, representada por duas aspas:

In [6]:
fruta[3:3]

''

Uma string vazia não contém nenhum caractere e tem o comprimento 0, fora isso, é igual a qualquer outra string.
Continuando este exemplo, o que você acha que fruit[:] significa? Teste e veja.

In [7]:
fruta[:] # retorna a string inteira

'banana'

<h2> 8.5 - Strings são imutáveis </h2>

É tentador usar o operador [] no lado esquerdo de uma atribuição, com a intenção de alterar um caractere em uma string. Por exemplo:

In [8]:
greeting = 'Hello, world!'

In [9]:
greeting[0] = 'J'

TypeError: 'str' object does not support item assignment

**TypeError: 'str' object does not support item assignment**

O “objeto” neste caso é a string e o “item” é o caractere que você tentou atribuir

A razão do erro é que as strings são imutáveis, o que significa que você não pode alterar uma string existente. O melhor que você pode fazer é criar uma string que seja uma variação da original:

In [11]:
'''
Esse exemplo concatena uma nova primeira letra a uma fatia de greeting.
Não tem efeito sobre a string original.
'''

greeting = 'Hello, world!'
new_greeting = 'J' + greeting[1:]
new_greeting

'Jello, world!'

<h2> 8.6 - Buscando </h2>

O que faz a seguinte função?

```
def find(word, letter):
  index = 0
  while index < len(word):
    if word[index] == letter:
      return index
    index = index + 1
  return-1
```

In [12]:
def find(word, letter):
  index = 0
  while index < len(word):
    if word[index] == letter:
      return index
    index = index + 1
  return -1

In [15]:
find('brenda', 'e')

2

In [16]:
find('brenda', 'f') # se não encontra, retorna -1

-1

De certo modo, find é o inverso do operador []. Em vez de tomar um índice e extrair o caractere correspondente, ele toma um caractere e encontra o índice onde aquele caractere aparece. Se o caractere não for encontrado, a função retorna -1.


Este modelo de cálculo – atravessar uma sequência e retornar quando encontramos o que estamos procurando – chama-se busca.

<h2> Como exercício, altere find para que tenha um terceiro parâmetro: o índice em word onde deve começar a busca. </h2>

In [17]:
def find(word, letter, index):

  while index < len(word):
    if word[index] == letter:
      return index
    index = index + 1
  return -1

In [20]:
find('brenda', 'e', 3) # começa a busca a partir do índice 3. retorna -1 pois o valor de 'e' está na posição 2

-1

<h2> 8.7 - Loop e contagem </h2>

O seguinte programa conta o número de vezes que a letra a aparece em uma string:

In [21]:
word = 'banana'
count = 0

for letter in word:
  if letter == 'a':
    count = count + 1

print(count)

3


Este programa demonstra outro padrão de computação chamado contador.
A variável count é inicializada com 0 e então incrementada cada vez que um a é encontrado. Ao sair do loop, count contém o resultado – o número total de letras 'a'.

<h2> Como exercício, encapsule este código em uma função denominada count e generalize-o para que aceite a string e a letra como argumentos.
Então reescreva a função para que, em vez de atravessar a string, ela use a versão de três parâmetros do find da seção anterior. </h2>

In [22]:
def count(word, letter, index):
  count = 0

  while index < len(word):
    if word[index] == letter:
      count = count + 1
    index = index + 1

  return count

In [25]:
count('brenda', 'a', 2) # retorna quantas ocorrências de 'a' existem a partir do índice 2, que é 1

1

<h2> 8.8 - Métodos de strings </h2>

As strings oferecem métodos que executam várias operações úteis. Um método é
semelhante a uma função – toma argumentos e devolve um valor –, mas a sintaxe é
diferente. Por exemplo, o método upper recebe uma string e devolve uma nova string com todas as letras maiúsculas.

Em vez da sintaxe de função upper(word), ela usa a sintaxe de método
**word.upper()**:

In [26]:
word = 'banana'
new_word = word.upper()
new_word

'BANANA'

Esta forma de notação de ponto especifica o nome do método, upper e o nome da string, word, à qual o método será aplicado. Os parênteses vazios indicam que este método não toma nenhum argumento.
Uma chamada de método denomina-se invocação; neste caso, diríamos que estamos
invocando upper em word.


E, na verdade, há um método de string denominado find, que é notavelmente semelhante à função que escrevemos:


Neste exemplo, invocamos find em word e passamos a letra que estamos procurando
como um parâmetro.

In [28]:
'''
Neste exemplo, invocamos find em word e passamos a letra que estamos procurando
como um parâmetro.
'''

word = 'banana'
index = word.find('a')
index

1

Na verdade, o método find é mais geral que a nossa função; ele pode encontrar
substrings, não apenas caracteres:

In [29]:
word.find('na')

2

Por padrão, find inicia no começo da string, mas pode receber um segundo argumento, o índice onde deve começar:

In [30]:
word.find('na', 3)

4

Este é um exemplo de um argumento opcional. find também pode receber um terceiro
argumento, o índice para onde deve parar:

In [32]:
'''
Esta busca falha porque 'b' não aparece no intervalo do índice de 1 a 2, não incluindo 2.
Fazer buscas até (mas não incluindo) o segundo índice torna find similar ao operador de
fatiamento.
'''

name = 'bob'
name.find('b', 1, 2)

-1

<h2> 8.9 - Operador in </h2>

A palavra in é um operador booleano que recebe duas strings e retorna True se a primeira aparecer como uma substring da segunda:

In [33]:
'a' in 'banana'

True

In [34]:
'seed' in 'banana'

False

Por exemplo, a seguinte função imprime todas as letras de word1 que também aparecem em word2:


Com nomes de variáveis bem escolhidos, o Python às vezes pode ser lido como um texto em inglês. Você pode ler este loop, “para (cada) letra em (a primeira) palavra, se (a) letra (aparecer) em (a segunda) palavra, exiba (a) letra”.
Veja o que é apresentado ao se comparar maçãs e laranjas:

In [35]:
def in_both(word1, word2):

  for letter in word1:
    if letter in word2:
      print(letter)

In [40]:
in_both('apples', 'oranges')

a
e
s


<h2> 8.10 - Comparação de strings </h2>

Os operadores relacionais funcionam em strings. Para ver se duas strings são iguais:

In [41]:
if word == 'banana':
  print('All right, bananas.')

All right, bananas.


Outras operações relacionais são úteis para colocar palavras em ordem alfabética:

In [42]:
if word < 'banana':
  print('Your word, ' + word + ', comes before banana.')
elif word > 'banana':
  print('Your word, ' + word + ', comes after banana.')
else:
  print('All right, bananas.')

All right, bananas.


<h2> 8.11 - Depuração </h2>

Ao usar índices para atravessar os valores em uma sequência, é complicado acertar o começo e o fim da travessia. Aqui está uma função que supostamente compara duas palavras e retorna True se uma das palavras for o reverso da outra, mas contém dois erros:


In [43]:
def is_reverse(word1, word2):
  # verifica se as palavras têm o mesmo comprimento
  # Este é um exemplo do modelo de guardião em “Verificação de tipos”, na página 101.
  if len(word1) != len(word2):
    return False

  '''
  i e j são índices: i atravessa word1 para a frente, enquanto j atravessa word2 para trás. Se
  encontrarmos duas letras que não combinam, podemos retornar False imediatamente. Se
  terminarmos o loop inteiro e todas as letras corresponderem, retornamos True.
  '''
  i = 0
  j = len(word2)

  while j > 0:
    if word1[i] != word2[j]:
      return False
    i = i+1
    j = j-1

  return True

Se testarmos esta função com as palavras “pots” e “stop”, esperamos o valor de retorno True, mas recebemos um IndexError:

In [44]:
is_reverse('pots', 'stop')

IndexError: string index out of range

Para depurar este tipo de erro, minha primeira ação é exibir os valores dos índices imediatamente antes da linha onde o erro aparece.


In [48]:
def is_reverse(word1, word2):
  # verifica se as palavras têm o mesmo comprimento
  # Este é um exemplo do modelo de guardião em “Verificação de tipos”, na página 101.
  if len(word1) != len(word2):
    return False

  '''
  i e j são índices: i atravessa word1 para a frente, enquanto j atravessa word2 para trás. Se
  encontrarmos duas letras que não combinam, podemos retornar False imediatamente. Se
  terminarmos o loop inteiro e todas as letras corresponderem, retornamos True.
  '''
  i = 0
  j = len(word2)

  while j > 0:
    print(i, j)
    if word1[i] != word2[j]:
      return False
    i = i+1
    j = j-1

  return True

Agora quando executo o programa novamente, recebo mais informação:

In [46]:
is_reverse('pots', 'stop')

0 4


IndexError: string index out of range

**IndexError: string index out of range**



Na primeira vez que o programa passar pelo loop, o valor de j é 4, que está fora do intervalo da string ‘pots’. O índice do último caractere é 3, então o valor inicial de j deve ser len(word2)-1.
Se corrigir esse erro e executar o programa novamente, recebo:

In [49]:
def is_reverse(word1, word2):
  # verifica se as palavras têm o mesmo comprimento
  # Este é um exemplo do modelo de guardião em “Verificação de tipos”, na página 101.
  if len(word1) != len(word2):
    return False

  '''
  i e j são índices: i atravessa word1 para a frente, enquanto j atravessa word2 para trás. Se
  encontrarmos duas letras que não combinam, podemos retornar False imediatamente. Se
  terminarmos o loop inteiro e todas as letras corresponderem, retornamos True.
  '''
  i = 0
  j = len(word2)-1

  while j > 0:
    print(i, j)
    if word1[i] != word2[j]:
      return False
    i = i+1 # 0 1 2 3
    j = j-1 # 3 2 1 0

  return True

In [50]:
is_reverse('pots', 'stop')

0 3
1 2
2 1


True

output das execuções vai apenas até a terceira devido à condição de j > 0 no while, portanto, não sendo mostrada na tela.

saídas de i:
**0 1 2 3**

saídas de j:
**3 2 1 0**

Para que apareça na tela, é necessário acrescentar um = na condição:

In [68]:
def is_reverse(word1, word2):
  # verifica se as palavras têm o mesmo comprimento
  # Este é um exemplo do modelo de guardião em “Verificação de tipos”, na página 101.
  if len(word1) != len(word2):
    return False

  '''
  i e j são índices: i atravessa word1 para a frente, enquanto j atravessa word2 para trás. Se
  encontrarmos duas letras que não combinam, podemos retornar False imediatamente. Se
  terminarmos o loop inteiro e todas as letras corresponderem, retornamos True.
  '''
  i = 0
  j = len(word2)-1

  while j >= 0:
    if word1[i] != word2[j]:
      return False
    i = i+1 # 0 1 2 3  4
    j = j-1 # 3 2 1 0 -1

  return True

In [58]:
is_reverse('pots', 'stop')

True

Acredito que o erro seja a função não ter nenhum trecho em que lide com o tamanho das letras - minúsculas e maiúsculas - e/ou com o caso de haver requisições a partir de índices diferente de 0, o que levará a comparações incorretas entre as duas strings, e/ou não reconhece espaços

In [59]:
is_reverse('Pots', 'stop')

False

In [64]:
is_reverse('', '')

True

In [70]:
is_reverse('!', '!')

True

In [72]:
is_reverse('a!b', 'b!a')

True

In [73]:
is_reverse(' a!b', 'b!a')

False

<h2> 8.12 - Glossário </h2>

objeto:
Algo a que uma variável pode se referir. Por enquanto, você pode usar “objeto” e
“valor” de forma intercambiável.

sequência:
Uma coleção ordenada de valores onde cada valor é identificado por um índice de
número inteiro.

item:
Um dos valores em uma sequência

índice:
Um valor inteiro usado para selecionar um item em uma sequência, como um
caractere em uma string. No Python, os índices começam em 0.

fatia:
Parte de uma string especificada por um intervalo de índices.

string vazia:
Uma string sem caracteres e de comprimento 0, representada por duas aspas.


imutável:
A propriedade de uma sequência cujos itens não podem ser alterados.

atravessar:
Repetir os itens em uma sequência, executando uma operação semelhante em cada
um.

busca:
Um modelo de travessia que é interrompido quando encontra o que está procurando.

contador:
Uma variável usada para contar algo, normalmente inicializada com zero e então
incrementada.

invocação:
Uma instrução que chama um método.

argumento opcional:
Um argumento de função ou método que não é necessário.