# Introdução à Programação para Ciência de Dados

### Aula 6: Strings I

**Professor:** Igor Malheiros

## Strings

Nós já utilizamos strings desde aulas passadas, em funções como `input()` e `print()`. Além disso, nós estudamos algumas operações de conversões de outros tipos para string e vice-versa. Finalmente, nós utilizamos algumas operações possíveis em strings como o operador `+` que realiza concatenação entre duas strings e também vimos que esse operador não funciona quando os operandos são uma string e um valor numérico.

### Caracteres

A string é formada por uma **sequência de caracteres**. O caractere é uma unidade da string. Por exemplo, na string `"Python"`, temos que `'P'` é o primeiro caractere, `'y'` é o segundo caractere, `'t'` é o terceiro caractere, `'h'` é o quarto caractere, `'o'` o quinto caractere e `'n'` é o sexto caractere. Ou seja, a string `"Python"` é formada por essa sequência de caracteres (`'P'`, `'y'`, `'t'`, `'h'`, `'o'` e `'n'`).

Os caracteres não precisam ser apenas letras maiúsculas e minúsculas, elas também podem ser números (`'1'`, `'4'`, `'100'`, `'-20'`), símbolos (`'!'`, `'+'`, `'%'`, `'@'`) ou caracteres especiais (`' '`, `'\n'`, `'\t'`, `'\b'`).

Quando uma string não possui nenhum caractere, chamamos essa string de **string vazia**.

In [1]:
# string apenas com letras
string = "abcde"
print(string)

abcde


In [2]:
# string com letras e números
string = "abcd123"
print(string)

abcd123


In [4]:
# strings com letras, números, símbolos
string = 'abcde1234)%*'
print(string)

abcde1234)%*


In [5]:
# string com ' '
string = "Eu amo Python"
print(string)

Eu amo Python


In [6]:
# string com '\n'
string = "Eu\namo\nPython"
print(string)

Eu
amo
Python


In [7]:
# string com '\t'
string = "Eu\tamo\tPython"
print(string)

Eu	amo	Python


In [8]:
# string com '\b'
string = "Eu\bamo\bPython"
print(string)

EuamoPython


In [10]:
# string vazia
string = ""
print(string)




### Acessando cada caractere

É possível acessar cada caractere de uma string individualmente utilizando posição de um caractere da sequência entre colchetes `[3]`. É importante destacar que utilizamos a contagem começando de **`0`**!

| P | y | t | h | o | n |
|:-:|:-:|:-:|:-:|:-:|:-:|
| 0 | 1 | 2 | 3 | 4 | 5 |

```Python
string = "Python"

print(string[0]) # -> 'P'
print(string[4]) # -> 'o'
```

Os índices também podem ser expressões ou variáveis que resultem em um valor inteiro.

```Python
string = "Python"
i = 2

print(string[i]) # -> 't'
print(string[2*2]) # -> 'o'
```

Caso um número maior do que o último índice seja acessado, será gerado um *bug*, conhecido como *index out of range* (índice fora do intervalo).

```Python
string = "Python"

print(string[4*2]) # -> Erro!
print(string[10]) # -> Erro!
```

Caso o índice seja acessado por um número negativo, o acesso será feito de trás pra frente.

```Python
string = "Python"

print(string[-1]) # -> 'n'
print(string[-3]) # -> 'h'
print(string[-6]) # -> 'P'
```

Se o índice negativo for menor do que o primeiro caractere na contagem invertida, será gerado *bug* do *index out of range*. Ou seja, o menor caractere negativo que podemos acessar é o tamanho da string multiplicado por `-1`.

```Python
string = "Python"

print(string[-7]) # -> Erro!
```

Apesar de conseguirmos acessar cada caractere de uma string, **não se pode modificá-los diretamente!**

```Python
string = "Python"
string[0] = 'X' # -> Erro!
```

In [13]:
# Acessando string com inteiros positivos
string = "Eu amo Python"
print(string[7])

P


In [16]:
# Acessando string com inteiros negativos
print(string[-3])

h


In [18]:
# Acessando string maior ou igual ao tamanho (bug)
print(string[13])

IndexError: string index out of range

In [24]:
# Acessando string menor do que o tamanho * -1 (bug)
print(string[-14])

IndexError: string index out of range

In [25]:
# Modificando um caractere (bug)
string[0] = 'X'

TypeError: 'str' object does not support item assignment

### Função len()

As **funções** são porções de códigos que realizam uma determinada tarefa e podemos utilizar ao longo dos nossos programas. Em geral, nós vamos entrar com algum dado e a função retornará algum resultado dependendo do valor de entrada.

Algumas dessas funções já são **nativas** de Python e podemos utilizá-las quando quisermos, `print()`, `input()`, `int()`, `float()` e `str()` são exemplos de funções nativas que já utilizamos em aulas passadas. Existem algumas funções que **não são nativas** e precisamos explicitamente dizer de onde estamos utilizando. Além disso, nós também podemos criar nossas próprias funções. Nós vamos nos aprofundar mais em funções em aulas futuras.

A função `len()` é uma função que vai receber uma string e vai retornar o tamanho dessa string.

```Python
print(len("Python")) # -> 6
print(len("casa")) # -> 4
print(len("   ")) # -> 3
print(len("")) # -> 0
```

### Loop while em Strings

Uma operação muito comum em strings é quando queremos iterar sobre os caracteres de uma string. Podemos utilizar o laço de repetição `while` com a função `len()` para realizar essa tarefa.

```Python
string = "Python"
indice = 0

while indice < len(string):
    caractere = string[indice]
    print(caractere)
    indice = indice + 1

```

In [27]:
# Exemplo while
string = "Python"
indice = 0

while indice < len(string):
    caractere = string[indice]
    print("* " + caractere)
    indice = indice + 1

* P
* y
* t
* h
* o
* n


### Loop for em Strings

Uma outra forma de iterar sobre os caracteres de uma string é utilizando o laço de repetição `for`. Para o `for`, nós não precisamos utilizar a função `len()`, pois podemos definir exatamente os elementos que o iterador pode assumir.

```Python
string = "Python"

for caractere in string:
    print(caractere)
```

O operador `in` quando aplicado em uma string no `for`, faz com que o iterador assuma os valores de cada caractere da string.

In [29]:
# Exemplo for
s = "Python"
for c in s:
    print("* " + c)

* P
* y
* t
* h
* o
* n


## Exercício 1

Faça um programa que lê uma string digitada pelo usuário e imprime o primeiro e o último caractere.

In [34]:
s = input("Digite uma string qualquer")
print("O primeiro elemento eh: ", s[0])
print("O ultimo elemento eh: ", s[len(s)-1])

Digite uma string qualquerPython
O primeiro elemento eh:  P
O ultimo elemento eh:  n


## Exercício 2

Faça um programa que lê uma string digitada pelo usuário e imprime cada caractere seguido pela sua posição na string.

In [36]:
s = input("Digite uma string qualquer")
indice = 0

while indice < len(s):
    c = s[indice]
    print(c, indice)
    indice = indice + 1

Digite uma string qualquerPython
P 0
y 1
t 2
h 3
o 4
n 5


## Exercício 3

Faça um programa que lê uma string digitada e conta quantas vezes o caractere `'a'` apareceu nessa string.

In [41]:
s = input("Digite uma string qualquer")

cnt = 0

for c in s:
    if c == 'a' or c == 'A':
        cnt = cnt + 1
        
print(cnt)

Digite uma string qualquerCASA
2


In [32]:
s = "Python"
s_result = ""
# *P*y*t*h*o*n
for c in s:
    s_result = s_result + ("*" + c)
    
# 1 concatenacao "" + ("*" + "P") -> "*P"
# 2 concatenacao "*P" + ("*" + "y") -> "*P*y"
# 3 concatenacao "*P*y" + ("*" + "t") -> "*P*y*t"
# ...
# "*P*y*t*h*o*n"
print(s_result)

*P*y*t*h*o*n
