# Tipos de dados
Por padrão, Python oferece alguns tipos de dados comuns.
* ~~Números (inteiros, decimais, complexos)~~
* **Strings**
* Listas
* Tuplas
* Conjuntos
* Dicionários

# Strings
* É uma cadeia ou sequência de caracteres
* Pode ser representada entre aspas duplas ou simples
* Pode também ser representada por aspas triplas, mas isso é normalmente usado em textos múltiplas linhas ou documentação

**Observação**: Em algumas linguagens, há um tipo de dado que representa um único caractere (char). Em Python, isso não existe.

### Declaração

Existem várias formas de declarar strings, com aspas simples, aspas duplas ou uma sequência de 3 aspas (simples ou duplas) para strings multilinhas.

In [None]:
singlequote = 'Python String'
print(singlequote)

doublequote = "Python String"
print(doublequote)

triplequote = """
    SELECT *
    FROM TABLE
    WHERE A = 10
"""
print(triplequote)

### Acessando elementos (slicing)

Podemos acessar elementos ou extrairmos substrings com o conceito de fatiamento (slicing).

In [1]:
myString = 'Python é muito legal'

# imprimindo o primeiro caracter
print(myString[0])

# imprimindo do 10º ao 15º caracter (lembrem-se que índices começam de 0)
print(myString[9:14])

# outras formas de slicing
print(myString[:])
print(myString[9:]) 
print(myString[:14])

P
muito
Python é muito legal
muito legal
Python é muito


### Índice negativo

Diferentemente da maioria das linguagens de programação, Python aceita índices negativos. Quando negativos, o índice conta a partir do final da string, como mostrado abaixo.

![alt text](images/1.png "Índices negativos")

In [2]:
# jeito bobão
print(myString[len(myString) - 1])

# jeito Python de ser
print(myString[-1])

l
l


In [3]:
print(myString[-1])
print(myString[-2])
print(myString[-5])

print(myString[9:-2])

l
a
l
muito leg


### Index out of range
É muito comum tentarmos acessar índices que não existem na string ou qualquer outra sequência.

In [4]:
myString[30]

IndexError: string index out of range

In [5]:
myString[1.5]

TypeError: string indices must be integers

Entretanto, quando fatiamos usando índices que não existem, exceções não são geradas.

In [6]:
myString[9:100]

'muito legal'

In [7]:
myString[30:31]

''

### Mudando ou atualizando uma string
Strings são imutáveis, ou seja, não podem ser alteradas. Basta reatribuir um novo valor.

In [8]:
# criando strings e verificando endereço de memória
str1 = 'Python '
print(str1)
print('Endereço de memória da string antes da alteração', id(str1))

# modificando
str1 += 'é legal!' 
print(str1)
print('Endereço de memória da string depois da alteração', id(str1))

Python 
Endereço de memória da string antes da alteração 1919043416624
Python é legal!
Endereço de memória da string depois da alteração 1919043270768


In [11]:
str2 = 'Python'
print(str2)
str2[4] = 's'

Python


TypeError: 'str' object does not support item assignment

### Deletando uma string

In [12]:
str3 = 'Au au au'
del str3
print(str3)

NameError: name 'str3' is not defined

### Iterando uma string

In [13]:
str1 = 'Python'
for s in str1:
    print(s)

P
y
t
h
o
n


### Comparando strings

In [14]:
print('Python' == 'Python')
print('PYTHON' == 'Python')

True
False


In [15]:
print('PYTHON' != 'Java')

True


In [16]:
print('Python' > 'PYTHON')
print('Python' < 'PYTHON')

True
False


In [17]:
print('Python' >= 'PYTHON')
print('Python' <= 'PYTHON')

True
False


### Operador `in`

Como vimos anteriormente, o operador `in` verifica se o operando da esquerda é membro ou está contido no operando da direita.

In [18]:
str1 = 'Feliz Natal! Ho-ho-ho'
print('Natal' in str1)

True


In [19]:
str2 = 'Bons estudos, galera!'
print('maus' not in str2)

True


### Escape codes
https://www.quackit.com/python/reference/python_3_escape_sequences.cfm

In [20]:
str1 = '\'
print(str1)

SyntaxError: EOL while scanning string literal (<ipython-input-20-06c2fac1c191>, line 1)

In [21]:
str1 = '\\'
print(str1)

\


In [22]:
str1 = '\'Hello World!\''
print(str1)

'Hello World!'


In [23]:
str1 = '\"Hello World!\"'
print(str1)

"Hello World!"


In [24]:
str1 = '\tHello\nWorld!'
print(str1)

	Hello
World!


In [25]:
str1 = '\x48\x65\x6c\x6c\x6f\x20\x57\x6f\x72\x6c\x64\x21'
print(str1)

Hello World!


### Funções
#### Concatenando uma ou mais strings

In [26]:
str1 = 'Python'
str2 = ' é legal!'
print(str1 + str2)

Python é legal!


In [27]:
str1 = 'Python '
print(str1 * 5)

Python Python Python Python Python 


In [28]:
title = ' TÍTULO ESTILIZADO '
print('*' * 30)
print('*' * 3 + title + ' ' * (30 - len(title) - 6) + '*' * 3)
print('*' * 30)

******************************
*** TÍTULO ESTILIZADO      ***
******************************


#### Função `len`

Retorna o tamanho da string.

In [29]:
str1 = 'Python'
print(len(str1))

6


#### Funções `ord` e `chr` 

* `ord` retorna o código da tabela ASCII do caracter em questão.
* `chr` retorna a string com o símbolo da tabela ASCII a partir do código.

In [30]:
print(ord('a'))

97


In [31]:
print(ord('ab'))

TypeError: ord() expected a character, but string of length 2 found

In [32]:
print(chr(97))
print(chr(65))

a
A


#### Função `str`

Converte um objeto qualquer em string. Veremos mais adiante como que isso funciona internamente.

In [33]:
str1 = str(2)
print(str1, type(str1))

2 <class 'str'>


In [34]:
str1 = str(1.5)
print(str1, type(str1))

1.5 <class 'str'>


#### Funções `int` e `float`

In [35]:
str1 = '5'
print(int(str1))

5


In [36]:
str1 = '5.2'
print(float(str1))

5.2


In [37]:
str1 = '5.2'
print(int(str1))

ValueError: invalid literal for int() with base 10: '5.2'

### Métodos ou membros

#### Método `strip`

Remove os espaços à esquerda e à direita da string.

In [38]:
str1 = '    Bem-vindos ao treinamento em Python '
print(str1) # imprimindo com espaços
print(str1.strip()) # imprimindo sem espaços

    Bem-vindos ao treinamento em Python 
Bem-vindos ao treinamento em Python


#### Métodos `lower` e `islower`

* `lower` converte caracteres da string em minúscula.
* `islower` verifica se a string está toda em minúscula.

In [39]:
str1 = 'Andrade Gutierrez'
print(str1.islower())
print(str1.lower())

False
andrade gutierrez


#### Métodos `upper` e `isupper`

* `upper` converte caracteres da string em maiúscula.
* `isupper` verifica se a string está toda em maiúscula.

In [40]:
str1 = 'Andrade Gutierrez'
print(str1.isupper())
print(str1.upper())

False
ANDRADE GUTIERREZ


#### Método `isalpha`

Verifica se todos os caracteres da string são letras.

In [41]:
str1 = 'Python'
str2 = 'Python123'
str3 = '123'
str4 = 'Python@#@#'
str5 = 'Python123@#@#'
print(str1.isalpha())
print(str2.isalpha())
print(str3.isalpha())
print(str4.isalpha()) 
print(str5.isalpha()) 

True
False
False
False
False


#### Método `isdigit`

Verifica se todos os caracteres da string são dígitos.

In [63]:
str1 = 'P'
str2 = 'y'
str3 = '1'
str4 = '2'
str5 = '3'
print(str1.isdigit())
print(str2.isdigit())
print(str3.isdigit())
print(str4.isdigit()) 
print(str5.isdigit()) 

False
False
True
True
True


#### Método `isalnum`

Verifica se todos os caracteres da string são alfa-numéricos.

In [71]:
str1 = 'Python'
str2 = 'Python123'
str3 = '123'
str4 = 'Python@#@#'
str5 = 'Python123@#@#'
print(str1.isalnum())
print(str2.isalnum())
print(str3.isalnum())
print(str4.isalnum()) 
print(str5.isalnum()) 

True
True
True
False
False


#### Método `count`

Retorna o número de ocorrências de uma string em outra.

In [44]:
str1 = 'Mult é meu amigo, Mult é meu colega...'
substr = 'Mult'
print(str1.count(substr))

2


#### Método `join`

Junta uma lista (veremos mais adiante) em uma única string. A string invocada servirá como string de união.

In [45]:
str1 = '-'
str2 = 'Python'
print(str1.join(str2))

P-y-t-h-o-n


In [46]:
str1 = '-'
list1 = ['Python', 'é', 'legal', '!']
print(str1.join(list1))

Python-é-legal-!


In [47]:
print(', '.join('ABC'))

A, B, C


In [48]:
print('\\'.join(['C:', 'Arquivos de Programas', 'Python']))

C:\Arquivos de Programas\Python


#### Método `split`

"Quebra" a string em uma lista de strings a partir de uma string de entrada.

In [49]:
str1 = 'Bem-vindos ao treinamento em Python'
print(str1.split())

['Bem-vindos', 'ao', 'treinamento', 'em', 'Python']


In [50]:
str1 = 'Bem-vindos  ao  treinamento em Python '
print(str1.split())

['Bem-vindos', 'ao', 'treinamento', 'em', 'Python']


In [57]:
str1 = 'A,B,C'
print(str1.split(','))

['A', 'B', 'C']


In [52]:
str1 = 'A, B, C'
print(str1.split(','))

['A', ' B', ' C']


In [53]:
str1 = 'A,B,C,'
print(str1.split(','))

['A', 'B', 'C', '']


In [54]:
str1 = 'Bem-vindos  ao  treinamento em Python '
print(str1.split(' '))

['Bem-vindos', '', 'ao', '', 'treinamento', 'em', 'Python', '']


#### Método `find`

Retorna o índice da primeira ocorrência da string alvo.

Quando nenhuma ocorrência for encontrada, o valor `-1` será retornado.

In [63]:
str1 = 'Python é muito legal!'
substr = 'muito'
print('Achamos a substring \'muito\' no índice', str1.find(substr))

Achamos a substring 'muito' no índice 9


In [61]:
str1 = 'Python é muito legal!'
substr = 'pouco'
print('Achamos a substring \'pouco\' no índice', str1.find(substr))

Achamos a substring 'pouco' no índice -1


#### Método `replace`

Substitui dentro de uma string uma string por outra.

In [64]:
# substituindo caracteres
fruit = 'Appla'
print(fruit.replace('a', 'e'))

Apple


In [65]:
# substituindo strings
colors = 'vermelho, rosa, verde, amarelo, rosa'
print(colors.replace('rosa', 'azul'))

vermelho, azul, verde, amarelo, azul


#### Métodos `startswith` e `endswith`

Verifica se a string começa ou termina com outra indicada.

In [66]:
text = 'Python é fácil de aprender'
print(text.startswith('Python'))

True


In [67]:
text = 'Python é fácil de aprender'
print(text.endswith('aprender'))

True


## Formatando strings
https://pyformat.info/

Vimos anteriormente que podemos formatar strings para apresentação de mensagens. Essa formatação tem como objetivo facilitar diversas operações como concatenação, padronização, delimitação, etc.

#### Formatação básica

In [68]:
str1 = 'one'
str2 = 'two'

In [69]:
# forma antiga
'%s %s' % (str1, str2)

'one two'

In [70]:
# forma nova
'{} {}'.format(str1, str2)

'one two'

In [71]:
# forma ainda mais nova
f'{str1} {str2}'

'one two'

In [72]:
# invertendo
'{1} {0}'.format(str1, str2)

'two one'

#### Paddings

Alinhando à direita

In [73]:
# forma antiga
print('|%10s|' % (str1))

# forma nova
print('|{:>10}|'.format(str1))

# forma ainda mais nova
print(f'|{str1:>10}|')

|       one|
|       one|
|       one|


Alinhando à esquerda

In [74]:
# forma antiga
print('|%-10s|' % (str1))

# forma nova
print('|{:<10}|'.format(str1))

# forma ainda mais nova
print(f'|{str1:<10}|')

|one       |
|one       |
|one       |


Alinhando no centro

In [75]:
# não existe no formato antigo

# forma nova
print('|{:^10}|'.format(str1))

# forma ainda mais nova
print(f'|{str1:^10}|')

|   one    |
|   one    |


Caractere de padding

In [76]:
# forma nova
print('|{:~>10}|'.format(str1))
print('|{:~<10}|'.format(str1))
print('|{:~^10}|'.format(str1))
print()
print(f'|{str1:~>10}|')
print(f'|{str1:~<10}|')
print(f'|{str1:~^10}|')

|~~~~~~~one|
|one~~~~~~~|
|~~~one~~~~|

|~~~~~~~one|
|one~~~~~~~|
|~~~one~~~~|


#### Truncando

In [77]:
# forma antiga
print('%.2s' % (str1))

# forma nova
print('{:.2s}'.format(str1))

# forma ainda mais nova
print(f'{str1:.2s}')

on
on
on


Combinando o truncar com o alinhar (padding)

In [78]:
# forma antiga
print('|%-10.2s|' % (str1))

# forma nova
print('|{:<10.2s}|'.format(str1))

# forma ainda mais nova
print(f'|{str1:<10.2s}|')

|on        |
|on        |
|on        |


#### Formatando números

In [79]:
i1 = 42
f1 = 3.141592653589793

In [80]:
# forma antiga
print('%d' % (i1))

# forma nova
print('{:d}'.format(i1))

# forma ainda mais nova
print(f'{i1:d}')

42
42
42


In [81]:
# forma antiga
print('%f' % (f1))

# forma nova
print('{:f}'.format(f1))

# forma ainda mais nova
print(f'{f1:f}')

3.141593
3.141593
3.141593


In [82]:
print(f'{i1}')
print(f'{f1}')

42
3.141592653589793


In [83]:
print(f'{i1:f}')
print(f'{f1:d}')

42.000000


ValueError: Unknown format code 'd' for object of type 'float'

#### Alinhando números

In [84]:
# forma antiga
print('%4d' % (i1))

# forma nova
print('{:4d}'.format(i1))

# forma ainda mais nova
print(f'{i1:4d}')

  42
  42
  42


In [85]:
# forma antiga
print('%04d' % (i1))

# forma nova
print('{:04d}'.format(i1))

# forma ainda mais nova
print(f'{i1:04d}')

0042
0042
0042


In [86]:
# forma antiga
print('%06.2f' % (f1))

# forma nova
print('{:06.2f}'.format(f1))

# forma ainda mais nova
print(f'{f1:06.2f}')

003.14
003.14
003.14


#### `getitem` e `getattr`

In [87]:
person = {'first': 'Pieter', 'last': 'Voloshyn'}
print('{p[first]} {p[last]}'.format(p=person))

Pieter Voloshyn


In [88]:
data = [4, 8, 15, 16, 23, 42]
print('{d[4]} {d[5]}'.format(d=data))

23 42


#### Datetime

In [89]:
from datetime import datetime

dt = datetime(2001, 2, 3, 4, 5)

# forma nova
print('{:%Y-%m-%d %H:%M}'.format(dt))

# forma ainda mais nova
print(f'{dt:%Y-%m-%d %H:%M}')

2001-02-03 04:05
2001-02-03 04:05


# Exercícios

In [90]:
str1 = 'Python'
str2 = 'massa'
int1 = 5
float1 = 4.7

**1)** Dadas as variáveis acima, formate uma saída (com `print`) de acordo com os testes que serão executados.

In [94]:
str_formatada = '{} é \"{}\"!'.format(str1, str2)
print(str_formatada)
assert str_formatada == 'Python é "massa"!', 'Você errrouuuuu'
print('Show de bola!')

Python é "massa"!
Show de bola!


In [102]:
str_formatada = 'A divisão entre {} e {} resulta em {:.2f}'.format(int1, float1,int1/float1)
print(str_formatada)
assert str_formatada == 'A divisão entre 5 e 4.7 resulta em 1.06', 'Você errrouuuuu'
print('Show de bola!')

A divisão entre 5 e 4.7 resulta em 1.06
Show de bola!


In [105]:
str_formatada = 'A primeira letra de {} é \"{}\" e a última é \"{}\".'.format(str1, str1[0],str1[-1])
print(str_formatada)
assert str_formatada == 'A primeira letra de Python é "P" e a última é "n".', 'Você errrouuuuu'
print('Show de bola!')

A primeira letra de Python é "P" e a última é "n".
Show de bola!


**2)** Programe a função `inverterstring(s)` para inverter uma string `s`.

Parâmetros:
* **s**: string de entrada

Retorno: String invertida

Exemplos de uso:
```python
inverterstring('cadeira') -> 'ariedac'
inverterstring('uva') -> 'avu'
```

In [4]:
def inverterstring(s):
    # seu código vem aqui
    
    t = (len(s)*-1)
    i = -1
    invertido = ''
    
    while (i >= t):
        
        invertido = invertido + s[i]
       
        i+=(-1)
    
    return invertido

# resultado esperado: 'avu'
inverterstring('Fernando')

'odnanreF'

In [122]:
assert inverterstring('uva') == 'avu', 'Você errrouuuuu'
assert inverterstring('cadeira') == 'ariedac', 'Você errrouuuuu'
print('Show de bola!')

Show de bola!


**3)** Programe a função `ehpalindromo(s)` que verifica se uma string `s` é um palíndromo ou não. Lembrando que palíndromos são palavras ou frases que se comparadas com seu inverso são idênticas.

Parâmetros:
* **s**: string de entrada

Retorno: `True` quando a string for um palíndromo. **Obs.**: essa função deve ser *case insensitive*, ou seja, deve ignorar se as letras estão em maiúsculas ou minúsculas.

Exemplos de uso:
```python
ehpalindromo('radar') -> True
ehpalindromo('Lael é leal') -> True
ehpalindromo('olho') -> False
```

In [123]:
inverterstring('Lael é leal')

'lael é leaL'

In [5]:
def ehpalindromo(s):
    
    return inverterstring(s).lower() == s.lower()
    

# resultado esperado: True
ehpalindromo('Lael é leal')

True

In [6]:
assert ehpalindromo('radar') == True, 'Você errrouuuuu'
assert ehpalindromo('Lael é leal') == True, 'Você errrouuuuu'
assert ehpalindromo('olho') == False, 'Você errrouuuuu'
print('Show de bola!')

Show de bola!


**4)** Programe a função `getmiddlestr(s)` para retornar os 3 caracteres do meio de uma string (`s`).

Parâmetros:
* **s**: string de entrada

Retorno:
Substring com 3 caracteres do meio da string

Exemplos de uso:
```python
getmiddlestr('abracadabra') -> 'cad'
getmiddlestr('lapis') -> 'api'
getmiddlestr('azul') -> 'azu'
getmiddlestr('a') -> 'a'
```

In [13]:
def getmiddlestr(s,mid):
    
    if len(s) >=mid:
        
        while (len(s) > mid):
        
            s = s[:len(s)-1]
            
            if len(s) > mid:
                
                s = s[(len(s)-1)*(-1):] 
        
            else:
                
                return s
            
        return s
            
    else:
    
        return s
        
# resultado esperado: 'cad'
getmiddlestr('0123456789',1)

'4'

In [9]:
assert getmiddlestr('abracadabra',3) == 'cad', 'Você errrouuuuu'
assert getmiddlestr('lapis',3) == 'api', 'Você errrouuuuu'
assert getmiddlestr('azul',3) == 'azu', 'Você errrouuuuu'
assert getmiddlestr('a',3) == 'a', 'Você errrouuuuu'
print('Show de bola!')

Show de bola!


**5)** Programe a função `countdigits(s)` para retornar a quantidade de dígitos existentes em uma string (`s`).

Parâmetros:
* **s**: string de entrada

Retorno:
Quantidade de dígitos (0-9) dentro da string

Exemplos de uso:
```python
countdigits('123') -> 3
countdigits('Python1') -> 1
countdigits('foo@bar.com') -> 0
```

In [11]:
def countdigits(s):
    
    count = 0
    
    for i in s:
        
        if i.isdigit():
            
            count +=1
            
    return count

# resultado esperado: 3
countdigits('fernando123')

3

In [75]:
assert countdigits('123') == 3, 'Você errrouuuuu'
assert countdigits('Python1') == 1, 'Você errrouuuuu'
assert countdigits('foo@bar.com') == 0, 'Você errrouuuuu'
print('Show de bola!')

Show de bola!


**6)** Programe a função `validapalavra(s, alfabeto)` para retornar `True` quando uma palavra (`s`) pode ser escrita com o alfabeto (`alfabeto`) informado. 

Parâmetros:
* **s**: string com a palavra
* **alfabeto**: string contendo todas as letras/ caracteres que devem ser obedecidos para indicar se a palavra é válida ou não.

Retorno:
**True** quando é possível montar a palavra
**False** quando não

Observação:
* Case insensitive, ou seja, se no alfabeto tiver a letra 'p' e apareça uma palavra com 'P', deve ser considerado como válido. 
* Accent sensitive, ou seja, o acento é relevante. Se não tiver 'á' no alfabeto e uma palavra vier com 'á', deve ser invalidada.
* Espaços devem ser ignorados.

Exemplos de uso:
```python
validapalavra('Python', 'honpty') -> True
validapalavra('ae ae ae ei ei ei o o o o', 'aeiou') -> True
validapalavra('ábaco', 'abco') -> False
validapalavra('PapaCo', 'apco') -> True
validapalavra('3m', 'maco') -> False
validapalavra('ei', 'aeiou') -> True
```

In [12]:
def validapalavra(s, alfabeto):

    s = (s.lower()).replace(' ','')
    alfabeto = alfabeto.lower()
    
    for i in s:
        
        if alfabeto.find(i) == -1:
            
            return False
        
    return True    

# resultado esperado: True
validapalavra('ae ae ae ei ei ei o o o o', 'aeiou')

True

In [10]:
assert validapalavra('Python', 'honpty') == True, 'Você errrouuuuu'
assert validapalavra('ae ae ae ei ei ei o o o o', 'aeiou') == True, 'Você errrouuuuu'
assert validapalavra('ábaco', 'abco') == False, 'Você errrouuuuu'
assert validapalavra('PapaCo', 'apco') == True, 'Você errrouuuuu'
assert validapalavra('3m', 'maco') == False, 'Você errrouuuuu'
assert validapalavra('ei', 'aeiou') == True, 'Você errrouuuuu'
print('Show de bola!')

Show de bola!


**7)** Programe a função `findlast(s, value)` para retornar o último índice de uma string (`value`) dentro de outra (`s`).

Parâmetros:
* **s**: string de entrada
* **value**: string a ser procurada

Retorno:
Último índice onde "value" é encontrada. -1 quando não for encontrada.

Exemplo de uso:

```python
findlast('Mult é meu amigo, Mult é meu colega', 'Mult') -> 18
findlast('Mult é meu amigo, Mult é meu colega', 'Maluco') -> -1
```

Dica: olhem a documentação do método *find()* em https://www.w3schools.com/python/ref_string_find.asp

In [82]:
def findlast(s, value):
    
    indice = s.rfind(value)
        
    return indice

# resultado esperado: 18
findlast('Mult é meu amigo, Mult é meu colega', 'Mult')

18

In [81]:
assert findlast('Mult é meu amigo, Mult é meu colega', 'Mult') == 18, 'Você errrouuuuu'
assert findlast('ABBA', 'A') == 3, 'Você errrouuuuu'
assert findlast('abracadabra', 'c') == 4, 'Você errrouuuuu'
assert findlast('abracadabra', 'z') == -1, 'Você errrouuuuu'
print('Show de bola!')

Show de bola!
