## **Python Essencial para Data Science**
**Prof. Dr. Samuel Martins (@hisamuka @xavecoding)** <br/>
xavecoding: https://youtube.com/c/xavecoding <br/><br/>

<a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/"><img alt="Creative Commons License" style="border-width:0" src="https://i.creativecommons.org/l/by-nc-sa/4.0/88x31.png" /></a><br />This work is licensed under a <a rel="license" href="http://creativecommons.org/licenses/by-nc-sa/4.0/">Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License</a>.

## Strings

#### Strings são também sequências

In [1]:
nome_1 = 'Luke skywalker'  # essa é a convenção da comunidade do Python
nome_2 = "Darth Vader"

print(nome_1)
print(nome_2)

Luke skywalker
Darth Vader


In [2]:
nome_1[0]

'L'

In [6]:
nome_1[6]

'k'

In [7]:
nome_1[-2]  # retorna o penúltimo caracter

'e'

In [4]:
nome_1[:4]

'Luke'

In [5]:
# quantos caracteres possui a string? Qual o tamanho da string?
len(nome_1)

14

#### Strings são imutáveis

In [8]:
nome = 'Luke skywalker'

In [9]:
nome[5]

's'

In [10]:
nome[5] = 'S'

TypeError: 'str' object does not support item assignment

Para fazer a substituição de um caracter em uma posição específica, precisaremos fazer uma "gambiarra" que veremos jajá.

### Métodos de Strings

`.upper()` retorna a string com todas as letras maiúscula

In [13]:
nome.upper()  # retorna uma cópia

'LUKE SKYWALKER'

In [14]:
nome

'Luke skywalker'

In [15]:
nome_maiscula = nome.upper()
print(nome)
print(nome_maiscula)

Luke skywalker
LUKE SKYWALKER


`.lower()` retorna a string com todas as letras minúsculas

In [17]:
nome_minuscula = nome.lower()
print(nome)
print(nome_minuscula)

Luke skywalker
luke skywalker


In [18]:
nome_de_maiscula_para_minuscula = nome_maiscula.lower()
print(nome_maiscula)
print(nome_de_maiscula_para_minuscula)

LUKE SKYWALKER
luke skywalker


`str.startswith(substring)` checa se a string `str` começa com a substring `substring`. 

In [20]:
print(nome)
print(nome_maiscula)
print(nome_minuscula)

Luke skywalker
LUKE SKYWALKER
luke skywalker


In [21]:
nome.startswith('Luke')

True

In [22]:
nome.startswith('LUKE')

False

In [23]:
nome_maiscula.startswith('LUKE')

True

`str.endswith(substring)` checa se a string `str` termina com a substring `substring`. 

In [24]:
print(nome)
print(nome_maiscula)
print(nome_minuscula)

Luke skywalker
LUKE SKYWALKER
luke skywalker


In [25]:
nome.endswith('r')

True

In [26]:
nome.endswith('walker')

True

In [27]:
nome.endswith('WALKER')

False

In [29]:
nome_maiscula.endswith('WALKER')

True

In [30]:
arquivo = 'imagem.png'

# checar se a extensão do arquivo é .png
if arquivo.endswith('.png'):
    print('É uma imagem png')
else:
    print('O arquivo não é PNG')

É uma imagem png


In [34]:
arquivo = 'imagem.PNG'

# checar se a extensão do arquivo é .png
# if arquivo.endswith('.png') or arquivo.endswith('.PNG'):
if arquivo.upper().endswith('.PNG'):
    print('É uma imagem png')
else:
    print('O arquivo não é PNG')

É uma imagem png


In [35]:
arquivo = 'imagem.png'

# checar se a extensão do arquivo é .png
# if arquivo.endswith('.png') or arquivo.endswith('.PNG'):
if arquivo.upper().endswith('.PNG'):
    print('É uma imagem png')
else:
    print('O arquivo não é PNG')

É uma imagem png


`string.split(substring)` divide uma string, a partir de uma substring passada, retorna uma lista com as divisões.

In [36]:
diretorio = '~/documentos/arquivos'

subdiretorios = diretorio.split('/')
print(subdiretorios)

['~', 'documentos', 'arquivos']


In [38]:
arquivo = 'imagem.png'
filename_sem_extensao = arquivo.split('.png')[0]
filename_sem_extensao

'imagem'

In [39]:
arquivo.split('.jpeg')

['imagem.png']

`join` junta uma lista de strings, a partir de uma substring. 

In [45]:
print(subdiretorios)
diretorio_completo = '/'.join(subdiretorios)
print(diretorio_completo)

['~', 'documentos', 'arquivos']
~/documentos/arquivos


In [46]:
# gambiarra para alterar um único caracter de um dado index de uma string
nome = 'Luke skywalker'
print(nome)

Luke skywalker


In [49]:
nome[5] = 'S'

TypeError: 'str' object does not support item assignment

In [51]:
nome_como_lista = list(nome)
nome_como_lista

['L', 'u', 'k', 'e', ' ', 's', 'k', 'y', 'w', 'a', 'l', 'k', 'e', 'r']

In [53]:
nome_como_lista[5] = 'S'
nome_como_lista

['L', 'u', 'k', 'e', ' ', 'S', 'k', 'y', 'w', 'a', 'l', 'k', 'e', 'r']

In [58]:
''.join(nome_como_lista)

'Luke Skywalker'

`replace` substitui uma (sub)string específica com outra (sub)string específica.

In [60]:
txt = "I like bananas"
print(txt)

I like bananas


In [61]:
novo_txt = txt.replace("bananas", "apples")
print(txt)
print(novo_txt)

I like bananas
I like apples


#### Concatenando strings

In [62]:
print(diretorio)
print(arquivo)

~/documentos/arquivos
imagem.png


In [63]:
# no caso específico de manipulação de filenames,
# o python fornece o módulo os.path para isso
caminho_completo = diretorio + '/' + arquivo
print(caminho_completo)

~/documentos/arquivos/imagem.png


In [67]:
# outras gambiarras
print(txt)
txt[:7] + 'apples'

I like bananas


'I like apples'