<img src="./img/channel-art.png" alt="Devcated Banner" width="100%">

# Curso Python - Aula 06 - Strings

__Marcos Avner P. de Lima__

marcos.lima@icomp.ufam.edu.br

***
# Roteiro
* [Sequences](#Sequences)
* [1. Strings](#1.-Strings)
    * [1.1 Criando uma String](#1.1-Criando-uma-string)
    * [1.2 Examinando uma String](#1.2-Examinando-uma-string)
    * [1.3 Fatiamento (Slicing)](#1.3-Fatiamento)
    * [1.4 Sequências de Escape](#1.4-Sequencias-de-Escape)
    * [1.5 Métodos Básicos](#1.5-Métodos-básicos)
        * [1.5.1 Concatenação](#1.5.1--Concatenção)
        * [1.5.2 Repetição](#1.5.2-Repetição)
    * [1.6 Fragmentação (Slipting)](#1.6-Fragmentação)
    * [1.7 Removendo Espaços (Split)](#1.7-Removendo-Espaços)
    * [1.8 Formatação](#1.8-Formatação)
        * [1.8.1 Substituição](#1.8.1-Substituição) 
        * [1.8.2 Margem e Alinhamento](#1.8.2-Margem-e-Alinhamento)
        * [1.8.3 Truncando Strings Longas](#1.8.3-Truncando-Strings-Longas)
        * [1.8.4 Formatando Números](#1.8.4-Formatando-Números)
        * [1.8.5 Named Placeholders](#1.8.5-Named-Placeholders)
        * [1.8.6 Datas e Horas](#1.8.6-Datas-e-Horas)
        * [1.8.7 Formatação Parametrizada](#1.8.7-Formatação-Parametrizada)
    * [1.9 Encoding](#1.9-Encoding)

***
# Sequences

Além de números, Python também pode trabalhar com `sequences` (sequências) que são conjuntos ordenados e finitos. As `sequences` são ordenadas por indexação, onde cada elemento recebe um número indicando sua ordem. Esse número é chamado de `index` (indice).

Existem dois tipos de `sequences`:
* `Mutable`
    * Os elementos podem ser adicionados, reordenados ou removidos do conjunto após sua criação.
    * `List`
* `Immutable`
    * Não é possível adicionar, reordenar ou remover seus elementos após sua criação. Toda modificação resulta num __novo objeto__!
    * `String`, `Tuple`, `Range`

***
## 1. Strings

São utilizadas para armazenas informação textual (um título de um livro, por exemplo). Python implementa `Strings` como sendo uma `Sequence` de caracteres ordenados. A string `"hello"` por ser vista como `['h','e','l','l','o']`.

***
### 1.1 Criando uma string

Para criar uma `String` podemos:
1. Utilizar o método construtor `str()` que faz a conversão outros tipos de dados para uma `String`
1. Atribuir o valor `literal` entre `'` ou `"`.

In [1418]:
# criar uma 'string' utilizando o contrutor
s = str(42)
s

'42'

In [1419]:
s = str(-0.5)
s

'-0.5'

In [1420]:
s = str(True)
s

'True'

In [1421]:
# cria um 'string' diretamente
s = 'You Give Love A Bad Name'
s

'You Give Love A Bad Name'

In [1422]:
s = "You Give Love A Bad Name"
s

'You Give Love A Bad Name'

In [1423]:
# Atenção!!!!
#' Don't cry'

O motivo para a `String` acima resulta num erro é que com uso de `'` o interpretador considera o fim da `String` assim que encontrar o próximo `'`.

In [1424]:
"Don't cry"

"Don't cry"

***
### 1.2 Examinando uma string

In [1425]:
s = 'Hello World!'

In [1426]:
# retorna o elemento de 'index' zero
s[0]

'H'

In [1427]:
# retorna um inteiro com o tamanho (quantidade de caracteres) de uma 'string'
len(s)

12

***
### 1.3 Fatiamento

Utiliar um `index` retorna um elemento apenas. Mas o que fazer quando desejamos obter um subconjunto de elementos? Para isso, Python possui o mecanismo de `slicing` (fatiamento).

Fatiamento é feito utilizando a seguinte sintaxe:

    sequence[inicio: fim: salto]
    
Onde, `inicio` é o `index` do primeiro elemento desejado, `fim` é o `index` do elemento de parada (esse não será incluído) e `salto` que indica quantos elementos devemos pular.

In [1428]:
s[:]

'Hello World!'

In [1429]:
# 0 ... 5 (exclusive)
s[:6]

'Hello '

In [1430]:
# 7 .... n-1, onde 'n' é tamanho da 'sequence'
s[7:]

'orld!'

In [1431]:
# 'index' negativos são tratados como 'ordem reversa'
# isto é '-1' equivale ao último elemento, -2 ao penúltimo elemento, e assim por diante
s[-1]

'!'

In [1432]:
# 5 ... n-3
s[5:-2]

' Worl'

In [1433]:
# retorne os elementos do inicio ao fim avançando de 1 em 1.
s[::1]

'Hello World!'

In [1434]:
# retorne todos os elementos avançando de 2 em 2.
s[::2]

'HloWrd'

In [1435]:
# retorne todos os elementos voltando de 1 em 1
s[::-1]

'!dlroW olleH'

In [1436]:
# retorne todos os elementos voltando de 2 em 2
s[::-2]

'!lo le'

***
### 1.4 Sequências de Escape

Em Python existem alguns caracteres com significado especial e que por isso são tratados como comandos. Para utilizá-los dentro de uma `String` é preciso indicar explicitamente que eles devem ser tratados como caracteres, isso é feito utilizando uma `\` (contra barra) antes do caractere.
* `\'` - Aspas simples
* `\"` - Aspas Duplas
* `\n` - Nova linha
* `\t` - Tabulação Horizontal
* `\\` - Contra barra

In [1437]:
# o caractere ' no meio da String não é considerado como um comando.
s = 'Don\'t cry'
print(s)

Don't cry


In [1438]:
s = "Ele disse: \"Eu sou Hermanoteu da Pentescopéia, sou filho de Oolonéia, e irmão de Micalatéia \"."
print(s)

Ele disse: "Eu sou Hermanoteu da Pentescopéia, sou filho de Oolonéia, e irmão de Micalatéia ".


In [1439]:
# ''\n' = nova linha
multiline = "Linha1\nLinha2\nLinha3\n"
print(multiline)

Linha1
Linha2
Linha3



In [1440]:
s = 'R$\t50,00'
print(s)

R$	50,00


In [1441]:
s ='C:\\Users\\MyProfile\\Documents\\file.txt'
print(s)

C:\Users\MyProfile\Documents\file.txt


***
### 1.5 Métodos básicos

In [1442]:
s = "Rebel souls, \
Deserters we've been called, \
Chose a gun, \
And threw away the song"
s

"Rebel souls, Deserters we've been called, Chose a gun, And threw away the song"

In [1443]:
# retorna a 'string' em minúsculo
s.lower()

"rebel souls, deserters we've been called, chose a gun, and threw away the song"

In [1444]:
# retorna a 'string' em maiúsculo
s.upper()

"REBEL SOULS, DESERTERS WE'VE BEEN CALLED, CHOSE A GUN, AND THREW AWAY THE SONG"

In [1445]:
# converte maiúsculas em minúsculas, e vice-versa
s.swapcase()

"rEBEL SOULS, dESERTERS WE'VE BEEN CALLED, cHOSE A GUN, aND THREW AWAY THE SONG"

In [1446]:
# retorna 'True' se todos os caracteres somente 'numéricos', 'False' caso contrário
s1.isdigit(), s2.isdigit(), s3.isdigit(), s4.isdigit()

(False, False, False, False)

In [1447]:
# retorna 'True' se todos os caracteres são 'alfanuméricos', 'False' caso contrário
s1.isalnum(), s2.isalnum(), s3.isalnum(), s4.isalnum()

(True, True, False, False)

In [1448]:
# retorna 'True' se todos os caracteres são 'alfabéticos', 'False' caso contrário
s1.isalpha(), s2.isalpha(), s3.isalpha(), s4.isalpha()

(True, True, False, False)

In [1449]:
# retorna 'True' se a 'string' toda está em minúsculo, 'False' caso contrário
'hello'.islower(), 'Hello'.islower(), 'HELLO'.islower()

(True, False, False)

In [1450]:
# retorna 'True' se a 'string' toda está em maiúsculo, 'False' caso contrário
'hello'.isupper(), 'Hello'.isupper(), 'HELLO'.isupper()

(False, False, True)

In [1451]:
# retorna 'True' se a primeira letra de cada palavra for maiúscula, 'False' caso contrário
'born to be wild'.istitle(), 'Born to be Wild'.istitle(), 'Born To Be Wild'.istitle()

(False, False, True)

In [1452]:
# retorna uma nova 'string' com a primeira letra em maiúsculo
"yeah darlin' go make it happen. take the world in a love embrace".capitalize()

"Yeah darlin' go make it happen. take the world in a love embrace"

In [1453]:
# 'True' se a 'string' começa com a 'substring' passada como parametro (case sensitive), 'False' caso contrário
s.startswith('rebel'), s.lower().startswith('rebel'), s.upper().startswith('R')

(False, True, True)

In [1454]:
# 'True' se a 'string' termina com a 'substring' passada (case sensitive), 'False' caso contrário
s.endswith('song')

True

In [1455]:
s1 = 'hello'
s2 = '12345'
s3 = 'a1b2c3'
s4 = '*_-a1'

In [1456]:
# retorna o 'indice' da primeira ocorrência de uma 'substring' (não suporta regex)
s = '1... 2... pum... 4... 5... pum... 7... 8... pum'
s.find('pum')

10

In [1457]:
s[10:13]

'pum'

In [1458]:
# retorna -1 se não encontrar a 'substring'
s.find('pom')

-1

In [1459]:
# retorna o 'indice' da última ocorrência de uma 'substring'
s.rfind('pum')

44

In [1460]:
s[44:]

'pum'

In [1461]:
# substitui todas as ocorrências de uma 'substring' por outra
s.replace('pum', 'x3')

'1... 2... x3... 4... 5... x3... 7... 8... x3'

In [1462]:
# substitui 'substrings' por outra
s = 'Pato roeu a roupa do Pei de Poma'
s.replace('P', 'R')

'Rato roeu a roupa do Rei de Roma'

In [1463]:
# conta as ocorrências de 'substrings'
s.lower().count('p')

4

In [1464]:
s.lower().count('ro')

2

#### 1.5.1  Concatenção

In [1465]:
# concatenação de 'strings'
s1 = 'O significado da vida é'
s2 = '42'
s1 + ' ' + s2

'O significado da vida é 42'

#### 1.5.2 Repetição

In [1466]:
s1 = 'G'
s2 = 'o'*50
s3 = 'l!'
s = s1+s2+s3
s

'Gooooooooooooooooooooooooooooooooooooooooooooooooool!'

***
### 1.6 Fragmentação
Mecanismo que permite separar uma `String` utilizando um `delimitador`

In [1467]:
# fragmenta a 'string' numa 'lista' utilizando ' ' como delimitador
s = 'I like Python!'
s.split(' ')

['I', 'like', 'Python!']

__OBS__: O delimitador não é incluído na lista gerada!

In [1468]:
# ' ' é o delimitador padrão
l = s.split()
l

['I', 'like', 'Python!']

In [1469]:
s = 'a, an, the'
s.split(',')

['a', ' an', ' the']

Muito utilizado ao fazer leituras de arquivos `CSV` (comma separated values).

In [1470]:
data = 'NOME;IDADE;ALTURA;PESO\nAnderson da Silva(spider);44;1.88m;84kg\
\nJonathan Dwight Jones(Jon Jones);32;1.93m;93kg\
\nJosé Aldo da Silva Oliveira Júnio;33;1.70m;61kg\
\bConor McGregor;31;1.75m;70kg'
lines = data.split('\n') 

# cabeçalho
print(lines[0].split(';'))
# registro 1
print(lines[1].split(';'))

['NOME', 'IDADE', 'ALTURA', 'PESO']
['Anderson da Silva(spider)', '44', '1.88m', '84kg']


In [1471]:
# retorna uma 'tupla' com a 'string' particionada (inicio, delimitador, fim)
s = "Load up on guns, bring your friends, It's fun to lose and to pretend"
s.partition(',')

('Load up on guns',
 ',',
 " bring your friends, It's fun to lose and to pretend")

__OBS__: A `String` é particionada na primeira ocorrência do delimitador!

***
### 1.7 Removendo Espaços

In [1472]:
s = '  ham and cheese  '
s

'  ham and cheese  '

In [1473]:
# remove a direita
s.rstrip()

'  ham and cheese'

In [1474]:
# remove a esquerda
s.lstrip()

'ham and cheese  '

In [1475]:
# remove de ambos os lados
s.strip()

'ham and cheese'

In [1476]:
# transforma '\t' em ' '
s = 'Hello\tWorld!'.expandtabs()
s.count(' ')

3

***
### 1.8 Formatação

#### 1.8.1 Substituição

In [1477]:
'raining {} and {}'.format('cats', 'dogs')

'raining cats and dogs'

In [1478]:
'{} {}'.format(1,2)

'1 2'

In [1479]:
# usando 'argumentos nomeados'
'raining {arg1} and {arg2}'.format(arg2='cats', arg1='dogs')

'raining dogs and cats'

In [1480]:
# usando 'indices'
'raining {1} and {0}'.format('cats', 'dogs')

'raining dogs and cats'

In [1481]:
# use 2 casas decimais
'pi is {:.2f}'.format(3.14159)

'pi is 3.14'

#### 1.8.2 Margem e Alinhamento

In [1482]:
# margem a direita
'{:>10}'.format('test')

'      test'

In [1483]:
# margem a esquerda
'{:10}'.format('test')

'test      '

In [1484]:
# margem e alinhamento centralizado
'{:^10}'.format('test')

'   test   '

In [1485]:
# margem e alinhamento, preenchendo com '_'
'{:_>10}'.format('test')

'______test'

In [1486]:
# centraliza a 'string'
s = 'hello world'
s.center(15, '-')

'--hello world--'

#### 1.8.3 Truncando Strings Longas

In [1487]:
# 'truncando' strings muito longas
'{:.5}'.format('xylophone')

'xylop'

In [1488]:
# 'truncando' e 'alinhando'
'{:_^10.5}'.format('xylophone')

'__xylop___'

#### 1.8.4 Formatando Números

In [1489]:
# ponto flutuantes
'{:.5f}'.format(3.141592653589793)

'3.14159'

In [1490]:
'Data Nascimento: {:02}/{:02}/{}'.format(1,1,2020)

'Data Nascimento: 01/01/2020'

In [1491]:
msg = 'Troco: {}{:15.2f}'.format('R$',1659517.3)
print(msg)

Troco: R$     1659517.30


In [1492]:
'{:4d}'.format(42)

'  42'

In [1493]:
# sinalizando
'{:+d}'.format(42)

'+42'

In [1494]:
'{:+d}'.format((-23))

'-23'

In [1495]:
# para alinhar o 'sinal' a esquerda utilize '='
'{:=+5d}'.format(23)

'+  23'

In [1496]:
'{:=+5d}'.format((- 23))

'-  23'

In [1497]:
# completa uma 'string numérica' com zeros a esquerda dado um 'tamanho' máximo
s = '123'
n = 5
s.zfill(n)

'00123'

#### 1.8.5 Named Placeholders

In [1498]:
pessoa = {'nome':'Marcos','idade':29,'altura':1.8}
'{nome}, {idade}kg, {altura}cm'.format(**pessoa)

'Marcos, 29kg, 1.8cm'

In [1499]:
class Plant(object):
    type = 'tree'
'{p.type}'.format(p=Plant())

'tree'

In [1500]:
class Plant(object):
    type = 'tree'
    kinds = [{'name': 'oak'}, {'name': 'maple'}]
'{p.type}: {p.kinds[0][name]}'.format(p=Plant())

'tree: oak'

#### 1.8.6 Datas e Horas

In [1501]:
from datetime import datetime
print(datetime.now())

2020-02-01 23:33:24.089406


In [1502]:
# ano, mes numerico, dia do mes, hora 24H, minutos, segundos e milisegundos
'{:%Y-%m-%d %H:%M:%S.%s}'.format(datetime.now())

'2020-02-01 23:33:24.1580614404'

In [1503]:
# imprimindo no formato local (conforme as configurações do SO)
'{:%c}'.format(datetime.now())

'Sat Feb  1 23:33:24 2020'

In [1504]:
# imprimindo data no formato local (conforme as configurações do SO)
'{:%x}'.format(datetime.now())

'02/01/20'

In [1505]:
# imprimindo hora no formato local (conforme as configurações do SO)
'{:%X}'.format(datetime.now())

'23:33:24'

In [1506]:
# imprimindo hora no formato 12H (conforme as configurações do SO)
'{:%I-%M-%S %p}'.format(datetime.now())

'11-33-24 PM'

In [1507]:
# imprimindo hora no formato 24H (conforme as configurações do SO)
'{:%H-%M-%S %p}'.format(datetime.now())

'23-33-24 PM'

In [1508]:
# ano
'{:%Y (%y)}'.format(datetime.now())

'2020 (20)'

In [1509]:
# mes do ano
'{:%B (%b)}'.format(datetime.now())

'February (Feb)'

In [1510]:
# dia da semana
'{:%A (%a)}'.format(datetime.now())

'Saturday (Sat)'

#### 1.8.7 Formatação Parametrizada

In [1511]:
'{:{align}{width}}'.format('test', align='^', width='10')

'   test   '

In [1512]:
'{:.{prec}} = {:.{prec}f}'.format('Gibberish', 2.7182, prec=3)

'Gib = 2.718'

In [1513]:
'{:{width}.{prec}f}'.format(2.7182, width=5, prec=2)

' 2.72'

In [1514]:
'{:{prec}} = {:{prec}}'.format('Gibberish', 2.7182, prec='.3')

'Gib = 2.72'

In [1515]:
dt = datetime(2001, 2, 3, 4, 5)
'{:{dfmt} {tfmt}}'.format(dt, dfmt='%Y-%m-%d', tfmt='%H:%M')

'2001-02-03 04:05'

***
### 1.9 Encoding

Em Python, `Strings` utilizam o padrão `Unicode`, convertido para um conjunto de `bytes`. Esse processo é conhecido como `encoding`.

Existem diversos padrões de `encoding`, e utilizando a função `str.encoding()` é possível obter a representação em `bytes`.

In [1516]:
s = "aeiouÁÇ~!ó"
s.encode('latin'), s.encode('utf-8')

(b'aeiou\xc1\xc7~!\xf3', b'aeiou\xc3\x81\xc3\x87~!\xc3\xb3')

In [1517]:
# podem ocorrer erros dependendo dos caracteres representáveis em cada 'encoding'
# o paramatro 'errors' permite especificar o que fazer quando houver um erro
# s.encode('ascii')
s.encode('ascii', errors='ignore'), s.encode('ascii', errors='replace')

(b'aeiou~!', b'aeiou??~!?')

In [1518]:
help(str)

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |  
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to sys.getdefaultencoding().
 |  errors defaults to 'strict'.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __format__(self, format_spec, /)
 |      Return a formatted version of the string as described by format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  

## Referências

* [Built-in Types - Python Docs 3.8.1](https://docs.python.org/3/library/stdtypes.html)
* [Github jmportilla - Complete Python Bootcamp](https://github.com/jerry-git/learn-python3)
* [PyFormat](https://pyformat.info/)

<a href="https://github.com/loop-infinito/curso_python3"><img style="display: inline-flex;margin-left: 42%;margin-right:auto" src="./img/github-logo.png" alt="Github repositório" width="30"></a>
<a href="https://www.linkedin.com/in/marcosmapl"><img style="display: inline-flex;margin-left: auto;margin-right:auto" src="./img/linkedin.png" alt="Linkedin Logo" width="30"></a>
<a href="https://www.youtube.com/channel/UC-dBuD3xwKH4rm2mL-kGwfQ"><img style="display: inline-flex;margin-left:auto;margin-right:auto" src="./img/subscribe.png" alt="Subscribe at my Channel" width="90"></a>
<p style="text-align:center">&copy; 2020 Loop Infinito</p>