# string

Os objetos do tipo `string` são cadeias de caracteres, armazenadas em sequência na memória do computador. Para criar um string, podemos utilizar a função `str` ou escrever valores entre aspas.

Os strings funcionam como listas de caracteres, onde podemos acessar valores específicos com base em seu índice e fatiá-los. 

In [19]:
print("Indexação: string[início:fim:salto]\n")

string = "ABC123"
print("String: ", string)
print("Primeira posição: ", string[0])
print("Última posição: ", string[-1])

print("Substring [1:3]:", string[1:3])
print("String invertido:", string[::-1])
print("Caracteres ímpares:", string[::2])

Indexação: string[início:fim:salto]

String:  ABC123
Primeira posição:  A
Última posição:  3
Substring [1:3]: BC
String invertido: 321CBA
Caracteres ímpares: AC2


## Operações com strings

Os strings são imutáveis, logo não é possível modificar qualquer caractere diretamente com base em seu índice. A solução geralmente envolve fatiar o string ou utilizar os métodos de formatação disponibilizados para sua classe. Porém, é permitido somar (concatenar) e multiplicar (repetir) strings.

In [7]:
string_1 = "ABCDEF"
string_2 = "123456"
print("Strings: ", string_1, "e", string_2)
print("Soma: ", string_1 + string_2)
print("Produto: ", string_1 * 2)

Strings:  ABCDEF e 123456
Soma:  ABCDEF123456
Produto:  ABCDEFABCDEF


O operador `in` permite verificar se um substring faz parte de um string

In [28]:
print("String: ", string)
print("3" in string)
print("C" not in string)

String:  ABC123
True
False


## Funções aplicáveis a strings

#### len( )

Permite encontrar o tamanho de um string

In [9]:
print("Tamanho: ", len(string_1), "caracteres")

Tamanho:  6 caracteres


#### input( )

A função `input()` permite que ao rodar o programa, o processo de leitura do código é interrompido até que o usuário digite algo diretamente no console do Python. O valor é lido como string e pode ser atribuído a uma variável. 

In [21]:
entrada = input("Digite um valor: ")
print("Valor imputado: ", entrada)

Digite um valor: texto
Valor imputado:  texto


## Métodos Importantes

#### Alfanuméricos

* string.isalnum() -> verifica se um string só contêm carcateres alfabéticos e numéricos
* string.isalpha() -> verifica se um string só contêm carcateres alfabéticos
* string.isdigit() -> verifica se um string só contêm os dígitos de 0 a 9
* string.isnumeric() -> verifica se um string só contêm carcateres numéricos e representações Unicode de outros dígitos. Ex: "\u2153"


* string.lower() -> retorna novo string com os caracteres em formato maiúsculo
* string.upper() -> retorna novo string com os caracteres em formato minúsculo

In [67]:
string = "ABCD1234"
print(string.isalnum())
print(string.isalpha())
print(string.isdigit())
print(string.isnumeric())
print(string.lower())

True
False
False
False
abcd1234


#### Alinhamento e ajuste

* string.center(quantidade, caracter) -> alinha o texto no centro do string e preenche o entorno com o caractere especificado
* string.ljust(quantidade, caracter) -> alinha o texto à esquerda do string e preenche com o caractere especificado
* string.rjust(quantidade, caracter) -> alinha o texto à direita do string e preenche com o caractere especificado


* string.strip(caracteres) -> remove todos os espaços em branco à esquerda e à direita do início e fim do string, respectivamente. Se passarmos caracteres como parâmetro, remove as suas ocorrências. 
* string.lstrip() -> remove todos os espaços em branco à esquerda do início do string
* string.rstrip() -> remove todos os espaços em branco à direita do fim do string

In [75]:
string = "string"
print(string.center(10))
print(string.center(10, "*"))
print(string.ljust(10, "*"))
print(string.rjust(10, "*"))

  string  
**string**
string****
****string


In [80]:
string = "   ***string***   "
print(string.strip())
print(string.strip(" *")) # remove tanto os espaços quanto o caractere *
print(string.lstrip(" *"))
print(string.rstrip(" *"))

***string***
string
string***   
   ***string


#### Localização

* string.startswith("sub") -> verifica se o string começa com determinado substring
* string.endswith("sub") -> verifica se o string termina com determinado substring


* string.count(sub) -> retorna o número de ocorrências de um substring dentro do string original


* string.find(sub, inicio, fim) -> retorna a posição da primeira ocorrência do substring procurado, da esquerda para a direita (se não encontrar, retorna -1). Inicio e Fim são as posições a partir das quais a função inicia e termina a procura.
* string.rfind() -> retorna a posição da primeira ocorrência do substring procurado, da direita para a esquerda (se não encontrar, retorna -1). Inicio e Fim são as posições a partir das quais a função inicia e termina a procura.

In [84]:
string = "ABCDABCD"
print(string.startswith("ABC"))
print(string.endswith("ABC"))

True
False


In [87]:
string = "ABCDABCD"
print(string.count("ABC"))
print(string.find("BCD"))
print(string.rfind("BCD"))

2
1
5


#### Substituição

* string.replace(sub_antes, sub_depois, numero) -> substitui as ocorrências de um substring por outro, preservando o string original. O parâmetro numérico indica a quantidade máxima de reposições que devem ser feitas, da esquerda para a direita


* string.split(caracter) -> divide o string com base em um caractere, criando uma lista de substrings. Para criar uma lista separando cada caractere, usamos a função `list()`. 
* string.splitlines(numero) -> divide o string com base no substring "\n", que ao ser printado pula uma linha. Se adicionarmos um número maior que zero como parâmetro, ele inclui o caractere ao final de cada divisão. Retorna uma lista de substrings


* sep.join(lista) -> concatena os substrings contidos em uma lista ou tupla, com base em um separador

In [102]:
string_1 = "ABCDEABCD"
print("string:", string_1)
print(string_1.replace("A", "F", 2))
print(string_1.split("E"))

string: ABCDEABCD
FBCDEFBCD
['ABCD', 'ABCD']


In [104]:
lista = list(string_1)
print("string:", lista)
print(" ".join(lista))

string: ['A', 'B', 'C', 'D', 'E', 'A', 'B', 'C', 'D']
A B C D E A B C D


In [108]:
string_2 = "ABCDE\nABCD"
print(string_2.splitlines())
print(string_2.splitlines(1))

['ABCDE', 'ABCD']
['ABCDE\n', 'ABCD']


#### Formatação de strings

##### string.format( )

O método `string.format()` indica os valores do string a serem substituídos, com um inteiro entre chaves indicando onde serão encaixados os parâmetros a serem passados ao método format(), que podem ser tanto substrings quanto valores numéricos.

Caso sejam colocados números entre as chaves, eles se referirão a qual parâmetro deverá ser encaixado naquele local. Ex: {0} -> O número 0 se refere ao primeiro parâmetro.

In [36]:
"ABC{1}DEF12{0}3456".format(" par_0 ", " par_1 ")

'ABC par_1 DEF12 par_0 3456'

Se incluirmos uma lista como parâmetro, podemos indicar o índice do elemento a ser colocado dentro do string original. Ex: {0[0]}

In [47]:
print("String original: ABCD1234")
"ABC{1}D12{0[1]}34".format(["1", "2"], "3")

String original: ABCD1234


'ABC3D12234'

Dentro das chaves também pode ser especificado o tamanho desejado para o string que vamos colocar no lugar das chaves. Isso é feito com `:` após indicar a qual parâmetro nos referimos, se desejado. Se indicarmos um valor maior do que a quantidade de caracteres contida no parâmetro, o restante será preenchido à sua direita. Ex: {0:10}.

In [42]:
"{0:12}".format("string")

'string      '

Os valores utilizados como preenchimento podem ser especificados após os dois-pontos, e depois deles podemos indicar também se o preenchimento ocorrerá à direita `<` do substring, à esquerda `>` ou ambos `^` (um a um, da direita para a esquerda). Ex: {:.^10}

In [43]:
"{0:*>12}".format("string")

'******string'

Formatação exclusiva de números:


* {0:03} -> especifica a quantidade de zeros a serem incluídos à esquerda do número, para preenchimento do tamanho desejado
* {0:,} -> define agruplamento por milhar
* {0:+} -> mostra o sinal existente

* {0:d} -> para inserir o número em outra base, utilizamos letras antes do tamanho.
    * d: base decimal
    * b: binário
    * o: octal
    * x: hexadecimal minúsculo
    * X: hexadecimal maiúsculo
    * c: caractere UNICODE

* {0:.5f} -> impressão de número com 5 casas decimais
    * f: float
    * e: notação científica com `e` minúsculo
    * E: notação científica com `e` maiúsculo
    * %: converte o valor para porcentagem. Ex: 9,87 = 987%

In [65]:
print("Preenchimento com 10 zeros:", "{0:010}".format(123456))
print("Separador de milhar:", "{0:,}".format(123456))
print("Mostrar o sinal:", "{0:+}".format(123456))
print("Base Binária:", "{0:b}".format(123456))
print("Notação científica com 5 casas decimais:", "{0:.5e}".format(123456))

Preenchimento com 10 zeros: 0000123456
Separador de milhar: 123,456
Mostrar o sinal: +123456
Base Binária: 11110001001000000
Notação científica com 5 casas decimais: 1.23456e+05


##### f-strings

Uma forma mais rápida de formatar strings ocorre utilizando `f` atrás da string. Isso possibilita que sejam incluídos os valores desejados dentro das chaves como se fossem os parâmetros da função format. Os valores dentro das chaves podem ser chamadas de funções, operações matemáticas, nomes de variáveis já criadas etc.

In [66]:
string = "texto"
print(f"{string}")

texto
