In [None]:
#  Esta celda es exclusivo para cuestiones de impresion dentro del notebook
from IPython.core.interactiveshell import InteractiveShell
InteractiveShell.ast_node_interactivity = 'all'

# Strings 
___

## Que aprenderemos?
* Clase `str`
* Metodos (por clasificacion)
* Tips y otros modulos

## Clase `str`
___

### Representacion literal

In [None]:
cadena = 'Esto es una cadena'
cadena2 = "Esto es una cadena tambien"
cadena3 = '''Esta tambien es una cadena,
pero multilinea (que guarda salto de linea)'''
cadena4 =  'Esto tambien es' ' posible'
cadena
cadena2
print(cadena3)
cadena4

### Operadores

In [None]:
s1, s2 = 'a', 'b'
#  Concatenacion
s1 + s2
s1 * 3
s3 = ''
s3 += s1
s3

<center><img src="Imagenes/advertencia.png"></center>

## Advertencia
Evite el uso del operador `+` para concatenar grandes cantidades de cadenas, ya que resulta demasiado costoso computacionalmente hablando: $$O(n^2)$$

In [None]:
s = ''
for n in range(1000): #  No lo intente
    s += str(n)

In [None]:
#  Comparacion
s1, s2
s1 < s2
s1 > s2
s1 == s2
s1 != s2
#  Tambien podemos usar min, max
min('arbol', 'barco', 'casa')
max('arbol', 'barco', 'casa')
min('4','2','13', key=int)

### Otras operaciones

#### Longitud

In [None]:
len('longitud')

#### Indices y  secciones (slices)

In [None]:
taller = 'Introduccion a Python'
taller[0] #  Acceder al i-esimo elemento
taller[-1] #  Los indices negativos acceden a los ultimos elementos
taller[0] = 't' #  Esto no es una operacion valida dado que los str son inmutables

In [None]:
taller[1:12] #  Slice: rebanada de una cadena
taller[15:] #  Se puede omitir el inicio o final del rango
taller[2:20:2] #  Se puede especificar pasos como 3er argumento
taller[::-1] #  Invertir una cadena usando slices

#### Busqueda

In [None]:
'P' in taller #  Busqueda de caracteres
'Python' in taller #  Busqueda de subcadenas

## Inspeccionando la clase `str()`
___

In [None]:
help(str)

### `str(objet = '')`
> convierte a los objetos a su representacion de cadena, si es que tiene una

In [None]:
str([1,2,3])

### `str(objet = b'', encoding = 'utf-8', errors = 'strict')`
> convierte una cadena de bytes a una cadena de texto cifrada a utf-8 

In [None]:
str(b'Algo', encoding='ascii')

### Conversion y remplazo

In [None]:
'manzana'.capitalize() #  Convierte la 1ra letra en mayuscula
'PERA'.lower() #  Convierte una cadena a minusculas
'ß'.casefold() #  Similar a lower, pero mas agresivo con otros caracteres 
'uva'.upper() #  Convierte una cadena a mayusculas
'python zen'.title() #  Convierte la cadena a titulo
'CaMbIo'.swapcase() #  Intercambia mayusculas y minusculas

In [None]:
'Cursos'.center(10) #  Centra una cadena dado un ancho
'\tInicio'.expandtabs() #  Sustituye los tabs por espacios
'Justificar'.ljust(15) #  Justificar en un ancho hacia la izquierda
'Justificar'.rjust(15) #  Justificar en un ancho hacia la derecha
'45'.zfill(4) #  Coloca ceros a la izquierda dado a un ancho

In [None]:
espacios = '  espacios  '
espacios.strip() #  elimina los caracteres del argumento a los costados
espacios.lstrip() #  elimina los caracteres a la derecha
espacios.rstrip() #  elimina los caracteres a la izquierda

In [None]:
'bolante'.replace('b','v') #  remplaza un caracter, por otro
'osola'.replace('o','a', 1) #  se puede espesificar cuantas ocurrencias cambiar 

In [None]:
#  Maketrans retorna un diccionario para translate
diccionario = str.maketrans('Diconar','Bezumyw')
diccionario
#  Traslate hace los cambios donde sustituye el valor de la correspondiente
#  llave (Keyword)
'Diccionario'.translate(diccionario)

### Clasificacion

In [None]:
'Admin123'.isalnum() #  Alfanumericos
'Python'.isalpha() #  Alfabetico
'Excepción'.isascii() #  ASCII

In [None]:
'minusculas'.islower() #  Minusculas
'MAYUSCULAS'.isupper() #  Mayusculas
'Strings En Python'.istitle() # Titulo

In [None]:
'12345'.isdecimal() #  Digitos base 10
'٠١٢٣٤٥٦٧٨٩'.isdigit() #  Numero indo arabigos
'½'.isnumeric() #  Fraccion

In [None]:
'\n'.isprintable() #  Caracter imprimible
'nombre_variable'.isidentifier() #  Identifcador valido de Python
' '.isspace() #  Caracter de espacio

### Busqueda de subcadenas

In [None]:
texto = 'Anita lava la tina'
patron = 'a'
texto.find(patron) #  Indice de la 1ra aparcion a la izquierda
texto.rfind(patron) #  Indice de la 1ra aparicion a la derecha 
#  Podemos buscar en una seccion del texto
texto.find(patron, 5, 10) # sub, start, end

In [None]:
texto.index(patron)
texto.rindex(patron)
#La diferencia entre index y find, esta en que index devuelve un ValueError si el
#partron no es encontrado
texto.find('o')
texto.index('o')

In [None]:
texto.startswith('Anita') #  Inicia con
texto.endswith('tina') #  Termina con

In [None]:
texto.count(patron) #  cantidad de ocurrencias de la subcadena en la cadena
texto, patron

### De concatenacion y particion

In [None]:
numero_telefonico = ['331', '1234', '0987']
#  Concatena un iterable de strings 
'-'.join(numero_telefonico)

In [None]:
frase = 'Hola Mundo, como estan?'
a, b, c = frase.partition(' ') 
a, b, c #  Retorna una 3-tupla con una division de la primera aparicion del separador
a, b, c = frase.rpartition(' ')
a, b, c #  Retorna una 3-tupla con una division de la primera aparicion a la derecha del separador

In [None]:
serie_numerica = '1 2 3 4 5 6'
#  Separa a una cadena por un separador, por default, por un espacio en blanco
serie_numerica.split() 
#  Separa a una cadena por un separador hacia la derecha
serie_numerica.rsplit(maxsplit= 3) # split y rsplit pueden definir el maximo de divisiones de la cadena
#  Podemos separar por otros separadores
'10/09/2017'.split('/')
#  Splitlines separa cadenas por separadores de renglones
'Esto es un ejemplo\nde un texto largo'.splitlines()

## Formateo de cadenas
___

### Existen 5 maneras de formatear cadenas!

In [None]:
nombre = 'Arturo'
edad = 21
#  Estilo C
print('Estilo C: %s %d'%(nombre, edad))
#  Metodo format
print('Metodo format: {} {}'.format(nombre, edad))
#  Metodo format map
print('Metodo format_map: {nombre} {edad}'.format_map({'nombre': nombre, 'edad': edad}))
#  string.template
from string import Template
texto = Template('Template: $nombre $edad')
print(texto.substitute(nombre = nombre, edad = edad))

In [None]:
# f-string (3.6+), es la forma mas aceptada de dar formato a una cadena
print(f'f-string: {nombre} {edad}')

In [None]:
#  Podemos ejecutar operaciones
f'{2 * 7}'
#  Incluso podemos ejecutar funciones
linea = 'Grande'
f'{linea.lower()}'
#  Tambien podemos acceder a los miembros de la clase
n = 32 + 5j
f'{n.real}, {n.imag}'

In [None]:
f'{5.025:<10}' #  Alineado a la izquierda
f'{5.025:>10}' #  Alineado a la derecha
f'{5.025:^10}' #  Centrado

In [None]:
from decimal import Decimal
valor = Decimal("12.34567")
f'Resultado: {valor:10}' #  Ancho
f'Resultado: {valor:.4}' #  Precision
f'Resultado: {valor:{10}.{4}}' #  Podemos combinar notaciones

In [None]:
f'Binario: {2:b}' #  Representacion binaria
f'Octal: {14:o}' #  Representacion octal
f'Hexadecimal: {15:x}' #  Representacion hexadecimal
f'Caracter: {49:c}' #  Representacion del valor numerico del caracter ascii

[Mini Guia de especificacion de formato](https://docs.python.org/3.7/library/string.html#formatspec)

## Otras cosas de las strings
___

In [None]:
ord('a') #  Funcion que retorna el valor ascii de un solo caracter
chr(50) #  Funcion que retorna el caracter dado su valor ascii numerica

In [None]:
#  Modulo string
import string 
string.ascii_letters #  Letras ascii
string.ascii_lowercase #  Letras minusculas
string.ascii_uppercase #  Letras mayusculas

In [None]:
string.digits #  Digitos
string.hexdigits #  Digitos hexadecimales
string.octdigits #  Digitos octales

In [None]:
string.punctuation #  Caracteres especiales
string.printable #  Imprimibles
string.whitespace #  Espacios en blanco

### Menciones
* raw strings
* bytes
* re (expresiones regulares)