# Manejo de textos

## Introducción
Vamos a produndizar el tema de las cadenas, recordemos que las cadenas son un string y que las podemos pensar como tuplas. La idea es llegar a expresiones regulares que son el comienzo del deep learning. Además es muy útil para poder manejar datos que directos de internet.

## Formato de las cadenas (tipos de presentación)
Los `fstring` se usan para dar formato a los datos de salida. Cada tipo de dato tiene su parámetro y es la inicial del tipo de dato en inglés. 

- f
- d
- c
- s

la nomenclatura comienza simple y hay que saber que es cada parámetro, `f'{"texto" o numeros: letra}{parámetros}'` de esta menera se comienza a indicar como es el formato que queremos dar, en `c` está relacionado con ASCII. 

En el caos de float es el siguiente;

`[{función: (longitud de campo).(decimales)f}]`

por defecto la cantidad de decimales que se muestran es de 6. La longitud del campo ya incluye la cantidad de caracteres de la cadena.  

In [1]:
f'{3.141592:0.3f}'

'3.142'

In [2]:
f'{150:d}'

'150'

In [None]:
f'{66:c} {98:c}'

In [3]:
f'{"Este curso está de":s} {100}'

'Este curso está de 100'

In [5]:
f'[{314:10d}]'

'[       314]'

In [4]:
f'[{"Alineación":15}{3.14:10f}]'

'[Alineación       3.140000]'

In [6]:
f'[{"Alineación":15}]'

'[Alineación     ]'

In [9]:
f'[{3.14:10f}]'

'[  3.140000]'

Además podemos alinear hacia algun lado como en una hoja de texto, sea derecha, izquierda o centro. Esto se hace con `<` izquierda, `>` derecha y  `^` para centrar.  

In [10]:
f'[{"Alineación":12}{3.14:<10f}]'

'[Alineación  3.140000  ]'

In [None]:
f'[{"Alineación":>15}]'

Para el caso en que tengamos numeros con signos ahora `+` nos sirve para indicar como parámetro que se desea incluir el signo. 

In [11]:
f'[{150:+10d}]'

'[      +150]'

Además podemos indicar que los espacios en blanco sean `0`. Entre `(signo)0(numero de decimales)`. En ocaciones es válido pero no recomendable dejar un espacio en blanco para indicar el signo del numero. 

In [12]:
f'[{150:+010d}]'

'[+000000150]'

In [13]:
print(f'{27:d}\n{27: d}\n{-27: d}')

27
 27
-27


Para indicar las comas que separan en cantidades a numeros grandes basta indicar con una `,`


In [None]:
f'{111222333:,d}'

Anterior a Python 3.6 no se podian usar los f-string. Se usaba para dar formato a `format`. Aún tiene unas cosas útiles. 

In [14]:
'{:0.4f}'.format(3.141592)

'3.1416'

En equivalencia a 

In [16]:
f'{3.141592:0.4f}'

'3.1416'

In [17]:
'{} {}'.format('Nombre', 'Apellido')

'Nombre Apellido'

In [18]:
'{0} {0} {0} {1} {2}'.format('Vamos','sigue','adelante')

'Vamos Vamos Vamos sigue adelante'

In [20]:
'{nombre} {apellido}'.format(nombre='Rogelio',apellido='García')

'Rogelio García'

In [22]:
'{apellido} {nombre}'.format(nombre='Rogelio',apellido='García')

'García Rogelio'

Ejercicios de ASCII

In [2]:
f'{58:c}'

':'

In [4]:
f'{45:c}'

'-'

In [7]:
f'{41:c}'

')'

## Alienación y espacio
Ahora tenemos la nomenclatura `f'{cadena:(espacios)c}'` de esta manera podemos indicar los espacios que se quieren dejar antes de la cadena es decir un`"texto" o numero`. Para el caso de los float tenemos algo como `f'{cadena:(espacios)}{float:(numero de decimales)f}'` esto nos va a imprimir `cadena(numero de espacios)float.numero_decimales`. En este caso se cuenta desde la cadena la cantidad de caracteres.

Las alineaciones a la derecha  o a la izquierda las hacemos con `<` y `>` respectivamente. La alineación hacia el centro es con `^`. Esto aplica a cualqueir tipo de datos. 

In [12]:
f'[{"Daniel":<10s}]'

'[Daniel    ]'

In [13]:
f'[{"Daniel":>10s}]'

'[    Daniel]'

In [15]:
f'[{"Daniel":^10s}]'

'[  Daniel  ]'

## Formato de número 

- Ahora vamos a ver como inlcuir el signo de un numero como fstring, para ello debemos agregar el parámetro `+` en la cantidad de decimales, no importa el signo, el parámetro solo indica que se muestre tal cual es. 
- Agreagar ceros en lugares en blanco. Agregar un `0` entre el parámetro de signo y el de cantidad de decimales. También funciona poner un espacio antes del parámetro decimal.
- 

In [9]:
print(f'{11483.528:+10,.2f}\n{-4581.4413:+10,.2f}')

+11,483.53
 -4,581.44


## Concatenar cadenas que se repiten
Las operacioens con cadenas se pueden completar con las operaciones recursivas. Por ejemplo, la concatenación simple, nos dará simplemente la unión de las dos cadenas. Pero, con `+=" "+` podemos obtener la unión de las cadenas separadas.  

## Quitar espacios en blanco
Funciones:
- strip
- lstrip
- rstrip

In [13]:
name = " Clark Kent "

In [16]:
name.strip()

'Clark Kent'

In [17]:
name.lstrip()

'Clark Kent '

In [18]:
name.rstrip()

' Clark Kent'

## Mayúculas y comparación
Los métodos `capitalize`y `title`, el primero da la capacidad de modificar la primera letra de la cadena a mayúscula, la segunda nos da la capacidad de hacer que cada palabra de la cadena empiece con mayúscula. Para las comparaciones se hacen letra por letra.  

## Búsquedas en cadenas
`count` nos permite saber la cantidad de veces que se repite una subcadena (o palabra) en una cadena de texto. El primer parámetro nos ayuda a indicar desde donde queremos hacer la búsqueda, el segundo donde termina, en si, no es necesario recorrer toda la cadena de texto. El método `index` nos dirá el indice de la palabra que estemos buscando. El método `rindex` lo hace empezando desde la derecha. Tenemos la función `in` como contensión de conjuntos. `startswith()` y `endswith`

In [19]:
cadena = "Por desenredar el enredo aque ayer enrede, hoy enredo el desenredo que desenredé ayer"
for i in cadena.split():
    cadena
    if i.startswith("d") = True
    print(i)