# **Introducción a Python**
# FP04. Python Strings

Bienvenidos aspirantes a Hackers. Es hora de que aprendan sobre uno de los tipos de datos fundamentales más básicos en Python, la cadena o *string*. ¿Qué es un *string*? Formalmente, **una cadena es una secuencia ordenada de caracteres**. Aquí dos palabras clave, **ordenada** y **caracteres**. Ordenado significa que podremos usar *indexing* y *slicing* para tomar elementos de la cadena. Caracteres insinúa el hecho de que las cadenas son más flexibles que simplemente usar el alfabeto, veremos que también pueden contener otros tipos de caracteres.

## <font color='blue'>**Creando strings**</font>

In [None]:
# Comentarios.
# Cada vez que necesitemos documentar algo en nuestro código, usaremos un signo # al comienzo de la línea.
# Esta línea no se considerará al momento de ejecutar nuestro programa

In [None]:
# Para crear strings las comillas simples o dobles están bien
'hello'

'hello'

In [None]:
"hello"

'hello'

In [None]:
# Ten en mente potenciales errores con los apóstrofes
'I'm not a spy!

SyntaxError: ignored

In [None]:
# Usa otro conjunto de comillas distintas para ello
" I'm not a spy! "

" I'm not a spy! "

## Impresión básica de Strings

En el cuaderno jupyter, una sola cadena en una celda se devuelve automáticamente. Sin embargo, esto es diferente a imprimir una cadena. Imprimir una cadena nos permite tener múltiples salidas. Veamos algunos ejemplos útiles:

In [None]:
'one'
'two'

'two'

In [None]:
print('one')
print('two')

one
two


<font color='darkorange'>la función **print()** elimina las comillas de la salida.<font>

In [None]:
print("1. Special Codes")
print('2. Esto es una nueva línea \n nota como se imprime')
print('3. Esto es un tabulador (tab) \t nota como se imprime')
print("4. Observa cómo ambos siguen el caracter de escape general de la barra invertida. ")

1. Special Codes
2. Esto es una nueva línea 
 nota como se imprime
3. Esto es un tabulador (tab) 	 nota como se imprime
4. Observa cómo ambos siguen el caracter de escape general de la barra invertida. 


<font color='darkorange'>Se debe utilizar el mismo tipo de comillas al inicio-fin de un string (dobles o simples), pero no mezclarlas porque se genera un error.<font>

In [None]:
print("1. Special Codes')

SyntaxError: ignored

## <font color='green'>Actividad 1:</font> 
### Imprime un string "Hello" usando dos tabs al comienzo

In [None]:
# Tu código aquí ...
print("\t\tHello") #Doble tab

		Hello


<font color='green'>Fin actividad 1:</font> 

## <font color='blue'>**Indexing y Slicing sobre strings**</font>

NOTA: Intensionalmente no traduciremos conceptos en inglés para habituarnos en su uso y hacer más facil la comprensión de otros documentos a los que accedamos.

Recuerde que las cadenas son *secuencias ordenadas* de caracteres. Esto significa que podemos seleccionar caracteres individuales (indexing) o tomar subsecciones de la cadena (slicing).

### Indexing

Indexing comienza a contar desde 0, de esta forma el string **hello**:

    character:    h    e    l   l   o
    index:        0    1    2   3   4
    
Puedes usar corchetes cuadrados para seleccionar un caracter

In [None]:
word = "hello"

In [None]:
word[0]

'h'

In [None]:
word[3]

'l'

Python soporta indexación reversa (reverse indexing):

    character:        h     e     l    l    o
    index:            0     1     2    3    4
    reverse index:    0    -4    -3   -2   -1  
    
Reverse indexing es usado comúnmente para selecccionar caractares desde el final de una secuencia:

In [None]:
word[-1]

'o'

## Slicing

Podemos tomar subsecciones completas de una cadena con notación *slice*.

Esta es la notación:

     [inicio: parada: paso]

Aspectos clave a tener en cuenta:

1. La dirección del índice de inicio corresponde a donde comenzará su segmento.
2. El índice de parada corresponde a donde subirá el corte. ** ¡No incluye este carácter de índice! **
3. El tamaño del paso es la cantidad de caracteres que omite a medida que avanza y toma el siguiente.

Veamos algunos ejemplos

In [None]:
alpha = 'abcdef'

In [None]:
# Observa como la "d" no es incluida!
alpha[0:3]

'abc'

In [None]:
alpha[0:4]

'abcd'

In [None]:
# Desde la pocisión 2 hasta la 4; esta última no incluída
alpha[2:4]

'cd'

In [None]:
# Desde la pocisión 2 hasta el final del string
alpha[2:]

'cdef'

In [None]:
# Desde el inicio del string hasta pa posición 2; esta última no incluída
alpha[:2]

'ab'

In [None]:
# Desde la posición 0 hasta la 6, con paso 2
alpha[0:6:2]

'ace'

In [None]:
alpha[-1::-1]

'fedcba'

## <font color='green'>Actividad 2:</font> 
### Slicing sobre un RUT

1. Extrae el dígito verificador del RUT con un único slicing

In [None]:
RUT = "8.4576.560-5"
RUT[-1:] #Slicing inverso


'5'

## <font color='green'>Tarea:</font> Imprima el string"def" utilizando slicing sobre la variable *alpha*

2. Diseña un slicing estándar para inprimir los cuatro últimos dígitos de un RUT. El resultado no debe incluir el punto, debe ser en una única instrucción, y debe generar un único string de salida.

Prueba tu instrucción con *rut1* y *rut2*

Los resultados deberían ser:
```python
'1995'

'0843'
```
Tip: investiga cómo concatenar strings en Python.

In [3]:
rut1 = '9.621.955-4'
# Tu instrucción única aquí ...
#rut1.split('.')[-1][0:-2]
rut1.split('-')[0][-5:].replace('.','') #opción 1 con Split, Replace y Slicing
rut1.replace('.','').replace('-','')[-5:-1] #opción 2 con Replace y Slicing

'1955'

In [None]:
rut2 = '12.190.843-K' 
# Tu instrucción única aquí ...
rut2.split('-')[0][-5:].replace('.','')#opción 1 con Split, Replace y Slicing
rut2.replace('.','').replace('-','')[-5:-1] #opción 2 con Replace y Slicing

'0843'

In [None]:
# Test con rut sin puntos
rut3 = '12190843-K' 
# Tu instrucción única aquí ...
rut3.split('-')[0].replace('.','')[-4:]


'0843'

<font color='darkorange'>Otra forma de hacerlo<font>

In [None]:
print('12190843-K'.replace('.','')[:-2][-4:])
print('12.190.843-K'.replace('.','')[:-2][-4:])

0843
0843


<font color='green'>Fin actividad 2:</font>

## Métodos básicos de cadena (string)

Los métodos son acciones que puede llamar a un objeto generalmente en la forma **.method_name()** <br>
Observe el paréntesis cerrado al final. Las cadenas tienen muchos, muchos métodos.

Para verlos escribe una cadena y añádele un signo de interrogación al final:

```python
"hola"?
````

Tambien puedes escribir la cadena y luego presionar la tecla \<tab\>

¡repasemos algunos de los más útiles!

In [None]:
# ... esto sí ...
help(str)

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |  
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to sys.getdefaultencoding().
 |  errors defaults to 'strict'.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __format__(self, format_spec, /)
 |      Return a formatted version of the string as described by format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  

In [None]:
# Si quieres ayuda sobre strings esto no te va a funcionar
help("hola")

No Python documentation found for 'hola'.
Use help() to get the interactive help utility.
Use help(str) for help on the str class.



In [None]:
basic = "Hello world I am learning Python"

In [None]:
basic.upper()

'HELLO WORLD I AM LEARNING PYTHON'

In [None]:
basic.lower()

'hello world i am learning python'

In [None]:
# Veremos esto más adelante, por ahora investiga de qué podría tratarse
basic.split()

['Hello', 'world', 'I', 'am', 'learning', 'Python']

La estrcutura generada se llama **lista**. Es una de las estructuras más utilizadas en Python.
Las listas también pueden ser indexadas. Las veremos en el siguiente notebook.

In [None]:
# Las reglas de indexing también aplican en esta nueva estructura
print(basic.split()[0])
print(basic.split()[1])
print(basic.split()[-1])

Hello
world
Python


In [None]:
# Qué utilidad le ves a esto?
basic.split('I')

['Hello world ', ' am learning Python']

In [None]:
'adewfsfardesdvsvsdedvdvdesdsdfdsfedeasdas'.split('de')

['a', 'wfsfar', 'sdvsvs', 'dvdv', 'sdsdfdsfe', 'asdas']

<font color='darkorange'>Permite dividir los str en base a cualquier otro str contenido dentro. Podría utilizarse para algún tipo de codificación o para analisar texto.<font>

In [None]:
'Hola'.split('Hola') #Genera lista con 2 str vacios (inicio y fin)

['', '']

In [None]:
'Hola'.split('') #Genera error

ValueError: ignored

## <font color='green'>Actividad 3:</font> 
### Crea tu propia variable string y aplícale los métodos *upper()* y *lower()* 

1. Ingresa un string con tu nombre y tu apellido desde el teclado con *input()*
2. Guádalo en una variable
3. Imprime la variable aplicándo el método *upper()*
4. Imprime la variable aplicándo el método *lower()*

Haz que ambas expresiones se impriman utilizanfo f-strings y la función print()

5. Separa la variable en dos (nombre y apellido), e imprimelas en una única línea con la primera letra en mayúscula y el resto en minúscula.

Tip: utiliza el método split()

In [7]:
# Tu código aquí ...
nombre = input("Escribe tu nombre ")
print(nombre.upper()) # Imprime con mayúsucula
print(nombre.lower()) # Imprime con minúscula
namelist = nombre.split() # Nombre y apellido a lista
print(f"{namelist[0].title()} {namelist[1].title()}") # Imprime nombre y apellido en misma línea y con primera letra mayúsucla
#print(namelist[0].title()) #title deja el primer caracter en mayúscula y el resto en minúscula
#print(namelist[1].title())
 


Escribe tu nombre Juan Peréz
JUAN PERÉZ
juan peréz
Juan Peréz


In [None]:
# Versión larga
print(f"{namelist[0][0].upper()}{namelist[0][1:].lower()} {namelist[1][0].upper()}{namelist[1][1:].lower()}")

Juan Perez


<font color='green'>Fin actividad 3</font> 

## <font color='blue'>**Repaso de string formatting**</font> 

Puedes usar el método *.format()* o los *f-string* vistos anteriormente  para realizar lo que se conoce formalmente como **interpolación de cadenas**, esencialmente insertando variables al imprimirla.

In [None]:
user_name = "Matías"

In [None]:
# Con opción 2
print("Welcome {}".format(user_name))

Welcome Matías


In [None]:
# o con opción 3
print(f'Welcome {user_name}')

Welcome Matías


In [None]:
action = 'run'

In [None]:
print("{} needs to {}".format(user_name,action))

Matías needs to run


In [None]:
print("{a} needs to {b}".format(a=user_name,b=action))

Matías needs to run


In [None]:
print("{b} needs to {a}".format(a=action,b=user_name))

Matías needs to run


### Formatting Numbers

In [None]:
num = 123.6789
print(f"The code is: {num}")

The code is: 123.6789


In [None]:
print(f"The code is: {num:.1f}")

The code is: 123.7


In [None]:
print(f"The code is: {num:.2f}")

The code is: 123.68


In [None]:
print(f"The code is: {num:.3f}")

The code is: 123.679


In [None]:
print(f"The code is: {num:.4f}")

The code is: 123.6789


Por atención a los errores. no podemos formatear una variable que tiene un determinado *tipo de dato* con un *espacificador de formato* distinto.

In [None]:
# Acá intentamos formatear un float *num* con un especificador de formato para enteros (d)
# Se generará un error
print(f"The code is: {num: d}")

ValueError: ignored

In [None]:
# Hay que transformarlo primero a int
print(f"The code is: {int(num): d}")

The code is:  123


Excelente hackers !!!