## 1. Cadenas

Las cadenas no son como los números enteros, números punto flotante y o  los booleanos. Una cadena es una *secuencia*, lo que significa que es una colección ordenada de valores,  en este caso de caracteres. 

Las cadenas, el tipo `str`, son de suma utilidad en la programación y Python provee un manejo muy intuitivo de ellas que hace que las podamos manejar con facilidad 

**Una cadena es una secuencia.** Como ya dijimos, una cadena es una secuencia de caracteres.  Para especificar una cadena  en Python hay que escribir una secuencia de caracteres encerrados entre comillas simple o dobles: 


In [None]:
print('Hola')
print("Hola")

Se puede acceder a los caracteres de uno en uno con el operador de corchetes:

In [None]:
fruta = 'banana'
letra = fruta[1]
print(letra)

La segunda declaración selecciona el carácter número 1 de `fruta` y lo asigna a la variable `letra`.

La expresión entre corchetes se llama *índice*. El índice indica qué carácter de la secuencia desea (de ahí el nombre).

En  una cadena el primer carácter tiene índice `0`, el segundo tiene índice `1` y así sucesivamente. Por ejemplo:

In [None]:
print(fruta[0])
print(letra)
print(fruta[2])

nos imprime en patalla `b`, `a`, `n` respectivamente.

Se puede usar como índices expresiones que contengan variables y operadores:

In [None]:
i = 1
print(fruta)
print(fruta[i])
print(fruta[i + 1])

Pero el valor del índice debe ser un número entero. De lo contrario, se obtiene un error. 

**Concatenar cadenas.** Una de las operaciones más útiles entre cadenas es la de  *concatenación* que simplemente "pega" dos cadenas,  una después de otra. Para concatenar  cadenas se usa el operador `+`. Por ejemplo:

In [None]:
tipo_doc = 'DNI: '
nro_doc = '99456321'
tipo_doc + nro_doc

'DNI: 99456321'

Se puede aplicar varias veces en una misma expresión entre cadenas el operador `+`. El operador `+` es asociativo,  pero, obviamente, no es conmutativo. El *neutro* es la cadena vacía `''`,  es decir
```
cadena + '' == cadena
```

 

**La función `len`.** `len` es una función incorporada que devuelve el número de caracteres en una cadena:

In [None]:
fruta = 'banana'
len(fruta)

Observar que para obtener la última letra de una cadena debemos  usar como índice la longitud de la cadena menos 1:

In [None]:
fruta[len(fruta) - 1]

La instrucción `fruta[len(fruta)]` nos devoverá un error pues el índice `len(fruta)` se refiere al elemento   `len(fruta)+1`-ésimo de la cadena y  ese elemento no existe. En este caso particular, el motivo del error es que no hay ninguna letra en` 'banana'` con el índice 6. Como empezamos a contar desde cero, las seis letras están numeradas del 0 al 5. Para obtener el último carácter, se debe restar 1 de `len(fruta)`:

También se  pueden usar índices negativos, que cuentan hacia atrás desde el final de la cadena. La expresión `fruta[-1]` da como resultado la última letra, `fruta[-2]` da como resultado la penúltima, y ​​así sucesivamente.

**Las cadenas son inmutables.**  Es tentador usar el operador `[]` en el lado izquierdo de una asignación, con la intención de cambiar un carácter en una cadena. Por ejemplo, si ejecutamos:

In [None]:
cadena = 'ab'
cadena[0] = 'x'

nos devuelve

    TypeError: 'str' object does not support item assignment

que nos dice que el tipo `str` no admite asignación de items. 

El motivo del error es que las cadenas son *inmutables*, lo que significa que no se puede cambiar un cadena existente. Lo que sí se puede hacer es crear una nueva cadena que es una variación del original:

In [None]:
cadena = 'ab'
cadena2 = 'x' + cadena[1]
cadena2

Este ejemplo concatena una nueva primera letra con el final de `cadena` y no tiene ningún efecto sobre la cadena original. Por supuesto, que también podríamos haber hecho

In [None]:
cadena = 'ab'
cadena = 'x' + cadena[1]
cadena

En este caso, en la segunda instrucción se destruye la variable original `cadena` y se crea otra variable,  que llamamos nuevamente `cadena`,  con otros valores. Estas tres líneas de programación *simulan* el cambio de un caracter en una cadena.  

## 2. Recorriendo cadenas

Muchos cálculos implican procesar una cadena de un carácter a la vez. A menudo se comienza por el principio, seleccionan un carácter por vez, se hace algo y se continúa hasta el final. Este patrón de procesamiento se llama *recorrido*. Una forma de escribir un recorrido es con un ciclo `while`:

In [None]:
fruta = 'banana'
índice = 0
while índice < len(fruta):
    letra = fruta[índice]
    print(letra)
    índice = índice + 1

Este ciclo recorre la cadena y muestra cada letra en una línea. La condición del ciclo es `índice < len(fruta)`, por lo que cuando `índice` es igual a la longitud de la cadena, la condición es falsa y el cuerpo del ciclo no se ejecuta. El último carácter al que se accede es el que tiene el índice `len(fruta) - 1`, que es el último carácter de la cadena.

Como ejercicio, escribamos una función que tome una cadena como argumento y muestre las letras al revés, una por línea.

In [None]:
fruta = 'banana'
índice = len(fruta) - 1
while índice >= 0:
    letra = fruta[índice]
    print(letra)
    índice = índice - 1



Las cadena son iterables y por lo tanto pueden ser recorridas por un ciclo `for`. Por ejemplo,

In [None]:
for letra in fruta:
    print(letra)

Cada vez que pasa por el ciclo, el siguiente carácter de la cadena se asigna a la variable `letra`. El ciclo continúa hasta que no quedan caracteres.

El siguiente ejemplo muestra cómo usar la concatenación (suma de cadenas) y un ciclo `for` para generar una serie de 9 items numerados, donde el contenido del ítem siempre es el mismo.

In [None]:
prefijo = '123456789'
item = 'valija'
for x in prefijo:
    print(x + '. ' + item)

## 3. Notación slice


Un segmento de una cadena es lo que se llama una *rebanada* o *slice* por su traducción al inglés. Seleccionar una slice es similar a seleccionar un carácter:

In [None]:
fruta = 'banana'
print(fruta[0:2])
print(fruta[2:6])

El operador `[n : m]` devuelve la rebanada de la cadena del caracteres entre el "corte" `n`y el "corte" `m`. Ahora explicaremos lo que significa "corte", pero primero debemos aclarar que *no* se refiere a un índice,  sinó al corte entre dos elementos. Ejemplifiquemos con la cadena `banana`:
$$
\begin{matrix}
\text{Cadena:} &|&\tt b&|&\tt a&|&\tt n&|&\tt a&|&\tt n&|&\tt a&|& \\
\text{Corte:}\;\;\;&0&&1&&2&&3&&4&&5&&6& \\
\end{matrix}
$$

Observar que (imaginariamente) hemos puesto cada carácter en una casilla y  los cortes son las paredes de las casillas. Entonces las primeras 2 letras están entre las paredes 0 y 2  y las últimas 4 letras entre las paredes 2 y 6. 

Si se omite el primer índice (antes de los dos puntos), el segmento comienza al principio de la cadena. Si omite el segundo índice, el segmento va al final de la cadena:


In [None]:
fruta = 'banana'
print(fruta[:2])
print(fruta[2:])

cadena = 'sobretodo'
print(cadena)
print(cadena[:5])
print(cadena[5:])
print(cadena[:5])
print(cadena[:5] + cadena[5:])

Si el primer índice es mayor o igual que el segundo, el resultado es una cadena vacía, representada por dos comillas:

In [None]:
fruta[3:3]


Una cadena vacía no contiene caracteres y tiene una longitud 0, pero aparte de eso, es igual que cualquier otra cadena.

Continuando con este ejemplo, ¿qué crees que significa `fruta[:]`? Veamos:  

In [None]:
fruta2 = fruta[:]
print(fruta2)

fruta3 = ''
for x in fruta:
    fruta3 = fruta3 + x
print(fruta3) 

Como habrás observado, `fruta[:]` reproduce la cadena original. Está instrucción es muy útil cuando queremos crear otra cadena copia de la cadena original:

In [None]:
fruta = 'banana'
fruta_2 = fruta[:]

Las variables `fruta` y `fruta_2` son variable diferentes que tienen el mismo valor. Es una diferencia sutil, pero es importante saber que existe. Por ejemplo, si yo destruyo y rehago por asignación la variable `fruta_2`, la variable `fruta` no cambia: 

In [None]:
print(fruta, fruta_2)
fruta_2 = 'pera'
print(fruta, fruta_2)

Una propiedad importante de la notación slice, es que nunca devuelve error si los cortes son números enteros,  aunque a veces devuelve la cadena vacía:

In [None]:
orden = '0123456789'
print(orden[-4:])  # desde el corte -4 (contando desde el último corte) hasta el corte 0
print(orden[-4: -2]) # desde el corte -4 (contando desde el último corte) hasta el corte -2
print(orden[-4: 0])  # desde el corte -4 hasta el corte 0 (es la cadena vacía)
print(orden[-4: 8]) # desde el corte -4 (contando desde el último corte) hasta el corte 8
print(orden[len(orden) - 4: 8])
print(orden[-100:])

Para no confundirse, solo hay que tener en cuenta que un entero negativo indica la posición (negativa) desde el último corte (que es `len(cadena)`)  y  un entero positivo indica la posición desde el primer corte. 

Finalmente, observar que si `n > 0`, `cadena[n-1 : n]` devuelve `cadena[n - 1]` si existe, y si no, devuelve la cadena vacía, mientras que  `cadena[n - 1]` devuelve  el ítem `n`-ésimo de `cadena` si existe y si no produce un error. 

In [None]:
orden = '0123456789'
print(orden)
print(orden[0:1]) # imprime 0
print(orden[1:2]) # imprime 1
print(orden[2:3]) # imprime 2
print(orden[8:9]) # imprime 8
print(orden[9:10], orden[9]) # imprime 9 dos veces
print(orden[10:11]) # imprime la cadena vacía
# print(orden[10]) # descomentada devuelve error

## 4. Métodos de cadenas


Las cadenas proporcionan métodos que realizan una variedad de operaciones útiles. Un método es similar a una función, toma argumentos y
devuelve un valor, pero la sintaxis es diferente. Por ejemplo, el método `upper()` toma una cadena y devuelve una nueva cadena con todas las letras mayúsculas.

En lugar de utilizar la sintaxis de función `upper(palabra)`, se utiliza la sintaxis de método `palabra.upper()`.


In [None]:
palabra = 'colección año 2019'
nueva_palabra = palabra.upper()
print(nueva_palabra)




Esta forma de notación con puntos especifica el nombre del método, `upper()`, y el nombre de la cadena a la que aplicar el método,`palabra`. Los paréntesis vacíos indican que este método  acepta ser utilizado sin argumentos. En  realidad, el método `upper()` no acepta argumentos.

Una llamada a un método se denomina *invocación*; en este caso, diríamos que estamos invocando `upper()` en `palabra`.

Hay un método de cadena llamado `find()` que devuelve la primera ocurrencia de una cadena en otra cadena:

In [None]:
palabra = 'colección'
print(palabra.find('e'))
print(palabra.find('c'))
print(palabra.find('a'))
print(palabra.find('ci'))

En este ejemplo, invocamos `find()` en `palabra` y pasamos la cadena que estamos buscando como parámetro. Cuando `find()` no encuentra lo que busca devuelve `-1`.

De forma predeterminada, `find()` comienza al principio de la cadena, pero puede tomar un segundo argumento, el índice donde comienza a buscar:

In [None]:
print(palabra.find('c',1))

Este es un ejemplo de un *argumento opcional*; `find()` también puede tomar un tercer argumento, el índice donde detiene la búsqueda:


In [None]:
fruta = 'banana'
print(fruta.find('a', 2, 6))

3


El código anterior encuentra la primera ocurrencia de `a` en la palabra `banana` entre los índices 2 y 6.

**Otros métodos útiles.** Hay una gran cantidad de métodos del tipo `str` incorporados al lenguaje Python. Veremos a continuación algunos que resultan útiles con alguna breve explicación de que es lo que hacen. 

| Método | |  |
| :--- | :---: |:--- |
|find() |:| busca en la cadena un valor especificado y devuelve la posición de donde lo encontró|
|rfind() |:| busca en la cadena un valor especificado y devuelve la última posición donde lo encontró|
|replace() |:| devuelve una cadena donde un el 1º valor especificado se reemplaza por el 2º valor especificado|
|strip() |:| devuelve la cadena sin espacios, tabs, saltos al comienzo y al final|
|lstrip() |:| devuelve la cadena sin espacios, tabs, saltos al comienzo|
|rstrip() |:| devuelve la cadena sin espacios, tabs, saltos al final|
|upper() |:| convierte una cadena en mayúsculas|
|lower() |:| convierte una cadena en minúsculas|
|capitalize() |:| convierte el primer carácter a mayúsculas|
|title() |:| convierte el primer carácter de cada palabra a mayúsculas|
|islower() |:| devuelve True si todos los caracteres de la cadena son minúsculas|
|isupper() |:| devuelve True si todos los caracteres de la cadena están en mayúsculas|
|isnumeric() |:| devuelve verdadero si todos los caracteres de la cadena son dígitos|

Hay algunos métodos más y si importamos la biblioteca `string` aún habrá más métodos disponibles. No es necesario saberse de memoria muchos métodos, siempre está el recurso de internet para saber cual es el nombre de un método o cuales son los métodos disponibles.

Veamos ejemplos:



In [None]:
palabra = 'colección'
print(palabra.rfind('c'))
print(palabra.replace('c', 'x')) # reemplaza todas la ocurrencias de 'c' por 'x'
fruta = '  banana'
print(fruta)
fruta = fruta.strip()
print(fruta)
materia = 'álgebra lineal'
print(materia.title()) # Observar que capitaliza también palabras con tilde

**Caracteres especiales.** Hay en Python algunos pocos caracteres especiales que sirven para representar ciertas cadenas:
- `\n` - nueva línea.
- `\t` - tabulación.
- `\r` - carriage return.
- `\b` - retroceso.
- `\'` - comilla simple.
- `\"` - comilla doble.
- `\\` - barra invertida.  

Por ejemplo:

In [1]:
print('La lista de nominados es: \
    \n\t1. Alberto "el bocha\" Gandolfo,\n\t2. Carlos \'terremoto\' Rodríguez. ')

La lista de nominados es:     
	1. Alberto "el bocha" Gandolfo,
	2. Carlos 'terremoto' Rodríguez. 


## 5. El operador `in`

La palabra `in` es un operador booleano que toma dos cadenas y devuelve `True` si el primero aparece como una subcadena en el segundo:

In [None]:
print('a' in 'banana')
print('an' in 'banana')
print('es' in  'banana')

Por ejemplo, la siguiente función imprime todas los
letras de `palabra1` que también aparecen en `palabra2`:

In [None]:
def en_ambas(palabra1, palabra2: str):
     assert type(palabra1) == type(palabra2) == str, 'Los parametros deben ser \'str\''
     # post: prime todas los letras (una tras otra) de palabra1 que también aparecen en palabra2
     for letra in palabra1:
         if letra in palabra2:
             print(letra, end = '') # end = '' no pasa de línea

en_ambas('banana', 'pajaron')
print() # pasa de línea
en_ambas('recolectar', 'coz')

## 6. Comparación de cadenas

Los operadores relacionales funcionan con cadenas. Para ver si dos cadenas son iguales, por ejemplo:

In [None]:
palabra1, palabra2, palabra3 = 'banana', 'anana', 'banana'
print(palabra1 == palabra2)
print(palabra1 == palabra3)

Otras operaciones relacionales son útiles para poner palabras en orden alfabético. El operador `<` funciona como orden alfabético, llamado *orden lexicogáfico*, en las cadenas donde todos los caracteres son letras minúsculas y sin tilde:

In [None]:
def orden_alfabetico(palabra1, palabra2): 
    if palabra1 < palabra2:
        print('La primera palabra: "' + palabra1 + '", viene antes que la segunda palabra: "' + palabra2 + '".')
    elif palabra1 > palabra2:
        print('La segunda palabra: "' + palabra2 + '", viene antes que la primera palabra: "' + palabra1 + '".')
    else:
        print('Ambas balabras son iguales: "' + palabra1 + '".')

orden_alfabetico('anana', 'banana')
orden_alfabetico('banana', 'anana')
orden_alfabetico('anana', 'anana')

La primera palabra: "anana", viene antes que la segunda palabra: "banana".
La segunda palabra: "anana", viene antes que la primera palabra: "banana".
Ambas balabras son iguales: "anana".



Python no maneja letras mayúsculas y minúsculas de la misma manera
lo hace la gente. Todas las letras mayúsculas vienen antes de todas las
letras minúsculas, entonces:

In [None]:
orden_alfabetico('Banana', 'anana')

La primera palabra: "Banana", viene antes que la segunda palabra: "anana".


Una forma común de abordar el problema de hacer un órden alfabético conpalabras que admitan mayúsculas es convertir las cadenas en un
formato estándar, como ser todo en minúsculas, antes de realizar la
comparación.

Otro problema es con las letras con tilde: estas van después de todas las letras mayúsculas y minúsculas sin tilde

In [None]:
orden_alfabetico('ábaco', 'calculadora')

La segunda palabra: "calculadora", viene antes que la primera palabra: "ábaco".


Esto es un poco más complicado de solucionar que el caso anterior y no lo veremos aquí.