# Cadenas.

**Objetivo.**
Explicar el tipo de dato básico cadena y como se usa en diferentes contextos.

 <p xmlns:cc="http://creativecommons.org/ns#" xmlns:dct="http://purl.org/dc/terms/"><a property="dct:title" rel="cc:attributionURL" href="https://github.com/repomacti/introduccion_python">Introducción a Python</a> by <a rel="cc:attributionURL dct:creator" property="cc:attributionName" href="https://gmc.geofisica.unam.mx/luiggi">Luis Miguel de la Cruz Salas</a> is licensed under <a href="https://creativecommons.org/licenses/by-sa/4.0/?ref=chooser-v1" target="_blank" rel="license noopener noreferrer" style="display:inline-block;">CC BY-SA 4.0<img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/cc.svg?ref=chooser-v1" alt=""><img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/by.svg?ref=chooser-v1" alt=""><img style="height:22px!important;margin-left:3px;vertical-align:text-bottom;" src="https://mirrors.creativecommons.org/presskit/icons/sa.svg?ref=chooser-v1" alt=""></a></p> 

## Definición de cadenas.

En Python, una cadena (string) es una secuencia de caracteres utilizada para representar texto. Las cadenas se pueden crear utilizando comillas simples (`'`), dobles (`"`) o triples (`"""` o `'''`). 

Son inmutables, lo que significa que no se pueden cambiar una vez que se han creado. 

Sin embargo, se pueden crear nuevas cadenas basadas en operaciones realizadas en las cadenas originales.

Veamos algunos ejemplos.

* Definición de una cadena usando comillas simples `'`:

In [None]:
simples = 'este es un ejemplo de una cadena definida con comillas simples'
print(simples)

* Definición de una cadena usando comillas dobles `"`:

In [None]:
dobles = "este es un ejemplo de una cadena definida con comillas dobles"
print(dobles)

* Definición de una cadena usando comillas triples `"""` o `'''`:

In [None]:
triples1 = '''este es un ejemplo de una cadena definida con triples comillas simples'''
print(triples1)

triples2 = """este es un ejemplo de una cadena definida con triples comillas dobles"""
print(triples2)

## Caracteres especiales.

Las cadenas pueden contener caracteres especiales como cambio de línea, tabulador, entre otros. Para que estos caracteres se puedena representar, se requiere del caracter de escape `\` para que puedan ser imprimidos.  Algunos de estos caracteres se muestran en la siguiente tabla:

|  Secuencia de escape | Significado |
|---|---|
| `\<newline>` | Diagonal invertida y línea nueva ignoradas |
| `\\` | Diagonal invertida (`\`) |
| `\'` | Comilla simple (`'`) |
| `\"` | Comilla doble (`"`) |
| `\n` | Cambio de línea (ASCII Linefeed LF) | 
| `\t` | Tabulador (ASCII Sangría horizontal TAB) |

La documentación completa se puede encontrar en el siguiente enlace: [Escape sequences](https://docs.python.org/es/3/reference/lexical_analysis.html#escape-sequences).

<div class="alert alert-block alert-info">
    
### Ejemplo 1. 

<font color="Black">

1. Definir e imprimir las siguientes cadenas:
    1.  ```Enjoy the moments now, because they don't last forever```
    2. ```Python "pythonico"```

</font>
</div>

In [None]:
# 1.A. Forma 1. Usamos el caracter de escape
poema = 'Enjoy the moments now, because they don\'t last forever'
print(poema)

In [None]:
# 1.A. Forma 2. Definimos la cadena con " "
poema = "Enjoy the moments now, because they don't last forever"
print(poema)

Observa que es posible imprimir `'` sin usar el caracter `\` si la cadena se define con `"` y viceversa, como se muestra a continuación:

In [None]:
# 1.B. La cadena puede tener " dentro de ' ... '
titulo = 'Python "pythonico"'
print(titulo)

In [None]:
#1.B. Usando el caracter de escape
titulo = "Python \"pythonico\""
print(titulo)

<div class="alert alert-block alert-info">
    
<font color="Black">

2. Definir e imprimir el siguiente texto:
```
Desde muy niño
tuve que "interrumpir" 'mi' educación
para ir a la escuela
```

</font>
</div>

In [None]:
# Forma 1. 
queja = "Desde muy niño \ntuve que \"interrumpir\" 'mi' educación \npara ir a la escuela"
print(queja)

En esta primera forma definimos la cadena usando comillas dobles. Para imprimir `"` usamos el caracter de escape. De igual manera, para indicar el cambio de línea usamos `\n`. Para imprimir `'` no es necesario realizar nada especial.

In [None]:
#  Forma 2. Una cadena larga la definimos con triples comillas (simples o dobles).
queja = '''
Desde muy niño
tuve que "interrumpir" 'mi' educación
para ir a la escuela
'''
print(queja)

Observa que en el ejemplo anterior la cadena contiene `"` y  `'` sin necesidad de usar el caracter de escape; de igual manera no fue necesario indicar los cambios de línea, estos se toman de manera implícita. Lo anterior fue posible por el uso de las triples comillas para definir la cadena.

<div class="alert alert-block alert-info">
    
<font color="Black">

3. Definir e imprimir el siguiente texto:
```

El siguiente es un ejemplo de función:
--------------------------------------
def funcion(N):
        suma = 0
        for i in range(N):
                 suma += 1
        return suma
```

</font>
</div>

In [67]:
codigo = """
El siguiente es un ejemplo de función:
--------------------------------------
def funcion(N):
\tsuma = 0
\tfor i in range(N):
\t\tsuma += 1 
\treturn suma
"""
print(codigo)


El siguiente es un ejemplo de función:
--------------------------------------
def funcion(N):
	suma = 0
	for i in range(N):
		suma += 1 
	return suma



Observa que cuando el texto es largo y de varias líneas, conviene usar triples comillas. Para agregar la sangría al principio de algunas líneas usamos el tabulador `\t`. 

<a href="indexado_cadenas"></a>
## Indexación de las cadenas.

La indexación permite acceder a diferentes elementos o rangos de elementos de una cadena. 

* Los elementos de una cadena de `N` elementos, se numeran empezando en `0` y terminando en `N-1`, el cual representa el último elemento de la cadena.
* También se pueden usar índices negativos donde `-1` representa el último elemento y `-N` el primer elemento.

Veamos el siguiente ejemplo:

|   ||||||||||||
|--:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|
|`ejemplo` |`=`| `M` | `u` | `r` | `c` | `i` | `é` | `l` | `a` | `g` | `o` |
|índice positivo |$\rightarrow$| `0`|`1`|`2`|`3`|`4`|`5`|`6`|`7`|`8`|`9`|
|índice negativo |$\rightarrow$| `-10`|`-9`|`-8`|`-7`|`-6`|`-5`|`-4`|`-3`|`-2`|`-1`|

* La cadena tiene `N = 10` elementos.
* Sus índices positivos van de `0` a `9`.
* Sus índices negativos van de `-1` a `-10`.

In [15]:
# Definimos la cadena
ejemplo = 'Murciélago'
print(ejemplo)

Murciélago


In [16]:
# Vemos la longitud de la cadena con la función 'len()'
print(len(ejemplo)) 

10


In [17]:
# Primer elemento de la cadena
print(ejemplo[0]) 

M


In [18]:
# Elemento en la posición 5
print(ejemplo[5]) 

é


In [19]:
# Elemento en la posición 9 (en este caso es el último)
print(ejemplo[9]) 

o


In [20]:
# Último elemento de la cadena
print(ejemplo[-1]) 

o


In [21]:
# Elemento en la posición -6 o equivalentemente en la posición 4
print(ejemplo[-6]) 

i


In [22]:
# Elemento en la posición -10, el primero en este caso
print(ejemplo[-10]) 

M


### Acceso a porciones de las cadenas (*slicing*)

Se puede obtener una subcadena a partir de la cadena original, para ello usamos lo siguiente: `str[Start:End:Stride]`

**Start** :Índice del primer caracter para formar la subcadena. **Se incluye** el elemento con este índice.

**End** : Índice que indica el caracter final de la subcadena. **No se incluye** el elemento con este índice.

**Stride**: Salto entre elementos.

Si queremos obtener la subcadena `urcié` de la cadena original `Murciélago` podemos hacerlo como sigue: 

* con índices positivos:

|   ||||||||||||
|--:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|
|`ejemplo` |`=`| `M` | `u` | `r` | `c` | `i` | `é` | `l` | `a` | `g` | `o` |
|índice positivo |$\rightarrow$| `0`|`1`|`2`|`3`|`4`|`5`|`6`|`7`|`8`|`9`|
|`ejemplo[1:6]`| `=` | | u | r | c | i | é | | | | |

* con índices negativos:

|   ||||||||||||
|--:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|:-:|
|`ejemplo` |`=`| `M` | `u` | `r` | `c` | `i` | `é` | `l` | `a` | `g` | `o` |
|índice negativo |$\rightarrow$| `-10`|`-9`|`-8`|`-7`|`-6`|`-5`|`-4`|`-3`|`-2`|`-1`|
|`ejemplo[-9:-4]`| `=` | | u | r | c | i | é | | | | |

Veamos los siguientes ejemplos

In [23]:
print(ejemplo[1:6])

urcié


In [24]:
print(ejemplo[-9:-4])

urcié


In [25]:
print(ejemplo[:]) # Cadena completa

Murciélago


In [26]:
print(ejemplo[0:5]) # Elementos del 0 al 4 

Murci


In [27]:
print(ejemplo[::2]) # Todos los elementos, con saltos de 2

Mrilg


In [28]:
print(ejemplo[1:8:2]) # Los elementos de 1 a 7, con saltos de 2

ucéa


In [29]:
print(ejemplo[::-1]) # La cadena en reversa

ogaléicruM


## Métodos aplicables sobre las cadenas

Las cadenas son objetos de la clase `<class 'str'>` y tienen definidos atributos y métodos. 
Véase [Common string operations](https://docs.python.org/3/library/string.html) para más información.

Veamos algunos ejemplos:

In [30]:
# Imprimimos la cadena original
print(ejemplo)

Murciélago


In [31]:
# Centramos la cadena en 20 espacios
print(ejemplo.center(20)) 

     Murciélago     


In [32]:
# Centramos la cadena en 20 espacios y usamos '_' en los espacios restantes
print(ejemplo.center(20,'_')) 

_____Murciélago_____


In [33]:
# Convertimos todos los caracteres en mayúsculas
print(ejemplo.upper())

MURCIÉLAGO


In [34]:
# Nos da el índice donde aparece 'e' (solo la primera aparición)
# Cuando el caracter no está en la cadena, regresa un -1
print(ejemplo.find('é'))
print(ejemplo.find('e'))

5
-1


In [35]:
# Cuenta el número de 'g's dentro de la cadena
print(ejemplo.count('g'))

1


In [36]:
# Pregunta si la cadena se puede imprimir
print(ejemplo.isprintable())

True


In [40]:
# Reemplazamos un caracter o conjunto de caracteres por otro.
print(ejemplo.replace('é', 'e'))

Murcielago


## Funciones y operadores sobre cadenas.

Veamos algunas funciones incorporadas y operadores que se pueden aplicar sobre las cadenas.

In [2]:
# Definimos una cadena
cadena = 'anita lava la tina'
print(cadena)

anita lava la tina


* Función `len()`  para obtener la longitud de la cadena.

In [3]:
print(len(cadena))

18


* Funciones `max()` y `min()` para obtener el máximo y mínimo de acuerdo con su código unicode.

In [4]:
print(min(cadena)) # El mínimo es el espacio en blanco
print(max(cadena))

 
v


* Función `sorted()` regresa una lista de elementos de la cadena ordenados, de acuerdo con su código unicode.

In [5]:
print(sorted(cadena))

[' ', ' ', ' ', 'a', 'a', 'a', 'a', 'a', 'a', 'i', 'i', 'l', 'l', 'n', 'n', 't', 't', 'v']


* Operador `==` para comparar cadenas

In [10]:
cadena_reversa = cadena[::-1]
print('original  : ', cadena)
print('invertida : ', cadena_reversa)
print('¿Las cadenas son iguales? ', cadena == cadena_reversa)

original  :  anita lava la tina
invertida :  anit al aval atina
¿Las cadenas son iguales?  False


Para checar que el contenido de `cadena` es un palíndromo tendríamos que
eliminar los espacios cuando hacemos la comparación de la cadena original con la cadena en reversa:

In [20]:
# Comparamos la cadena original con la cadena en reversa, sin espacios
palindromo = cadena.replace(' ','') == cadena_reversa.replace(' ','')

# Imprimimos el resultado
print('¿"' + cadena + '" es palíndromo?', palindromo)

¿"anita lava la tina" es palíndromo? True


* Operador `in` para saber si un elemento está en la cadena.

In [21]:
print('v' in cadena)

True


* Operador `+` para concatenar cadenas.

In [22]:
palabra = 'Palíndromo : '
print(palabra + cadena)

Palíndromo : anita lava la tina


* Operador `*` para repetir la cadena.

In [23]:
# Repetimos la cadena 'oh yeah ' 5 veces
expresion = 'oh yeah ' * 5
print(expresion)

oh yeah oh yeah oh yeah oh yeah oh yeah 


## Construcción de cadenas

Existen varias maneras de construir cadenas, a continuación se revisan algunos ejemplos.

### Usando operaciones básicas.

Los operadores: `+` y `*` están definidos para las cadenas.

Veamos el siguiente ejemplo:

In [50]:
frase1 = "Somos aquello en lo que creemos"
frase2 = "aún sin darnos cuenta"

# Concatenación de cadenas
frase_total = frase1 + ', ' + frase2 + '.'

print(frase_total)

Somos aquello en lo que creemos, aún sin darnos cuenta.


En el siguiente ejemplo creamos una cadena de 60 guiones `-` usando el operador `*`:

In [51]:
print('-' * 60)

------------------------------------------------------------


Escribimos la `frase_total` centrada en 60 espacios y entre dos líneas:

In [52]:
print('-' * 60)
print(frase_total.center(60))
print('-' * 60)

------------------------------------------------------------
  Somos aquello en lo que creemos, aún sin darnos cuenta.   
------------------------------------------------------------


### Concatenación y casting

Vamos a crear la siguiente cadena: `Pedro Páramo tiene 15 años y pesa 70.5 kg`.

Usaremos el operador `+` y contruiremos la cadena usando algunas variables; convertiremos las variables a tipo `str`:

In [53]:
# Definimos las siguientes variables
edad = 15
nombre = 'Pedro'
apellido = 'Páramo'
peso = 70.5

# Construimos la cadena usando el operador '+' y la función 'str()' 
datos = nombre + apellido + 'tiene' + str(15) + 'años y pesa' + str(70.5) + 'kg'

print(datos)

PedroPáramotiene15años y pesa70.5kg


Para agregar espacios es necesario hacerlo de manera explícita como sigue:

In [54]:
datos = nombre + ' ' + apellido + ' tiene ' + str(15) + ' años y pesa ' + str(70.5) + ' kg'
print(datos)

Pedro Páramo tiene 15 años y pesa 70.5 kg


### Método `str.format()`

Este método permite sustituir variables en los lugares indicados por `{}`:

In [55]:
datos = '{} {} tiene {} años y pesa {} kg'.format(nombre, apellido, edad, peso)
print(datos)

Pedro Páramo tiene 15 años y pesa 70.5 kg


### Cadenas formateadas (*f-string*, *formatted string literals*)

Este tipo de cadenas permite sustituir variables en los lugares indicados:

In [56]:
datos = f'{nombre} {apellido} tiene {edad} años y pesa {peso} kg'
print(datos)

Pedro Páramo tiene 15 años y pesa 70.5 kg


### Cadenas usando el método `str.join()`

Dada una cadena que funciona como separador, este método recibe un iterador y junta todos sus elementos separados por la cadena inicial:

In [57]:
datos = " ".join([nombre, apellido, 'tiene', str(15), 'años y pesa', str(70.5), 'kg'])
print(datos)

Pedro Páramo tiene 15 años y pesa 70.5 kg


En el ejemplo anterior la cadena inicial es un espacio `" "` y junta todos los elementos que se dan entre corchetes `[]`. El uso de corchetes construye una lista, que es un tipo de dato que se describirá en la notebook [08_listas.ipynb](./08_listas.ipynb).

## Inmutabilidad de las cadenas

Los elementos de las cadenas no se pueden modificar:

In [58]:
# Intentamos modificar el elemento 5 de la cadena
ejemplo[5] = "e"

TypeError: 'str' object does not support item assignment

In [59]:
cadena='''
este es un 
texto muy
largo
'''

In [60]:
print(cadena)


este es un 
texto muy
largo



In [61]:
print(type(cadena))

<class 'str'>


In [62]:
len(cadena)

29

In [63]:
cadena[0] # El primer elemento es un cambio de línea

'\n'

In [64]:
cadena[-1] # El último elemento es un cambio de línea

'\n'

In [65]:
print(cadena[6])

e


In [66]:
cadena[6] = 'h'

TypeError: 'str' object does not support item assignment