# Cadenas (strings)

## ¿Qué es "texto"?

Antes de entender sobre cadenas, valdría la pena primero entender qué es lo que hace que las computadoras puedan mostrar texto en primer lugar. Sabemos que las computadoras sólo entienden números, eso probablemente no sea una sorpresa, ¿pero cómo es que estos números producen letras y cosas que no se parecen a un número? Bueno, la respuesta empieza con algo que quizás te suene: código ASCII (se pronuncia "aski").



### Codificación de caracteres

No me voy a meter en los detalles de la historia del código ASCII, pero para describirlo de forma muy breve, el código ASCII es como un diccionario, que guarda una relación entre "qué número" produce "qué letra" o, mejor dicho, "qué caracter" (sin tilde, y acentuado en la sílaba "ter").

Los `caracteres` (que cabe diferenciar de "carácter/carácteres" que describe rasgos de personalidad), son la representación de "texto" que una computadora puede formar para una letra, dígito, o símbolo. Estos caracteres no representan un número con el que vamos a operar, sino algo que queremos interpretar como parte de texto de un lenguaje humano. Entonces, cada número y letra que usamos los humanos (por lo menos en las lenguas que se utilizan actualmente) tienen su representación en forma de caracteres también. Por ejemplo, para el alfabeto romano que utilizamos en muchas lenguas occidentales (de la 'A' a la 'Z') se puede representar cada una de sus letras como texto en tu computadora, porque cada letra es un `caracter`.

Volviendo al código ASCII, por ejemplo, el número 65 (en decimal) se puede traducir en la letra `A` (mayúscula), y el número 97 en la letra `a`, y algo que quizás te parezca extraño, el número 57 se usa para representar el caracter `9`. ¿Cómo? ¿El número 9 no es lo mismo que el caracter `9`? Pues sí, porque el número 9, en ASCII, se utiliza para representar un caracter de tabulación (cuando presionas la tecla `Tab`). Y así, puedes usar todos los números desde el 0 hasta el 255 para representar los 256 caracteres de la tabla ASCII, los puedes consultar en esta liga: http://www.asciitable.com/

Sin embargo, hay un punto importante sobre ASCII, y es precisamente estar limitado a sus 256 caracteres, entre los cuales no se encuentran las letras con tildes que utilizamos, por ejemplo, en el español (á, é, í, ó, ú). La razón por la que sólo hay 256 caracteres es porque utilizan sólo 1 byte de información, entonces cada letra es 1 byte, pero ¿entonces qué hay que hacer si quiero escribir con acentos?

Afortunadamente hay más de una codificación para caracteres, y otra de las más ampliamente usadas es UNICODE. Bueno, en realidad no es UNICODE "tal cual" lo que se utiliza, sino implementaciones o "versiones" (por decirlo de alguna forma) de UNICODE, que permiten utilizar más de 1 byte (usualmente 2, que pueden representar más de 65000 caracteres difernentes, pero en ocasiones puede ser usado hasta con 4 bytes), y entre estos tantos caracteres puedes encontrar también nuestros tan queridos "emojis" 😁👍.

Y finalmente, como te puedes dar cuenta, las letras no van solas, sino que para formar palabras las agrupamos. A las agrupaciones de caracteres en la memoria de tu computadora (que se despliegan en tu pantalla) se les conoce como "cadenas de caracteres" o simplemente `cadenas`, porque son caracteres encadenados, donde cada caracter está ligado al siguiente, como si fuera una especie de trenesito 🚂.

Ahora que sabemos que los números de nuestra computadora forman caracteres ¿cómo guarda relación esto con Python?

## Cadenas en Python

Python, para simplificar las cosas, sólo tiene las representaciones de texto en forma de cadenas. Si quieres usar un solo caracter, o una oración completa en forma de texto, para Python es lo mismo; ambas son cadenas.

Las cadenas en Python se pueden representar poniendo texto encerrado entre comillas `"` o entre apóstrofes `'`. Y al igual que cualquier otro tipo de dato, se puede guardar en variables.

Por ejemplo: `mi_cadena = "Tengo texto"`

In [1]:
mi_cadena = "Una cadena"
print("Si imprimo lo que tiene mi_cadena:", mi_cadena)
#También puedo asignar con comillas simples (o apóstrofes) el valor de una cadena
mi_cadena = 'Tengo texto'
print("mi_cadena ahora contiene:", mi_cadena)

Si imprimo lo que tiene mi_cadena: Una cadena
mi_cadena ahora contiene: Tengo texto


### Familiares no-tan-distantes: Arreglos y Cadenas

En Python las cadenas funcionan de forma similar a los arreglos; son colecciones de elementos de un mismo tipo de dato (cada caracter), y cada uno tiene un índice dentro de la cadena. En algunos lenguajes, son exactamente eso, una cadena es literalmente un arreglo de acaracteres. Así, pues, igual que en algunos otros lenguajes, se puede obtener la longitud de una cadena midiendo cuántos elementos tiene (igual que en los arreglos), y se puede acceder a un caracter específico de la cadena usando el índice de ese caracter (sí, también igual que en los arreglos).

In [2]:
print("La longitud de mi_cadena es:", len(mi_cadena))
print("\nLo que contiene en el índice 0 (mi_cadena[0]):", mi_cadena[0])
print("\nLo que contiene en el índice 0 (mi_cadena[1]):", mi_cadena[1])

La longitud de mi_cadena es: 11

Lo que contiene en el índice 0 (mi_cadena[0]): T

Lo que contiene en el índice 0 (mi_cadena[1]): e


De igual forma, las mismas técnicas de rangos de índices en un arreglo se pueden utilizar en las cadenas.

In [3]:
print("Los primeros 5 caracteres (mi_cadena[:5]):", mi_cadena[:5])
print("\nLos últimos 5 caracteres (mi_cadena[-5:])", mi_cadena[-5:])
print("\nLos caracteres del tercero al octavo(mi_cadena[2:8])", mi_cadena[2:8])
print("\nTodos los caracteres, en saltos de 2 (mi_cadena[::2])", mi_cadena[::2])

Los primeros 5 caracteres (mi_cadena[:5]): Tengo

Los últimos 5 caracteres (mi_cadena[-5:]) texto

Los caracteres del tercero al octavo(mi_cadena[2:8]) ngo te

Todos los caracteres, en saltos de 2 (mi_cadena[::2]) Tnotxo


### Operaciones con cadenas

Hasta ahora sólo hemos mostrado cómo guardar una cadena y cómo mostrarla en partes o entera, pero no tendría mucho de interesante si las cadenas sirvieran sólo para mostrarse en un `print`, ¿cierto?

Una pregunta que alguien se podría hacer es, por ejemplo ¿cómo puedo combinar dos cadenas que originalmente existen por separado? Esta, en realidad, es una operación muy, muy común y muy útil cuando se trabaja con texto, y es tan común que hasta tiene su propio nombre: **concatenación**.

Y precisamente para eso los strings también pueden utilizar varios operadores operadores aritméticos: el de suma (`+`) y el de multiplicación (`*`), con sus respectivas variaciones de acumulación (`+=` y `*=`).

Cuando se utiliza la suma (`+`) se concatenan dos strings, y puedes usarlo para concatenar uno tras otro todos los strings que necesites.

> **Nota importante:**
> La concatenación sólo se puede realizar entre dos cadenas, si se intenta usar el operador de suma (`+`) con algún otro tipo de dato (flotantes, booleanos, etc.) Python arrojará un error.

In [4]:
print("Podemos concatenar mi_cadena con algo más:\n")
print(mi_cadena + " aqui mero")
print("\nPero eso no se guarda en la variable 'mi_cadena', sólo lo utiliza en ESA operación (print, en este caso)")
print("mi_cadena sigue conteniendo solamente:", mi_cadena)

nombre = "Sam"
saludo1 = "Hola " + nombre + "."
print("\nPrimer saludo:")
print(saludo1)

cumplido = saludo1 + " " + "Qué agradable sujeto."
print("\nUn cumplido")
print(cumplido)

Podemos concatenar mi_cadena con algo más:

Tengo texto aqui mero

Pero eso no se guarda en la variable 'mi_cadena', sólo lo utiliza en ESA operación (print, en este caso)
mi_cadena sigue conteniendo solamente: Tengo texto

Primer saludo:
Hola Sam.

Un cumplido
Hola Sam. Qué agradable sujeto.


Y así como se pueden concatenar dos strings y guardarse en otra variable, puedes concatenar y acumular dentro de la misma variable varias cadenas.

In [5]:
nombre = "Tony"
saludo2 = "Hola " + nombre + "."

varios_saludos = saludo1
print("varios_saludos contiene:\n", varios_saludos)
varios_saludos += " "
varios_saludos += saludo2
print("\nvarios_saludos contiene:\n", varios_saludos)

varios_saludos contiene:
 Hola Sam.

varios_saludos contiene:
 Hola Sam. Hola Tony.


Por otra parte, el operador de multiplicación `*` se utiliza para concatenar una misma cadena múltiples veces, o sea, repetirla el número de veces que indique el número por el que "multipliquemos" la cadena.

> **Nota importante:**
> Sólo se puede multiplicar una cadena por números enteros, si se intenta multiplicar por algún otro tipo de dato (flotantes, booleanos u otras cadenas) Python arrojará un error.

In [6]:
hola = "hola "
muchos_hola = hola * 5
print(hola)
print(muchos_hola)

hola 
hola hola hola hola hola 


Y de la misma manera, se puede acumular en la misma variable la concatenación con multiplicadores.

In [7]:
varios_hasta_luego = "hasta luego "
varios_hasta_luego *= 10
print(varios_hasta_luego)

hasta luego hasta luego hasta luego hasta luego hasta luego hasta luego hasta luego hasta luego hasta luego hasta luego 


## Inmutabilidad de las cadenas

Quizás recuerdes que en ejemplos pasados de arreglos podíamos editar cada uno de los elementos del arreglo, como en el siguiente ejemplo.

In [8]:
mi_arreglo = [1, 4, 7, 123, -5]
print("mi_arreglo contiene:", mi_arreglo)

mi_arreglo[2] = 111 # Cambiamos el valor en el índice 2 del arreglo
mi_arreglo[0] = 99 # cambiamos el valor del primer índice del arreglo

print("\nmi_arreglo contiene:", mi_arreglo)

mi_arreglo contiene: [1, 4, 7, 123, -5]

mi_arreglo contiene: [99, 4, 111, 123, -5]


Sin embargo, aunque el comporamiento para **leer** el contenido de nuestro arreglo, y apendizar (o, en este caso, concatenar) elementos sea muy similar al de los arreglos, las cadenas tienen una diferencia muy importante con respecto a los arreglos: las cadenas son **inmutables**.

Esto significa que no se puede modificar (o mutar) una cadena en un elemento específico de ésta. Si se intenta modificar un elemento de una cadena, Python arrojará un error e interrumpirá la ejecución.

In [9]:
cadena_inmutable = "No me puedes mutar, soy una cadena"
print(cadena_inmutable)
#Intentar mutar un elemento de la cadena resultará en un error
cadena_inmutable[0] = "a"

No me puedes mutar, soy una cadena


TypeError: 'str' object does not support item assignment