# Cadenas (strings)

## ¬øQu√© es "texto"?

Antes de entender sobre cadenas, valdr√≠a la pena primero entender qu√© es lo que hace que las computadoras puedan mostrar texto en primer lugar. Sabemos que las computadoras s√≥lo entienden n√∫meros, eso probablemente no sea una sorpresa, ¬øpero c√≥mo es que estos n√∫meros producen letras y cosas que no se parecen a un n√∫mero? Bueno, la respuesta empieza con algo que quiz√°s te suene: c√≥digo ASCII (se pronuncia "aski").



### Codificaci√≥n de caracteres

No me voy a meter en los detalles de la historia del c√≥digo ASCII, pero para describirlo de forma muy breve, el c√≥digo ASCII es como un diccionario, que guarda una relaci√≥n entre "qu√© n√∫mero" produce "qu√© letra" o, mejor dicho, "qu√© caracter" (sin tilde, y acentuado en la s√≠laba "ter").

Los `caracteres` (que cabe diferenciar de "car√°cter/car√°cteres" que describe rasgos de personalidad), son la representaci√≥n de "texto" que una computadora puede formar para una letra, d√≠gito, o s√≠mbolo. Estos caracteres no representan un n√∫mero con el que vamos a operar, sino algo que queremos interpretar como parte de texto de un lenguaje humano. Entonces, cada n√∫mero y letra que usamos los humanos (por lo menos en las lenguas que se utilizan actualmente) tienen su representaci√≥n en forma de caracteres tambi√©n. Por ejemplo, para el alfabeto romano que utilizamos en muchas lenguas occidentales (de la 'A' a la 'Z') se puede representar cada una de sus letras como texto en tu computadora, porque cada letra es un `caracter`.

Volviendo al c√≥digo ASCII, por ejemplo, el n√∫mero 65 (en decimal) se puede traducir en la letra `A` (may√∫scula), y el n√∫mero 97 en la letra `a`, y algo que quiz√°s te parezca extra√±o, el n√∫mero 57 se usa para representar el caracter `9`. ¬øC√≥mo? ¬øEl n√∫mero 9 no es lo mismo que el caracter `9`? Pues s√≠, porque el n√∫mero 9, en ASCII, se utiliza para representar un caracter de tabulaci√≥n (cuando presionas la tecla `Tab`). Y as√≠, puedes usar todos los n√∫meros desde el 0 hasta el 255 para representar los 256 caracteres de la tabla ASCII, los puedes consultar en esta liga: http://www.asciitable.com/

Sin embargo, hay un punto importante sobre ASCII, y es precisamente estar limitado a sus 256 caracteres, entre los cuales no se encuentran las letras con tildes que utilizamos, por ejemplo, en el espa√±ol (√°, √©, √≠, √≥, √∫). La raz√≥n por la que s√≥lo hay 256 caracteres es porque utilizan s√≥lo 1 byte de informaci√≥n, entonces cada letra es 1 byte, pero ¬øentonces qu√© hay que hacer si quiero escribir con acentos?

Afortunadamente hay m√°s de una codificaci√≥n para caracteres, y otra de las m√°s ampliamente usadas es UNICODE. Bueno, en realidad no es UNICODE "tal cual" lo que se utiliza, sino implementaciones o "versiones" (por decirlo de alguna forma) de UNICODE, que permiten utilizar m√°s de 1 byte (usualmente 2, que pueden representar m√°s de 65000 caracteres difernentes, pero en ocasiones puede ser usado hasta con 4 bytes), y entre estos tantos caracteres puedes encontrar tambi√©n nuestros tan queridos "emojis" üòÅüëç.

Y finalmente, como te puedes dar cuenta, las letras no van solas, sino que para formar palabras las agrupamos. A las agrupaciones de caracteres en la memoria de tu computadora (que se despliegan en tu pantalla) se les conoce como "cadenas de caracteres" o simplemente `cadenas`, porque son caracteres encadenados, donde cada caracter est√° ligado al siguiente, como si fuera una especie de trenesito üöÇ.

Ahora que sabemos que los n√∫meros de nuestra computadora forman caracteres ¬øc√≥mo guarda relaci√≥n esto con Python?

## Cadenas en Python

Python, para simplificar las cosas, s√≥lo tiene las representaciones de texto en forma de cadenas. Si quieres usar un solo caracter, o una oraci√≥n completa en forma de texto, para Python es lo mismo; ambas son cadenas.

Las cadenas en Python se pueden representar poniendo texto encerrado entre comillas `"` o entre ap√≥strofes `'`. Y al igual que cualquier otro tipo de dato, se puede guardar en variables.

Por ejemplo: `mi_cadena = "Tengo texto"`

In [1]:
mi_cadena = "Una cadena"
print("Si imprimo lo que tiene mi_cadena:", mi_cadena)
#Tambi√©n puedo asignar con comillas simples (o ap√≥strofes) el valor de una cadena
mi_cadena = 'Tengo texto'
print("mi_cadena ahora contiene:", mi_cadena)

Si imprimo lo que tiene mi_cadena: Una cadena
mi_cadena ahora contiene: Tengo texto


### Familiares no-tan-distantes: Arreglos y Cadenas

En Python las cadenas funcionan de forma similar a los arreglos; son colecciones de elementos de un mismo tipo de dato (cada caracter), y cada uno tiene un √≠ndice dentro de la cadena. En algunos lenguajes, son exactamente eso, una cadena es literalmente un arreglo de acaracteres. As√≠, pues, igual que en algunos otros lenguajes, se puede obtener la longitud de una cadena midiendo cu√°ntos elementos tiene (igual que en los arreglos), y se puede acceder a un caracter espec√≠fico de la cadena usando el √≠ndice de ese caracter (s√≠, tambi√©n igual que en los arreglos).

In [2]:
print("La longitud de mi_cadena es:", len(mi_cadena))
print("\nLo que contiene en el √≠ndice 0 (mi_cadena[0]):", mi_cadena[0])
print("\nLo que contiene en el √≠ndice 0 (mi_cadena[1]):", mi_cadena[1])

La longitud de mi_cadena es: 11

Lo que contiene en el √≠ndice 0 (mi_cadena[0]): T

Lo que contiene en el √≠ndice 0 (mi_cadena[1]): e


De igual forma, las mismas t√©cnicas de rangos de √≠ndices en un arreglo se pueden utilizar en las cadenas.

In [3]:
print("Los primeros 5 caracteres (mi_cadena[:5]):", mi_cadena[:5])
print("\nLos √∫ltimos 5 caracteres (mi_cadena[-5:])", mi_cadena[-5:])
print("\nLos caracteres del tercero al octavo(mi_cadena[2:8])", mi_cadena[2:8])
print("\nTodos los caracteres, en saltos de 2 (mi_cadena[::2])", mi_cadena[::2])

Los primeros 5 caracteres (mi_cadena[:5]): Tengo

Los √∫ltimos 5 caracteres (mi_cadena[-5:]) texto

Los caracteres del tercero al octavo(mi_cadena[2:8]) ngo te

Todos los caracteres, en saltos de 2 (mi_cadena[::2]) Tnotxo


### Operaciones con cadenas

Hasta ahora s√≥lo hemos mostrado c√≥mo guardar una cadena y c√≥mo mostrarla en partes o entera, pero no tendr√≠a mucho de interesante si las cadenas sirvieran s√≥lo para mostrarse en un `print`, ¬øcierto?

Una pregunta que alguien se podr√≠a hacer es, por ejemplo ¬øc√≥mo puedo combinar dos cadenas que originalmente existen por separado? Esta, en realidad, es una operaci√≥n muy, muy com√∫n y muy √∫til cuando se trabaja con texto, y es tan com√∫n que hasta tiene su propio nombre: **concatenaci√≥n**.

Y precisamente para eso los strings tambi√©n pueden utilizar varios operadores operadores aritm√©ticos: el de suma (`+`) y el de multiplicaci√≥n (`*`), con sus respectivas variaciones de acumulaci√≥n (`+=` y `*=`).

Cuando se utiliza la suma (`+`) se concatenan dos strings, y puedes usarlo para concatenar uno tras otro todos los strings que necesites.

> **Nota importante:**
> La concatenaci√≥n s√≥lo se puede realizar entre dos cadenas, si se intenta usar el operador de suma (`+`) con alg√∫n otro tipo de dato (flotantes, booleanos, etc.) Python arrojar√° un error.

In [4]:
print("Podemos concatenar mi_cadena con algo m√°s:\n")
print(mi_cadena + " aqui mero")
print("\nPero eso no se guarda en la variable 'mi_cadena', s√≥lo lo utiliza en ESA operaci√≥n (print, en este caso)")
print("mi_cadena sigue conteniendo solamente:", mi_cadena)

nombre = "Sam"
saludo1 = "Hola " + nombre + "."
print("\nPrimer saludo:")
print(saludo1)

cumplido = saludo1 + " " + "Qu√© agradable sujeto."
print("\nUn cumplido")
print(cumplido)

Podemos concatenar mi_cadena con algo m√°s:

Tengo texto aqui mero

Pero eso no se guarda en la variable 'mi_cadena', s√≥lo lo utiliza en ESA operaci√≥n (print, en este caso)
mi_cadena sigue conteniendo solamente: Tengo texto

Primer saludo:
Hola Sam.

Un cumplido
Hola Sam. Qu√© agradable sujeto.


Y as√≠ como se pueden concatenar dos strings y guardarse en otra variable, puedes concatenar y acumular dentro de la misma variable varias cadenas.

In [5]:
nombre = "Tony"
saludo2 = "Hola " + nombre + "."

varios_saludos = saludo1
print("varios_saludos contiene:\n", varios_saludos)
varios_saludos += " "
varios_saludos += saludo2
print("\nvarios_saludos contiene:\n", varios_saludos)

varios_saludos contiene:
 Hola Sam.

varios_saludos contiene:
 Hola Sam. Hola Tony.


Por otra parte, el operador de multiplicaci√≥n `*` se utiliza para concatenar una misma cadena m√∫ltiples veces, o sea, repetirla el n√∫mero de veces que indique el n√∫mero por el que "multipliquemos" la cadena.

> **Nota importante:**
> S√≥lo se puede multiplicar una cadena por n√∫meros enteros, si se intenta multiplicar por alg√∫n otro tipo de dato (flotantes, booleanos u otras cadenas) Python arrojar√° un error.

In [6]:
hola = "hola "
muchos_hola = hola * 5
print(hola)
print(muchos_hola)

hola 
hola hola hola hola hola 


Y de la misma manera, se puede acumular en la misma variable la concatenaci√≥n con multiplicadores.

In [7]:
varios_hasta_luego = "hasta luego "
varios_hasta_luego *= 10
print(varios_hasta_luego)

hasta luego hasta luego hasta luego hasta luego hasta luego hasta luego hasta luego hasta luego hasta luego hasta luego 


## Inmutabilidad de las cadenas

Quiz√°s recuerdes que en ejemplos pasados de arreglos pod√≠amos editar cada uno de los elementos del arreglo, como en el siguiente ejemplo.

In [8]:
mi_arreglo = [1, 4, 7, 123, -5]
print("mi_arreglo contiene:", mi_arreglo)

mi_arreglo[2] = 111 # Cambiamos el valor en el √≠ndice 2 del arreglo
mi_arreglo[0] = 99 # cambiamos el valor del primer √≠ndice del arreglo

print("\nmi_arreglo contiene:", mi_arreglo)

mi_arreglo contiene: [1, 4, 7, 123, -5]

mi_arreglo contiene: [99, 4, 111, 123, -5]


Sin embargo, aunque el comporamiento para **leer** el contenido de nuestro arreglo, y apendizar (o, en este caso, concatenar) elementos sea muy similar al de los arreglos, las cadenas tienen una diferencia muy importante con respecto a los arreglos: las cadenas son **inmutables**.

Esto significa que no se puede modificar (o mutar) una cadena en un elemento espec√≠fico de √©sta. Si se intenta modificar un elemento de una cadena, Python arrojar√° un error e interrumpir√° la ejecuci√≥n.

In [9]:
cadena_inmutable = "No me puedes mutar, soy una cadena"
print(cadena_inmutable)
#Intentar mutar un elemento de la cadena resultar√° en un error
cadena_inmutable[0] = "a"

No me puedes mutar, soy una cadena


TypeError: 'str' object does not support item assignment