# **Curso Básico de Python: Cadenas de caracteres**

___

**Saúl Arciniega Esparza** | Ph.D. Profesor Asociado C Tiempo Completo

* [Twitter](https://twitter.com/zaul_arciniega) | [LinkedIn](https://www.linkedin.com/in/saularciniegaesparza/) | [ResearchGate](https://www.researchgate.net/profile/Saul-Arciniega-Esparza)
* [Hydrogeology Group](https://www.ingenieria.unam.mx/hydrogeology/), [Facultad de Ingeniería de la UNAM](https://www.ingenieria.unam.mx/)
___

## **Contenido**

* [Cadenas de Caracteres](#Cadenas-de-Caracteres)
* [Caracteres especiales](#Caracteres-especiales)
* [Concatenar texto](#Concatenar-texto)
* [Índices en cadenas](#Índices-de-cadenas-de-texto)
* [Eliminar caracteres](#Eliminar-elementos-dentro-de-una-cadena-de-caracteres)
* [Métodos de cadenas de caracteres](#Métodos-de-cadenas-de-caracteres)

___
# Cadenas de Caracteres

[Ir a Inicio](#Contenido)

Las cadenas de texto en Python son **objetos** los cuales tienen _atributos_ y _métodos_ específicos. En este capítulo veremos algunos de los _métodos_ más utilizados en el manejo de las cadenas de caracteres.

### Definir una cadena de caracteres

[Ir a Inicio](#Contenido)

Las cadenas de caracteres pueden ser expresadas usando comillas simples '...' o dobles "...", dando el mismo resultado.

In [None]:
'Bienvenidos a la clase de Percepcion Remota'

In [None]:
"Bienvenidos a la clase de Percepcion Remota"

En ocaciones es necesario meter una comilla o comillas dobles dentro de una cadena de caracteres, para ello se puede hacer de la siguiente forma:

In [None]:
'doesn\'t'  # se usa \' para insertar una comilla sin terminar la cadena de caracteres  

In [None]:
"doesn't"  # tambien se pueden usar comillas dobles para definir el texto que incluye comillas simples

In [None]:
'Hola "mundo'  # lo mismo aplica para las comillas simples

En conclusión, para definir una cadena de caracteres debemos abrir y cerrar con el mismo tipo de comilla.

___
## Caracteres especiales

[Ir a Inicio](#Contenido)

En ocaciones nos encontraremos texto con algún caracter especial, por ejemplo que nos indique salto de línea o insertar un tabulador. Estos caracteres especiales se definen al utilizar **\\** antes del caracter.
Los carceteres especiales más utilizados son:

|Caracter|Descripción|
|:-:|:-|
|\n| Salto de línea|
|\t| Tabulación|
|\\| Inserta una diagonal invertida|
|\'| Inser una comilla simple|
|\"| Inserta una comilla doble|
|r'...'| r antes de una cadena de caracteres deja un texto plano, es decir, evita que se activen los caracteres especiales|
|u'...'| u antes de una cadena de caracteres define un texto unicode|

In [None]:
print('1 Hola mundo')     # texto sin caracteres especiales
print('2 Hola\nmundo')    # insertar salto de linea
print('3 Hola\tmundo')    # insertar un tabulador
print('4 Hola \n mundo')  # insertar espacios y un salto de linea
print('5 Hola \t mundo')    # insertar espacios y un tabulador

Se pueden insertar los caracteres especiales que sean necesarios:

In [None]:
'Curso:\t Percepcion Remota \n en la Ingenieria Hidrologia'

El texto plano que se define al usar una r antes del texto será de mucha utilidad, especialmente en Windows, donde la ruta de los archivos se define con \:

In [None]:
r'C:\usuario\normal'  # forma correcta de insertar una ruta o el nombre de un archivo en Windows

Aunque si se quiere definie una \ en una cadena de caracteres se puede utilizar \\:

In [None]:
'C:/usuario/normal'

### Escribir texto en varios renglones

[Ir a Inicio](#Contenido)

Como se dijo en el capítulo de introducción, es conveniente no hacer líneas de código muy extensas para que sea legible, por lo que en ocaciones será necesario imprimir código en varias líneas.
Esto se puede hacer de varias maneras:
 - Usando paréntesis **()** para unir el texto de varios renglones:

In [None]:
print('Curso de '
      'Introductorio de Python')

Nótese que imprimió todo en un sólo renglón porque nunca se especificó un salto de renglón con \n, en este caso poner el texto en renglones diferentes no indica salto de renglón.
La segunda observación es que se debe de dejar el espacio suficiente para que el texto de los siguientes renglones inicie en la posición del paréntesis, recordemos que al no utilizar llaves **{}** como otros lenguajes, Python requiere una correcta estructuración del código.
 - La otra forma es usar triple comilla simple o doble:

In [None]:
""" 
Curso Introductorio de Python
"""

En este caso, escribir en renglones diferentes produce en la impresión un salto de renglón.
Este tipo de texto es más utilizado en la descripción general del código, cuando se agrega información del autor y demás.

___
## Concatenar texto

[Ir a Inicio](#Contenido)

Concatenar texto se refiere a unir dos o más cadenas de caracteres. En Python existen varias maneras de hacerlo:
- Usando **+** entre varias cadenas:

In [None]:
'variable= ' + '5'

In [None]:
'variable= ' + '5' + '  otra_variable= ' + 'hola'

Tambien podemos almacenar el texto en una variable y almacenarlo:

In [None]:
a = 'variable= '
b = '5'
print(a + b)

Recordemos que **+** concatena únicamente texto, si tenemos un número o cualquier otro objeto tenemos que convertirlo a typo cadena de caracteres primero, para ello usamos el comando **str()**

In [None]:
'variable= ' + str(5.2)

In [None]:
'lista= ' + str([1, 'a'])

Una variable que almacena una cadena de caracteres puede concatenar texto en ella misma usando **+=**, es decir:

In [None]:
a = ''  # definir una variable de texto
a

In [None]:
a += 'Curso'  # agrega la palabra 'Curso' a la variable a
a

In [None]:
a += ' de PR'  # agrega mas texto
a

In [None]:
a += '\n'  # tambien se puede concatenar caracteres especiales
a += 'en Ingenieria'
a

Este tipo de concatenación es muy util para imprimir resultados y escribir archivos de texto.
- La otra forma de concatenar texto es dándole formato, como ya se vío en el capítulo de introducción:

In [None]:
a, b = "Variable", 5.43
print('%s %.2f'%(a, b))
print('{} {:.2f}'.format(a, b))
print(f'{a} {b:.2f}')

Lo anterior también se puede guardar en variables, incluso el formato y las entradas en variables separadas:

fmt = '%s %.2f'  # definimos el formato
a = 'Variable'
b = 5.43
c = fmt%(a,b)  # aqui le damos formato y lo guardamos en una variable
print fmt%(a,b)
print c

Así mismo, podemos soobrescribir una variable que que tenga asignando formatos:

In [None]:
fmt = 'Precipitacion {} {:.2f}'  # definimos el formato
a = fmt.format('Var:',10)        # aqui le damos formato y lo guardamos en una variable
a += '\n'                        # agregamos un salto de linea
a += fmt.format('New:',100)      # agregamos mas texto con formato
a

___
## Índices de cadenas de texto

[Ir a Inicio](#Contenido)

Cuando nos interesa acceder a ciertos caracteres dentro de un texto podemos acerlo indicando la posición de él dentro de la cadena de carcateres.
Definamos la siguiente cadena de caracteres:

In [None]:
t = 'Python'

En el texto anterior, cada caracter tiene un índice específico, como se muestra a continuación:

|Texto|P|y|t|h|o|n|
|:-:|:-:|:-:|:-:|:-:|:-:|:-:|
|Indice|0|1|2|3|4|5|
|Indice|-6|-5|-4|-3|-2|-1|

Como se aprecia, los índices pueden ser positivos o negativos. En el caso positivo, el primer elemento inicia con 0 y el último es el número de elementos menos uno. En los índices negativos el último elemento inicia con -1.

In [None]:
print(t[0])   # imprimir el primer elemento
print(t[1])   # imprimir el segundo elemento
print(t[5])   # imprimir el último elemento
print(t[-6])  # imprimir el primer elemento (usando indices negativos)
print(t[-1])  # imprimir el ultimo elemento (usando indices negativos)

Vemos que sin importar el número de elementos, el índice 0 siempre denota al primer elemento y el índice -1 llama al último:

In [None]:
t = 'Hola mundo!'
print(t[0])   # primer elemento
print(t[-1])  # ultimo elemento

Los espacios en blanco cuentan como caracteres:

In [None]:
print(t[3])
print(t[4])  # espacio
print(t[5])

Recordemos que no necesitamos almacenar un texto para poder llamar a sus elementos:

In [None]:
print('Hola mundo!'[0])   # imprime el primer elemento de la cadena de caracteres
print('Hola mundo!'[-1])  # imprime el ultimo elemento de la cadena de caracteres

### Llamando a múltiples caracteres a la vez

[Ir a Inicio](#Contenido)

En caso de que interese llamar a varios caracteres dentro de un texto se debe de generar una cadena de índices mediante el uso de dos puntos **:**, como se muestra a continuación:

In [None]:
t = 'Hola mundo!'  # definimos una cadena de caracteres
t[1:7]  # accedemos al texto del indice 2 al 3, el ultimo no se toma!

Como se observa, sólo es necesario indicar el inidice inicial y final de un texto para acceder a sus elementos, sin embargo, en este tipo de sintaxis, el último elemento no se llama:

In [None]:
print(t[1], t[6])  # imprime los elementos con indices 1 y 6
print(t[1:6])      # el elemento con indice 6 no se toca!
print(t[1:7])      # se debe de agregar un índice más para llegar al elemento desado

Cuando se quire llamar a todos los elementos que están a partir de cierto índice, se utiliza

In [None]:
print(t[4:])  # devuelve todos los caracteres a partir del elemento con índice 4
print(t[-7:])  # devuelve todos los caracteres a partir del elemento con índice -7 (o 4 considerando indice positivo)

En caso contrario, que se quiera llamar a los elementos que están hasta cierto índice se utiliza:

In [None]:
print(t[:5])   # devuelve todos los caracteres hasta el elemento con índice 5-1 (es decir 4)
print(t[:-6])  # devuelve todos los caracteres hasta el elemento con índice -8 (o -7-1)

Se debe de tener cuidado cuando se quiera llamar a todos los elementos de una cadena de caracteres:

In [None]:
print(t)       # esto llama a la variable t
print(t[:])    # esto llama a todos los elementos de la cadena de caracteres
print(t[0:])   # es lo mismo que t[:]
print(t[:11])  # es lo mismo que t[:]

___
## Eliminar elementos dentro de una cadena de caracteres

[Ir a Inicio](#Contenido)

Las cadenas de caracteres no permiten eliminar sus elementos ni reemplazarlos mediante una asignación, por lo que no está permitido usar **del(texto[indice])** o **texto[0] = nuevo_caracter**.

___
## Métodos de cadenas de caracteres

[Ir a Inicio](#Contenido)

A continuación se presentan algunos de los métodos que se necesitaran en el curso referente a las cadenas de caracteres, suponiendo que se define una cadena en la variable **t**:

|Método|Descripción|
|:-:|:-|
|len(t)| Obtiene el número de elmentos|
|n\*t| Repite la cadena de caracteres n veces|
|t.count('a')| Devuelve el número de veces que se repite 'a' en t|
|t.endswith('a')| Devuelve True/False si es que t termina con 'a'|
|t.find('a')| Devuelve el índice de la primer coincidencia de 'a' dentro de t, en caso de no encontrar a 'a' devuelve -1|
|t.index('a')|Similar a **find()**, con la diferencia de que de no encontrar a 'a' marca un error|
|t.isalnum()| Devuelve True/False en caso de que el texto se puede convertir a número|
|','.join(['a','b'])| Une los elementos de una lista (los elementos deben de ser string) en una cadena de caracteres usando un delimitador definido por el usiario|
|t.lower()| Convierte todos lo caracteres en minúsculas|
|t.replace('a','b')| Busca todas las cadenas 'a' dentro de **t** y las remplaza por 'b'|
|t.split(',')| Separa los elementos de una cadena de caracteres usando un delimitador y devuelve una lista|
|t.upper()| Convierte todos los caracteres a mayusculas|


In [None]:
t = 'Python rules!'  # definir un texto de ejemplo

In [None]:
print(len(t))  # numero de elementos
print(3*t)     # repetir 4 veces t
print(t.count('e'))  # contar cuantas 'e' hay en t
print(t.count('X'))  # cuando una cadena no existe devuelve 0
print(t.count('les'))  # se puede buscar una cadena de más de un elemento
print(t.lower())  # convertir todo a minusculas
print(t.upper())  # convertir todo a mayusculas

In [None]:
print(t.endswith('!'))  # verificar si t termina con '!'
print(t.endswith('s'))  # cuando no termina con el caracter indicado devuelve False
print(t.endswith('rules!'))  # se puede verificar si termina con una cadena de varios elementos

In [None]:
print(t.find('y'))    # devuelve el indice del caracter 'y'
print(t.find('p'))    # Python es sensible a las minusculas y mayusculas
print(t.find('P'))    # en este caso si encuentra a 'P'
print(t.find('rul'))  # puede buscar el comienzo de una cadena dentro de t

In [None]:
print(t.isalnum())      # verificar si t es convertible a numero entero
print('5'.isalnum())    # si es un numero entero
print('5.2'.isalnum())  # no es un numero entero

In [None]:
a = ['a','b','10']
print(','.join(a)) # une el texto de la lista usando ',' como delimitador
print('.'.join(a)) # une el texto de la lista usando '.' como delimitador
print(' '.join(a)) # une el texto de la lista usando ' ' como delimitador
print('\t'.join(a)) # une el texto de la lista usando tabulador como delimitador

In [None]:
print(t.replace('l','m'))  # reemplaza todas las 'l' por 'm'
print(t)                   # tener cuidado con este tipo de operaciones, pues el texto original no ha sido afectado
t = t.replace('l','m')    # asi nos aseguramos de guardar los cambios
print(t)

In [None]:
row = 'a,b,10'        # definir texto delimitado
print(row.split(','))  # separa un texto 
print(row.split(';'))  # si no se elige el separador adecuado no separa los elementos

### Más métodos

[Ir a Inicio](#Contenido)

Se puede usar el comando **help** para obtener ayuda de todos los métodos disponibles en las cadenas de caracteres:

In [None]:
help(str)

Si ya se tiene definida una variable con una cadena de caracteres se puede acceder a la ayuda de alguno de sus métodos:

In [None]:
t = 'Python'
help(t.lower)  # no se usa el parentesis para visualiza la ayuda

### Múltiples métodos en una sola línea

[Ir a Inicio](#Contenido)

Cuando se quiere ahorrar espacio en el código evitando guardar resultados no deseados se puede hacer de la siguiente manera:

In [None]:
t = 'Python'

Veamos el tipo de elemento que resulta de usar algún método:

In [None]:
print(type(t))
print(type(t[0]))
print(type(t.upper()))

Como se observa todos los resultados anteriores son objetos tipo str (string), por lo que se les puede aplicar los mismos métodos.

In [None]:
t = 'Pythom'
t = t.lower()           # convertir a minusculas
t = t.replace('m','n')  # convertir la 'm' en 'n'
c = t.count('n')        # contar el numero de 'n' en t
print(t)
print(c)

Lo anterior se puede escribir en una única linea como:

In [None]:
t = 'Pythom'
c = t.lower().replace('m','n').count('n')
print(t)
print(c)

La sintaxis anterior se puede aplicar a CUALQUIER OBJETO, siempre y cuando se le apliquen métodos correspondientes a su TIPO.

In [None]:
lista = ['hola', 'mundo']
lista[0].upper()