# Las Cadenas

Las Cadenas de Python son uno de los tipos principales y más comunes en el lenguaje. Interactuar con cadenas, incluso el formato y el remplazo de texto, es una habilidad escencial a desarrollar para trabajar con código Python.

## Escenario: Crear un programa para descubrir hechos sobre la Luna.

Imaginemos que estamos creando un programa para descubrir algunas mediciones y otra informaciñon sobre la Luna. Tendremos que usar varias operaciones de cadena para crear el resultado.

## ¿Qué aprenderemos?

Al final de este módulo, podrás:

* Utilizar métodos de cadena especiales.
* Utilizar variables para introducir valores en el texto.
* Aplicar otras técnicas de formato avanzadas para cambiar la forma en que se presenta el texto.

## ¿Cuál es el objetivo principal?

Incorporar operaciones de cadena cuando creemos un programa Python.

### Conceptos básicos de cadenas en Python

Aunque las cadenas en Python parecen ser simples y directas, hay cierta complejidad en las reglas de cadena que es importante comprender. Conocer las reglas nos ayuda a evitar ser sorprendidos por el comportamiento de las cadenas cuando modifica valores o da formato.

### Inmutabilidad de las cadenas

En Python, las cadenas son inmutables. Es decir, no pueden cambiar. Esta propiedad del tipo cadena puede ser sorprendente, por que Python no te da errores cuando alteras las cadenas.

En nuestro ejemplo para este módulo, tenemos un solo hecho sobre la Luna que está asignado a una variable, y debemos agregarle otro hecho (oración). Usando el intérprete de Python, parece que agregar el segundo hecho alteraría la variable:


In [2]:
fact = "The Moon has no atmosphere. "
fact + "No sound can be heard on the Moon."

'The Moon has no atmosphere. No sound can be heard on the Moon.'

Aunque puede parecer que hemos modificado la variable fact, una comprobación rápida del valor revela que el valor original no ha cambiado:

In [3]:
fact

'The Moon has no atmosphere. '

El truco aquí es que debemos usar un valor devuelto. Cuando agregas cadenas, Python no modifica ninguna cadena, pero devuelve una nueva cadena como resultado. Para mantener este nuevo resultado, asígnemoslo a una nueva variable:

In [4]:
two_facts = fact + "No sound can be heard on the Moon."
two_facts

'The Moon has no atmosphere. No sound can be heard on the Moon.'

Como resultado, las operaciones en cadenas siempre producen cadenas nuevas.

### Acerca del uso de comillas

Podemos incluir cadenas en Python entre comillas simples, dobles o triples. Aunque podemos usarlos indistintamente, es mejor usar un tipo de manera consistente dentro de un proyecto. Por ejemplo, la siguiente cadena utiliza comillas dobles:



In [None]:
moon_radius = "The Moon has a radius of 1,080 miles"

Sin embargo, cuando una cadena contiene palabras, números o caracteres especiales (una subcadena) que tambien están entre comillas, debemos usar un estilo diferente. Por ejemplo, si una subcadena utiliza comillas dobles, encierra toda la cadena en comillas simples, como se muestra aquí:

In [6]:
'The "near side" is the part of the Moon that faces the Earth'

'The "near side" is the part of the Moon that faces the Earth'

Del mismo modo, si hay comillas simples (o un apóstrofo, como en Moon en el siguiente ejemplo) en cualquier lugar dentro de la cadena, encerraremos toda la cadena entre comillas dobles.

In [7]:
"We only see about 60% of the Moon's surface"

"We only see about 60% of the Moon's surface"

Si no se alteran comillas simples y dobles, el intérprete de Python puede provocar un error de sintaxis, como se muestra aquí:

In [7]:
'We only see about 60% of the Moon's surface'

SyntaxError: invalid syntax (372339048.py, line 1)

Cuando el texto tiene una combinación de comillas simples y dobles, podemos utilizar comillas triples para evitar problemas con el intérprete:

In [9]:
"""We only see about 60% of the Moon´s surface, this is know as the "near side." """

'We only see about 60% of the Moon´s surface, this is know as the "near side." '

### Texto multilínea

Hay algunas maneras diferentes de definir varias líneas de texto como una sola variable. Las formas más comunes son:

* Utilizar un carácter de nueva línea ().\n
* Utilizar comillas triples (""")..
* Los caracteres de nueva línea separan el texto en varias líneas al imprimir la salida:

In [10]:
multiline = "Facts about the Moon:\n There is no atmosphere.\n There is no sound."
print(multiline)

Facts about the Moon:
 There is no atmosphere.
 There is no sound.


Podemos lograr el mismo resultado usando comillas triples:


In [13]:
multiline = """Facts about the Moon:
There is no atmosphere.
There is no sound."""
print(multiline)

Facts about the Moon:
There is no atmosphere.
There is no sound.


### Metodos string en Python

Las cadenas son uno de los tipos de métodos mñas comunes en Python. A menudo tendremos que manipularlos para extraer información o ajustarnos a un formato determinado.
Python incluye varios metodos de cadena que están diseñados para realizar las transformaciones más comunes y útiles.

Los métodos de cadena forman partel del tipo str. Esto significa que los métodos existen como variables de cadena o parte de la cadena directamente. Por ejemplo, el método .title() se puede utilizar con una cadena directamente:


In [14]:
'temperatures and facts about the moon'.title()

'Temperatures And Facts About The Moon'

Y el mismo comportamiento y uso ocurre en una variable:

In [15]:
heading = 'temperatures and facts about the moon'
heading.title()

'Temperatures And Facts About The Moon'

### Dividir una cadena

Un método de cadena común es .split(). Sin argumentos, el método separará la adena en cada espacio. Esto crearía una lista de cada palabra o número que está separado por un espacio:

In [18]:
temperatures = '''Daylight: 260 F
... Nighttime: -280 F'''
temperatures.split()

['Daylight:', '260', 'F', 'Nighttime:', '-280', 'F']

En este ejemplo, se trata de varias líneas, por lo que el caráter de nueva línea (implícito) se puede utilizar para dividir la cadena al final de cada línea, creando líneas individuales:

In [19]:
temperatures .split('\n')

['Daylight: 260 F', 'Nighttime: -280 F']

Este tipo de división se vuelve útil cuando necesitamos un bucle para procesar o extraer información, o cuando estamos cargando datos de un archivo de texto u otro recurso.

### Buscar una cadena

Además de usar un bucle, algunos métodos de cadena pueden buscar contenido antes del procesamiento, sin la necesidad de un bucle. Supongamos que tenemos dos oraciones que discuten las temperaturas en varios planetas y lunas, pero solo nos interesan las temperaturas que están  relacionadas con nuestra Luna. Es decir, si las frases no hablan de la Luna, no deben procesarse para extraer información.

La forma más sencilla de descubrir si existe una palabra en un caracter o un grupo de caracteres determinados en una cadena sin usar un método

In [24]:
'Moon' in 'This text will describe facts and Challenge with space travel'

False

In [25]:
'Moon' in 'This text will describe facts about the Moon'

True

Un enfoque para encontrar la posición de una palabra específica en una cadena es usar el método .find()

In [41]:
temperatures = """Saturn has a daytime temperature of -170 degrees Celsius,
... wile Mars has -28 Celsius."""

In [36]:
temperatures.find('Moon')

-1

El metodo .find() devuelve -1 cuando no se encuentra la palabra o devuelve el índice (el numero que representa el lugar en la cadena). Así es como se comportaría si estuvieramos buscando la palabra Marte:

In [45]:
temperatures.find('Mars')

65

65 es la posición donde aparece en la cadena 'Mars'

Otra forma de buscar contenido es usar el método .count() que devuelve el número total de apariciones de una determinada palabra en una cadena:

In [48]:
temperatures.count('Mars')

1

In [49]:
temperatures.count('Moon')

0

Las cadenas en Python distinguen entre mayúsculas, lo que sifnifica que Luna (Moon) y luna (moon) se consideran palabras diferentes. Para realizar una comparación sin distinción de mayusculas y minúsculas, podemos conertir una cadena en todas las letras minúsculas mediante el método .lower()

In [50]:
"The Moon And The Earth".lower()

'the moon and the earth'

Al igual que el método .lower(), las cadenas tienen un método que hace lo contrario .upper(), convirtiendo cada carácter en mayúsculas:

In [51]:
'The Moon And The Earth'.upper()

'THE MOON AND THE EARTH'

Cuando buscamos y comprobamos contenido, un enfoque más sólido es poner en minúsculas una cadena para que el estilo de escritura no impida una coincidencia. Por ejemplo, si estamos contando el número de veces que aparece 'la' palabra, eel método no contaría las veces en que aparece 'La', aunque ambas sean la misma palabra. Podemos utilizar el método .lower() para cambiar todos los caracteres a minúsculas.

### Comprobar el contenido

Hay ocasiones en las que procesaremos texto para extraer informaciñon que es irregular en su presentación. Por ejemplo, la siguiente cadena es mñas sencilla de procesar que un párrafo no estructurado:

In [56]:
temperatures = 'Mars Average Temperature: -60 C'

Para extreaer la temperatura promedio en Marte (Mars), podemos hacerlo con los siguientes métodos:

In [57]:
parts = temperatures.split(':')
parts

['Mars Average Temperature', ' -60 C']

In [58]:
parts[-1]

' -60 C'

Los métodos anteriores confían ciegamente en que todo lo que está despues de los dos puntos (:) es una temperatura. La cadena se divide en cuanto encuentra :, lo que produce una lista de dos elementos. Usando [-1] en la lista devuelve el último elemento, que es la temperatura en este ejemplo.

Si el texto es irregular, no podemos usar los mismos métodos de división para obtener el valor. Debemos iterar por todos los elementos y comprobar si los valores son de un tipo determinado. Python tiene métodos que ayudan a comprobar el tipo de cadena:

In [59]:
>>> mars_temperature = 'The highest temperature on Mars is about 30 C'

In [60]:
for item in mars_temperature.split():
    if  item.isnumeric():
        print(item)

30


Al igual que el método .isnumeric(), podemos comprobar si hay cadenas que se parezcan a decimales. .isdecimal()

Dato: Podría ser sorprendente saber que "-70".isnumeric regresa False. Esto se debe a que todos los caracteres de la cadena tendrían que ser numéricos y el guión (-) no es numérico. Si necesitamos comprobar los números negativos en una cadena, el método .isnumeric() no funcionaría.

Hay validaciones adicionales que podemos aplicar en cadenas para comprobar si hay valores. Par los números negativos, el guión está prefijado al número, y eso se puede detectar con el método: .starwhith().

In [61]:
'-60'.startswith('-')

True

Del mismo modo, el método .endswhith() ayida a verificar el último carácter de una cadena:

In [62]:
if "30 C".endswith("C"):
    print("This temperature is in Celcius")

This temperature is in Celcius


Hay otros métodos que ayudan en situaciones en las que el texto necesita ser transformado en otra cosa.

Hasta ahora, hemos visto cadenas que pueden usar C para celcius y F para Farenheit. POdemos utilizar el método .replace() para buscar y remplazar apariciones de un carácter o grupo de caracteres:

In [63]:
'Saturn has a daytime temperature of -170 degrees Celcius, while Mars has -28 Celcius.'.replace('Celcius', 'C')

'Saturn has a daytime temperature of -170 degrees C, while Mars has -28 C.'

Como se mencionó anteriormente, .lower() es una buena manera de normalizar el texto para hacer una búsqueda sin distinción de mayúsculas y minúsculas. Revisemos rápidamente si algún texto distingue las temperaturas.

In [64]:
text = 'Temperatures on the Moon can vary wildly.'
'temperatures' in text

False

In [65]:
'temperatures' in text.lower()

True

Es posible que no necesitemos hacer una verificación que no distinga entre mayúsculas y minúsculas todo el tiempo, pero estandarizar cada letra es un buen enfoque cuando el texto utiliza un estilo de escritura mixto.

Después de dividir el texto y realizar las transformaciones, es posible que debamos volver a juntar todas las partes. Así como el método .split() puede separar caracteres, el método .join() puede volver a unirlos.

El método .join() requiere un iterable (como una lista de Python) como argumento, por lo que su uso se ve diferente de otros métodos de cadena:

In [69]:
moon_facts = ['The Moon is drifting away from the Earth.', 'On average, the Moon is moving about 4cm evert year']
'\n'.join(moon_facts)

'The Moon is drifting away from the Earth.\nOn average, the Moon is moving about 4cm evert year'

En este ejemplo, el carácter salto de línea ('\n') se utiliza para unir los dos elementos de la lista

### Formato de cadenas en Python

Además de transformar el texto y realizar operaciones básicas como la coincidencia y la búsqueda, es esencial dar formato al texto cuando se presenta información. La forma más sencilla de presentar información de texto con Python es usar la función print(). Nos resultará fundamental obtener información en variables y otras estructuras de datos en cadenas que pueden usar print().

##### Formato con signo de porsentaje (%)

El marcador de posición %s y la variable se pasa al texto despúes del carácter % fuera de la cadena. A continuación veremos cómo dar formato mediante el uso del carácter %:

In [2]:
mass_percentage = '1/6'
print('On the Moon, you would weigh about %s of your weight on Earth' % mass_percentage)

On the Moon, you would weigh about 1/6 of your weight on Earth


El uso de múltiples valores cambia la sintaxis, ya que requiere paréntesis para rodear las variables que se pasan: 

In [71]:
print("""Both sides of the %s get the same amount of sunlight,
but only one side is seen from %s because
the %s rotates around its own axis when its orbits %s.""" % ('Moon', 'Earth', 'Moon', 'Earth'))

Both sides of the Moon get the same amount of sunlight,
but only one side is seen from Earth because
the Moon rotates around its own axis when its orbits Earth.


Aunque este método sigue siendo una forma válida de dar formato a las cadenas, puede provocar errores y una disminución en la claridad en el código cuando se trata de múltiples variables. Cualquiera de las otras dos opciones de formato descritas aquó sería más adecuada para este propósito.

El método format()

El método format() utiliza llaves ({ }) como marcadores de posición dentro de una cadena y utiliza la asignación de variables para reemplazar el texto.

In [72]:
mass_percentage = '1/6'
print('On the Moon, you would weigh about {} of your weight on Earth'.format(mass_percentage))

On the Moon, you would weigh about 1/6 of your weight on Earth


No es necesario asignar variables repetidas varias veces, lo que lo hace menos detallado por que se debe asignar menos variables.

In [73]:
print("""You are lighter on the {0}, because on the {0}
... you would weigh about {1} of your weight on Earth""".format("Moon", mass_percentage))

You are lighter on the Moon, because on the Moon
you would weigh about 1/6 of your weight on Earth


En lugar de llaves vacías, la sustitución es usar números, si queremos usar el primer argumento {0} (índice) en este caso Moon{0} sería con el método .format(). Para la repetición simple {0} funciona bien, pero reduce la legibilidad. Para mejorar la legibilidad, utilizamos argumentos de palabras clave en .format() y, a continuación, hacemos referencia a los mismos argumentos dentro de las llaves:

In [74]:
print(""" Yoy are lighter on the {moon}, because on the {moon}
... yoy would weigh about {mass} of your weight on Earth""".format(moon="Moon", mass=mass_percentage))

 Yoy are lighter on the Moon, because on the Moon
yoy would weigh about 1/6 of your weight on Earth


##### **Acerca de las cadenas con f**

A partir de la versión 3.6 de Python, es posible usar f-strings. Estas cadenas parecen plantillas con las mismas variables con nombre que las del código. El uso de cadenas f en el ejemplo anterior se vería así:

In [3]:
print(f'On the Moon you would weigh about {mass_percentage} of you weight on the Earth')

On the Moon you would weigh about 1/6 of yoy weight on the Earth


Las variables van dentro de llaves y la cadena debe usar el prefijo f

Además de que las cadenas f son menos detalladas que cualquier otra opción de formato, es posible usar expresiones dentro de las llaves. Estas expresiones pueden ser funciones u operaciones directas. Por ejemplo, si deseas representar el valor 1/6 como porcentaje con un decimal. podmos utilizar la función round() directamente:

In [4]:
print(f'On the Moon you would weigh about {round(100/6, 1)}% of you weight on the Earth')

On the Moon you would weigh about 16.7% of you weight on the Earth


El uso de una expresión no requiere una llamada a una función. Cualquiera de los metodos de cadena también son válidos. Por ejemplo, la cadena podría imponer un estilo de escritura específico para crear un título.

In [5]:
subject = 'interesting facts about the moon'
f'{subject.title()}'

'Interesting Facts About The Moon'

## Resumen

Las cadenas de Python son uno de los tipos de datos más comunes utilizados en el lenguaje. En este módulo, aprendimos sobre algunas de sus propiedades y los métodos más comunes para manipularlas. Finalmente, vimos formas de adr formato a las cadenas mediante el uso de tres técnicas diferentes:

* Uso del formateador %
* Uso de .format() en una cadena.
* Usamos f-strings.

Este conocimiento es fundamental y nos ayudará con otras estructuras de datos en Python que funcionan bien con cadenas, como diccionarios y listas.