## Cadenas

Conocer las reglas le ayuda a evitar ser sorprendido por el comportamiento de las cadenas cuando modifica valores o da formato al texto.

## Inmutabilidad de las cadenas

En Python, las cadenas son inmutables. Es decir, no pueden cambiar. Esta propiedad del tipo de cadena puede ser sorprendente, porque Python no te da errores cuando alteras las cadenas.

En nuestro ejemplo para este módulo, tienes un solo hecho sobre la Luna que está asignado a una variable, y debes agregarle otro hecho (oración). Usando el intérprete de Python, parece que agregar el segundo hecho alteraría la variable:

In [1]:
fact = 'The Moon has no atmosphere.'
fact + 'No sound can be heard on the Moon.'

'The Moon has no atmosphere.No sound can be heard on the Moon.'

Aunque puede parecer que hemos modificado la variable fact, una comprobación rápida del valor revela que el valor original no ha cambiado:

In [2]:
fact

'The Moon has no atmosphere.'

El truco aquí es que debes usar un valor devuelto. Cuando agregas cadenas, Python no modifica ninguna cadena, pero devuelve una nueva cadena como resultado. Para mantener este nuevo resultado, asígnelo a una nueva variable:

In [3]:
two_facts = fact + 'No sound can be heard on the Moon.'
two_facts

'The Moon has no atmosphere.No sound can be heard on the Moon.'

## Acerca del uso de comillas

Puedes incluir cadenas de Python entre comillas simples, dobles o triples. Aunque puedes usarlos indistintamente, es mejor usar un tipo de manera consistente dentro de un proyecto. Por ejemplo, la siguiente cadena utiliza comillas dobles:

In [4]:
moon_radius = "The Moon has a radius of 1,080 miles"

Sin embargo, cuando una cadena contiene palabras, números o caracteres especiales (una subcadena) que también están entre comillas, debes usar un estilo diferente. Por ejemplo, si una subcadena utiliza comillas dobles, encierra toda la cadena entre comillas simples, como se muestra aquí:

In [5]:
'The "near side" is the part of the Moon that faces the Earth'

'The "near side" is the part of the Moon that faces the Earth'

Del mismo modo, si hay comillas simples (o un apóstrofo, como en Moon en el siguiente ejemplo) en cualquier lugar dentro de la cadena, encierra toda la cadena entre comillas dobles:

In [6]:
"We only see about 60% of the Moon's surface"

"We only see about 60% of the Moon's surface"

Si no se alternan comillas simples y dobles, el intérprete de Python puede provocar un error de sintaxis, como se muestra aquí:

In [7]:
'We only see about 60% of the Moon's surface'
  File '<stdin>', line 1
    'We only see about 60% of the Moon's surface'
                                       ^
SyntaxError: invalid syntax

SyntaxError: unterminated string literal (detected at line 1) (1933904877.py, line 1)

Cuando el texto tiene una combinación de comillas simples y dobles, puedes utilizar comillas triples para evitar problemas con el intérprete:

In [8]:
"""We only see about 60% of the Moon's surface, this is known as the "near side"."""

'We only see about 60% of the Moon\'s surface, this is known as the "near side".'


## Texto multilínea

Hay algunas maneras diferentes de definir varias líneas de texto como una sola variable. Las formas más comunes son:

Utiliza un carácter de nueva línea ().\n
Utiliza comillas triples (""")..
Los caracteres de nueva línea separan el texto en varias líneas al imprimir la salida:

In [11]:
multiline = "Facts about the Moon:\n There is no atmosphere.\n There is no sound."
print(multiline)
Facts about the Moon:
There is no atmosphere.
There is no sound.

SyntaxError: invalid syntax (1652715975.py, line 3)

In [12]:
multiline = """Facts about the Moon:
...  There is no atmosphere.
...  There is no sound."""
print(multiline)
Facts about the Moon:
There is no atmosphere.
There is no sound

SyntaxError: invalid syntax (2998373524.py, line 5)

## Métodos string en Pypthon

Las cadenas son uno de los tipos de métodos más comunes en Python. A menudo tendrá que manipularlos para extraer información o ajustarse a un formato determinado. Python incluye varios métodos de cadena que están diseñados para realizar las transformaciones más comunes y útiles.

Los métodos de cadena forman parte del tipo str. Esto significa que los métodos existen como variables de cadena o parte de la cadena directamente. Por ejemplo, el método .title() se puede utilizar con una cadena directamente:

In [13]:
'temperatures and facts about the moon'.title()

'Temperatures And Facts About The Moon'

In [14]:
heading = 'temperatures and facts about the moon'
heading.title()

'Temperatures And Facts About The Moon'

## Divivdir una cadena

Un método de cadena común es .split() . Sin argumentos, el método separará la cadena en cada espacio. Esto crearía una lista de cada palabra o número que está separado por un espacio:

In [15]:
temperatures = '''Daylight: 260 F
... Nighttime: -280 F'''
temperatures .split()

['Daylight:', '260', 'F', 'Nighttime:', '-280', 'F']

Este tipo de división se vuelve útil cuando necesita un bucle para procesar o extraer información, o cuando está cargando datos de un archivo de texto u otro recurso.

En este ejemplo, se trata de varias líneas, por lo que el carácter de nueva línea (implícito) se puede utilizar para dividir la cadena al final de cada línea, creando líneas individuales:

In [16]:
temperatures .split('\n')

['Daylight: 260 F', 'Nighttime: -280 F']

## Buscar una cadena

Además de usar un bucle, algunos métodos de cadena pueden buscar contenido antes del procesamiento, sin la necesidad de un bucle. Supongamos que tienes dos oraciones que discuten las temperaturas en varios planetas y lunas, pero solo te interesan las temperaturas que están relacionadas con nuestra Luna. Es decir, si las frases no hablan de la Luna, no deben procesarse para extraer información.

La forma más sencilla de descubrir si existe una palabra, un carácter o un grupo de caracteres determinados en una cadena es sin usar un método:

In [17]:
'Moon' in 'This text will describe facts and challenges with space travel'

False

In [18]:
'Moon' in 'This text will describe facts about the Moon'

True

## método .find():

Encontrá la posición de una palabra específica en una cadena

In [22]:
temperatures = """Saturn has a daytime temperature of -170 degrees Celsius,
... while Mars has -28 Celsius."""

In [23]:
temperatures.find('Moon')

-1

In [24]:
temperatures.find('Mars')

64

 ## método .count()
 
 Devuelve el número total de apariciones de una determinada palabra en una cadena:

In [25]:
temperatures.count('Mars')

1

In [26]:
temperatures.count('Moon')

0

Cuando buscas y compruebas contenido, un enfoque más sólido es poner en minúsculas una cadena para que el estilo de escritura no impida una coincidencia. Por ejemplo, si estás contando el número de veces que aparece 'la' palabra, el método no contaría las veces en que aparece 'La', aunque ambas sean la misma palabra. Puedes utilizar el método .lower() para cambiar todos los caracteres a minúsculas.

Las cadenas en Python distinguen entre mayúsculas y minúsculas, lo que significa que Luna (Moon) y luna (moon) se consideran palabras diferentes.

## método .lower()

In [27]:
"The Moon And The Earth".lower()

'the moon and the earth'

## método .upper()

In [28]:
'The Moon And The Earth'.upper()

'THE MOON AND THE EARTH'

## Comprobar el contenido | Validaciones

Hay ocasiones en las que procesarás texto para extraer información que es irregular en su presentación. Por ejemplo, la siguiente cadena es más sencilla de procesar que un párrafo no estructurado:

Estos métodos confían ciegamente en que todo lo que está después de los dos puntos (:) es una temperatura. La cadena se divide en cuanto encuentra :, lo que produce una lista de dos elementos. Usando [-1] en la lista devuelve el último elemento, que es la temperatura en este ejemplo.

## método .split()

In [30]:
temperatures = 'Mars Average Temperature: -60 C'

parts = temperatures.split(':')
parts

['Mars Average Temperature', ' -60 C']

In [31]:
parts[-1]

' -60 C'

Si el texto es irregular, no puedes usar los mismos métodos de división para obtener el valor. Debes iterar por todos los elementos y comprobar si los valores son de un tipo determinado. Python tiene métodos que ayudan a comprobar el tipo de cadena.

## método .isnumeric() 

Puedes comprobar si hay cadenas que se parezcan a números

! Dato: Podría ser sorprendente saber que "-70".isnumeric() regresa False. Esto se debe a que todos los 
caracteres de la cadena tendrían que ser numéricos y el guión (-) no es numérico. Si necesitas comprobar los números negativos en una cadena, el método .isnumeric() no funcionaría.

In [32]:
>>> mars_temperature = 'The highest temperature on Mars is about 30 C'

In [33]:
for item in mars_temperature.split():
    if item.isnumeric():
        print(item)

30


## método .isdecimal()

Comprueba si hay cadenas que se parezcan a décimales

In [42]:
for item in mars_temperature.split():
    if item.isdecimal():
        print(item)

30



## método: .startswith().

Detectar un prefijado al numero como un guión (por ejemplo para los números negativos).

In [34]:
'-60'.startswith('-')

True

## método .endswith()

Ayuda a verificar el último carácter de una cadena:

In [35]:
if "30 C".endswith("C"):
    print("This temperature is in Celsius")

This temperature is in Celsius


## Transformar texto

Hay otros métodos que ayudan en situaciones en las que el texto necesita ser transformado en otra cosa.

## método .replace()

Busca y reemplaza apariciones de un carácter o grupo de caracteres:

In [36]:
'Saturn has a daytime temperature of -170 degrees Celsius, while Mars has -28 Celsius.'.replace('Celsius', 'C')

'Saturn has a daytime temperature of -170 degrees C, while Mars has -28 C.'

## método .lower()

Normalizar el texto para hacer una búsqueda sin distinción de mayúsculas y minúsculas.

In [37]:
text = 'Temperatures on the Moon can vary wildly.'
'temperatures' in text

False

In [38]:
'temperatures' in text.lower()

True

## método .join()

Juntar todas las partes. 

In [45]:
moon_facts = ['The Moon is drifting away from the Earth.', 'On average, the Moon is moving about 4cm every year']
'\n'.join(moon_facts)

'The Moon is drifting away from the Earth.\nOn average, the Moon is moving about 4cm every year'

## Formato de cadenas en Python

Además de transformar el texto y realizar operaciones básicas, como la coincidencia y la búsqueda, es esencial dar formato al texto cuando se presenta información. La forma más sencilla de presentar información de texto con Python es usar la función print(). Te resultará fundamental obtener información en variables y otras estructuras de datos en cadenas que puedan usar print().

## %s

In [46]:
mass_percentage = '1/6'
print('On the Moon, you would weigh about %s of your weight on Earth' % mass_percentage)

On the Moon, you would weigh about 1/6 of your weight on Earth


El uso de múltiples valores cambia la sintaxis, ya que requiere paréntesis para rodear las variables que se pasan:

In [47]:
print("""Both sides of the %s get the same amount of sunlight,
    but only one side is seen from %s because
    the %s rotates around its own axis when it orbits %s.""" % ('Moon', 'Earth', 'Moon', 'Earth'))

Both sides of the Moon get the same amount of sunlight,
    but only one side is seen from Earth because
    the Moon rotates around its own axis when it orbits Earth.


## método .format()

Este método utiliza llaves ({}) como marcadores de posición dentro de una cadena y utiliza la asignación de variables para reemplazar el texto.

In [48]:
mass_percentage = '1/6'
print('On the Moon, you would weigh about {} of your weight on Earth'.format(mass_percentage))

On the Moon, you would weigh about 1/6 of your weight on Earth


In [49]:
print("""You are lighter on the {0}, because on the {0} 
... you would weigh about {1} of your weight on Earth""".format("Moon", mass_percentage))

You are lighter on the Moon, because on the Moon 
you would weigh about 1/6 of your weight on Earth


En lugar de llaves vacías, la sustitución es usar números. Si queremos usar en el primer argumento {0} (índice de cero) en este caso Moon{0} sería con el método .format(). Para la repetición simple {0} funciona bien, pero reduce la legibilidad. Para mejorar la legibilidad, utilizamos argumentos de palabras clave en .format() y, a continuación, hacemos referencia a los mismos argumentos dentro de las llaves:

In [50]:
print("""You are lighter on the {moon}, because on the {moon} 
... you would weigh about {mass} of your weight on Earth""".format(moon="Moon", mass=mass_percentage))

You are lighter on the Moon, because on the Moon 
you would weigh about 1/6 of your weight on Earth


## Acerca de las cadenas con f

A partir de la versión 3.6 de Python, es posible usar f-strings. Estas cadenas parecen plantillas con las mismas variables con nombre que las del código. El uso de cadenas f en el ejemplo anterior se vería así:

In [51]:
print(f'On the Moon, you would weigh about {mass_percentage} of your weight on Earth')

On the Moon, you would weigh about 1/6 of your weight on Earth


Las variables van dentro de llaves y la cadena debe usar el prefijo f

Además de que las cadenas f son menos detalladas que cualquier otra opción de formato, es posible usar expresiones dentro de las llaves. Estas expresiones pueden ser funciones u operaciones directas. Por ejemplo, si deseas representar el valor 1/6 como un porcentaje con un decimal, puede utilizar la función round() directamente:

In [52]:
round(100/6, 1)

16.7

Con las cadenas f, no es necesario asignar un valor a una variable de antemano:

In [53]:
print(f'On the Moon, you would weigh about {round(100/6, 1)}% of your weight on Earth')

On the Moon, you would weigh about 16.7% of your weight on Earth


El uso de una expresión no requiere una llamada a una función. Cualquiera de los métodos de cadena también son válidos. Por ejemplo, la cadena podría imponer un estilo de escritura específico para crear un título:

In [54]:
subject = 'interesting facts about the moon'
f'{subject.title()}'

'Interesting Facts About The Moon'