### Inmutabilidad de las cadenas

In [3]:
fact = 'The Moon has no atmosphere.'
fact + 'No sound can be heard on the Moon.'

'The Moon has no atmosphere.No sound can be heard on the Moon.'

La comprobación rápida del valor revela que el valor original no ha cambiado:

In [2]:
fact

'The Moon has no atmosphere.'

Asignar el valor devuelto a una nueva variable

In [4]:
two_facts = fact + 'No sound can be heard on the Moon.'
two_facts

'The Moon has no atmosphere.No sound can be heard on the Moon.'

### Acerca del uso de comillas

Comillas dobles

In [7]:
moon_radius = "The Moon has a radius of 1,080 miles"
print(moon_radius)

The Moon has a radius of 1,080 miles


Sin embargo, cuando una cadena contiene palabras, números o caracteres especiales (una subcadena) que también están entre comillas, debes usar un estilo diferente. Por ejemplo, si una subcadena utiliza comillas dobles, encierra toda la cadena entre comillas simples, como se muestra aquí:

In [11]:
near_side = 'The "near side" is the part of the Moon that faces the Earth'
print(near_side)

The "near side" is the part of the Moon that faces the Earth


Del mismo modo, si hay comillas simples (o un apóstrofo, como en Moon en el siguiente ejemplo) en cualquier lugar dentro de la cadena, encierra toda la cadena entre comillas dobles:

In [12]:
surface = "We only see about 60% of the Moon's surface"
print(surface)

We only see about 60% of the Moon's surface


Si no se alternan comillas simples y dobles, el intérprete de Python puede provocar un error de sintaxis, como se muestra aquí:

In [13]:
surface = 'We only see about 60% of the Moon's surface'
  File '<stdin>', line 1
    'We only see about 60% of the Moon's surface'
print(surface)


SyntaxError: unterminated string literal (detected at line 1) (950583026.py, line 1)

Cuando el texto tiene una combinación de comillas simples y dobles, puedes utilizar comillas triples para evitar problemas con el intérprete:


In [14]:
surface = """We only see about 60% of the Moon's surface, this is known as the "near side"."""
print(surface)

We only see about 60% of the Moon's surface, this is known as the "near side".


### Texto multilínea

Hay algunas maneras diferentes de definir varias líneas de texto como una sola variable. Las formas más comunes son:

* Utiliza un carácter de nueva línea ().\n
* Utiliza comillas triples (""")..
* Los caracteres de nueva línea separan el texto en varias líneas al imprimir la salida:

In [15]:
multiline = "Facts about the Moon:\n There is no atmosphere.\n There is no sound."
print(multiline)



Facts about the Moon:
 There is no atmosphere.
 There is no sound.


Puedes lograr el mismo resultado utilizando comillas triples:}


In [16]:

multiline = """Facts about the Moon:
...  There is no atmosphere.
...  There is no sound."""
print(multiline)


Facts about the Moon:
 There is no atmosphere.
 There is no sound.


## Métodos string en Python

Las cadenas son uno de los tipos de métodos más comunes en Python. A menudo tendrá que manipularlos para extraer información o ajustarse a un formato determinado. Python incluye varios métodos de cadena que están diseñados para realizar las transformaciones más comunes y útiles.

Los métodos de cadena forman parte del tipo ``str``. Esto significa que los métodos existen como variables de cadena o parte de la cadena directamente. Por ejemplo, el método ``.title()`` se puede utilizar con una cadena directamente:




In [17]:
multiline = 'temperatures and facts about the moon'.title()
print(multiline)

Temperatures And Facts About The Moon


Y el mismo comportamiento y uso ocurre en una variable:



In [18]:

heading = 'temperatures and facts about the moon'
heading.title()


'Temperatures And Facts About The Moon'

### Dividir una cadena

Un método de cadena común es ``.split()`` . Sin argumentos, el método separará la cadena en cada espacio. Esto crearía una lista de cada palabra o número que está separado por un espacio:



In [19]:
temperatures = '''Daylight: 260 F
... Nighttime: -280 F'''
temperatures .split()


['Daylight:', '260', 'F', 'Nighttime:', '-280', 'F']

En este ejemplo, se trata de varias líneas, por lo que el carácter de nueva línea (implícito) se puede utilizar para dividir la cadena al final de cada línea, creando líneas individuales:



In [20]:
temperatures .split('\n')

['Daylight: 260 F', 'Nighttime: -280 F']

Este tipo de división se vuelve útil cuando necesita un bucle para procesar o extraer información, o cuando está cargando datos de un archivo de texto u otro recurso.

### Buscar una cadena

Además de usar un bucle, algunos métodos de cadena pueden buscar contenido antes del procesamiento, sin la necesidad de un bucle. Supongamos que tienes dos oraciones que discuten las temperaturas en varios planetas y lunas, pero solo te interesan las temperaturas que están relacionadas con nuestra Luna. Es decir, si las frases no hablan de la Luna, no deben procesarse para extraer información.

La forma más sencilla de descubrir si existe una palabra, un carácter o un grupo de caracteres determinados en una cadena es sin usar un método:

In [21]:
'Moon' in 'This text will describe facts and challenges with space travel'

False

In [22]:
'Moon' in 'This text will describe facts about the Moon'

True

Un enfoque para encontrar la posición de una palabra específica en una cadena es usar el método ``.find()``:

In [23]:
temperatures = """Saturn has a daytime temperature of -170 degrees Celsius,
... while Mars has -28 Celsius."""

In [24]:
temperatures.find('Moon')

-1


El método ``.find()`` devuelve ``-1`` aun cuando no se encuentra la palabra o devuelve el índice (el número que representa el lugar en la cadena). Así es como se comportaría si estuvieras buscando la palabra Marte:

In [25]:
temperatures.find('Mars')

64

``68`` es la posición donde aparece en la cadena 'Mars'.

Otra forma de buscar contenido es usar el método ``.count()``, que devuelve el número total de apariciones de una determinada palabra en una cadena:

In [26]:
temperatures.count('Mars')

1

In [27]:
temperatures.count('Moon')

0

Las cadenas en Python distinguen entre mayúsculas y minúsculas, lo que significa que Luna (Moon) y luna (moon) se consideran palabras diferentes. Para realizar una comparación sin distinción de mayúsculas y minúsculas, puedes convertir una cadena en todas las letras minúsculas mediante el método: ``.lower()``.

In [28]:
"The Moon And The Earth".lower()

'the moon and the earth'

Al igual que el método ``.lower()``, las cadenas tienen un método que hace lo contrario ``.upper()``, convirtiendo cada carácter en mayúsculas

In [29]:
'The Moon And The Earth'.upper()

'THE MOON AND THE EARTH'

Cuando buscas y compruebas contenido, un enfoque más sólido es poner en minúsculas una cadena para que el estilo de escritura no impida una coincidencia. Por ejemplo, si estás contando el número de veces que aparece 'la' palabra, el método no contaría las veces en que aparece 'La', aunque ambas sean la misma palabra. Puedes utilizar el método ``.lower()`` para cambiar todos los caracteres a minúsculas.

In [30]:
'The Moon And The Earth'.lower()

'the moon and the earth'

### Comprobar el contenido

Hay ocasiones en las que procesarás texto para extraer información que es irregular en su presentación. Por ejemplo, la siguiente cadena es más sencilla de procesar que un párrafo no estructurado:

In [32]:
temperatures = 'Mars Average Temperature: -60 C'
print(temperatures)

Mars Average Temperature: -60 C


Para extraer la temperatura promedio en Marte (Mars), puedes hacerlo con los siguientes métodos:

In [33]:
parts = temperatures.split(':')
parts

['Mars Average Temperature', ' -60 C']

In [34]:
parts[-1]

' -60 C'

Los métodos anteriores confían ciegamente en que todo lo que está después de los ``dos puntos (:)`` es una temperatura. La cadena se divide en cuanto encuentra ``:``, lo que produce una lista de dos elementos. Usando ``[-1]`` en la lista devuelve el último elemento, que es la temperatura en este ejemplo.

Si el texto es irregular, no puedes usar los mismos métodos de división para obtener el valor. Debes iterar por todos los elementos y comprobar si los valores son de un tipo determinado. Python tiene métodos que ayudan a comprobar el tipo de cadena:

In [36]:
>>> mars_temperature = 'The highest temperature on Mars is about 30 C'
for item in mars_temperature.split():
    if item.isnumeric():
        print(item)

30


Al igual que el método ``.isnumeric()``, puedes comprobar si hay cadenas que se parezcan a decimales ``.isdecimal()``

*Dato: Podría ser sorprendente saber que ``"-70".isnumeric()`` regresa ``False``. Esto se debe a que todos los caracteres de la cadena tendrían que ser numéricos y el guión ``(-)`` no es numérico. Si necesitas comprobar los números negativos en una cadena, el método ``.isnumeric()`` no funcionaría.*

Hay validaciones adicionales que puedes aplicar en cadenas para comprobar si hay valores. Para los números negativos, el guión está prefijado al número, y eso se puede detectar con el método: ``.startswith()``.

In [37]:
'-60'.startswith('-')

True

Del mismo modo, el método ``.endswith()`` ayuda a verificar el último carácter de una cadena:

In [38]:
if "30 C".endswith("C"):
    print("This temperature is in Celsius")

This temperature is in Celsius


### Transformar texto

Hay otros métodos que ayudan en situaciones en las que el texto necesita ser transformado en otra cosa.

Hasta ahora, hemos visto cadenas que pueden usar ``C`` para Celsius y ``F`` para Fahrenheit. Puedes utilizar el método ``.replace()`` para buscar y reemplazar apariciones de un carácter o grupo de caracteres:

In [39]:
'Saturn has a daytime temperature of -170 degrees Celsius, while Mars has -28 Celsius.'.replace('Celsius', 'C')

'Saturn has a daytime temperature of -170 degrees C, while Mars has -28 C.'

Como se mencionó anteriormente, ``.lower()`` es una buena manera de normalizar el texto para hacer una búsqueda sin distinción de mayúsculas y minúsculas. Revisemos rápidamente si algún texto distingue las temperaturas:

In [40]:
text = 'Temperatures on the Moon can vary wildly.'
'temperatures' in text

False

In [41]:
'temperatures' in text.lower()

True

Es posible que no necesites hacer una verificación que no distinga entre mayúsculas y minúsculas todo el tiempo, pero estandarizar cada letra es un buen enfoque cuando el texto utiliza un estilo de escritura mixto.
Después de dividir el texto y realizar las transformaciones, es posible que debas volver a juntar todas las partes. Así como el método ``.split()`` puede separar caracteres, el método ``.join()`` puede volver a unirlos.

El método ``.join()`` requiere un iterable (como una lista de Python) como argumento, por lo que su uso se ve diferente de otros métodos de cadena:

In [42]:
moon_facts = ['The Moon is drifting away from the Earth.', 'On average, the Moon is moving about 4cm every year']
'\n'.join(moon_facts)

'The Moon is drifting away from the Earth.\nOn average, the Moon is moving about 4cm every year'


En este ejemplo, el carácter salto de línea ``'\n'`` (retorno de carro, newline) se utiliza para unir todos los elementos de la lista.