# Métodos de cadena en Python

Los métodos de cadena son uno de los tipos de método más comunes en Python. A menudo tendrá que manipular cadenas para extraer información o ajustarse a un formato concreto. Python incluye varios métodos de cadena diseñados para realizar las transformaciones más comunes y útiles.

Los métodos de cadena forman parte del tipo str. Esto significa que los métodos existen como variables de cadena o directamente como parte de la cadena. Por ejemplo, el método .title() se puede usar directamente con una cadena:

In [11]:
cabecera = "temperatures and facts about the moon".title() #Primer caracter en mayúscula
print(cabecera)

#Otta forma de usar el método .title()
heading = "temperatures and facts about the moon"
heading.title()
print(heading.title())


Temperatures And Facts About The Moon
Temperatures And Facts About The Moon


# División de una cadena
Un método de cadena común es .split(). Sin argumentos, el método separará la cadena en cada espacio. Esto crearía una lista de todas las palabras o números separados por un espacio:

In [16]:
temperatures = """Daylight: 260 F
... Nighttime: -280 F"""

print(temperatures.split())


['Daylight:', '260', 'F', 'Nighttime:', '-280', 'F']


En este ejemplo, trabaja con varias líneas, por lo que el carácter de nueva línea (implícito) se puede usar para dividir la cadena al final de cada línea, y crear líneas únicas:

In [17]:
temperatures.split('\n')
print(temperatures)

Daylight: 260 F
Nighttime: -280 F


Este tipo de división resulta útil cuando se necesita un bucle para procesar o extraer información, o bien cuando se cargan datos desde un archivo de texto.

## Búsqueda de una cadena
Algunos métodos de cadena pueden buscar contenido antes del procesamiento, sin necesidad de usar un bucle. Imagine que tiene dos oraciones que analizan las temperaturas de varios planetas y lunas, pero solo le interesan las temperaturas relacionadas con la Luna. Es decir, si las oraciones no se refieren a la Luna, no se deben procesar para extraer información.

La manera más sencilla de detectar si existe una palabra, un carácter o un grupo de caracteres determinados en una cadena es usar el operador in:

In [23]:
"Moon" in "This text will describe facts and challenges with space travel"

"Moon" in "This text will describe facts about the Moon"


True

In [26]:
# Un enfoque para buscar la posición de una palabra específica en una cadena consiste en usar el método .find():
temperatures = """Saturn has a daytime temperature of -170 degrees Celsius,
... while Mars has -28 Celsius."""
temperatures.find("Moon")


-1

El método .find() devuelve -1 cuando no se encuentra la palabra, o bien devuelve el índice (el número que representa la posición en la cadena). Así es como se comportaría si busca la palabra Mars:

In [27]:
# Un enfoque para buscar la posición de una palabra específica en una cadena consiste en usar el método .find():
temperatures = """Saturn has a daytime temperature of -170 degrees Celsius,
... while Mars has -28 Celsius."""
temperatures.find("Mars")

68

68 es la posición donde "Mars" aparece en la cadena.

Otra manera de buscar contenido consiste en usar el método .count(), que devuelve el número total de repeticiones de una palabra determinada en una cadena:

In [32]:
temperatures.count("Moon")


0

In [33]:
temperatures.count("Mars")

1

Las cadenas en Python distinguen mayúsculas de minúsculas, lo que significa que Luna y luna se consideran palabras diferentes. Para realizar una comparación sin distinguir mayúsculas de minúsculas, puede convertir una cadena en letras minúsculas mediante el método .lower():

In [36]:
"The Moon And The Earth".lower()

'the moon and the earth'

In [37]:
"The Moon And The Earth".upper()

'THE MOON AND THE EARTH'

 Sugerencia

Al buscar y comprobar contenido, un enfoque más sólido consiste es convertir en minúsculas una cadena para que el uso de mayúsculas y minúsculas no impida una coincidencia. Por ejemplo, si va a contar el número de veces que aparece la palabra the, el método no contaría las veces en las que aparece The, aunque las dos sean la misma palabra. Puede usar el método .lower() para cambiar todos los caracteres a minúsculas.

# Comprobación del contenido
Hay ocasiones en las que procesará texto para extraer información con una presentación irregular. Por ejemplo, la cadena siguiente es más fácil de procesar que un párrafo no estructurado:

In [7]:
temperatures = "Temperatura promedio de Marte: -60 C"

# Para extraer la temperatura media en Marte, puede hacerlo con los métodos siguientes:

partes = temperatures.split(":")
print(partes)
partes[1]

['Temperatura promedio de Marte', ' -60 C']


' -60 C'

El código anterior confía en que todo lo que hay después de los dos puntos (:) es una temperatura. La cadena se divide en :, lo que genera una lista de dos elementos. El uso de [-1] en la lista devuelve el último elemento que, en este ejemplo, es la temperatura.

Si el texto es irregular, no puede usar los mismos métodos de división para obtener el valor. Debe recorrer en bucle los elementos y comprobar si los valores son de un tipo determinado. Python tiene métodos que ayudan a comprobar el tipo de cadena:

In [8]:
mars_temperature = "La temperatura más alta de marte es cerca de 30 C"
for item in mars_temperature.split():
    if item.isnumeric():
        print(item)

30


Como sucede con el método .isnumeric(), .isdecimal() puede buscar cadenas que parezcan decimales.

Le sorprenderá saber que "-70".isnumeric() devolverá False. Esto se debe a que todos los caracteres de la cadena tendrían que ser numéricos y el guión (-) no lo es. Si tiene que comprobar números negativos en una cadena, el método .isnumeric() no funcionará.

Hay validaciones adicionales que puede aplicar en las cadenas para comprobar si hay valores. En el caso de los números negativos, el guion se agrega como prefijo al número y se puede detectar con el método .startswith():

In [12]:
mars_temperature = "La temperatura más baja de marte es cerca de -60 C"
for item in mars_temperature.split():
    if item.startswith("-"):
        print(item)

-60


De forma similar, el método .endswith() ayuda a comprobar el último carácter de una cadena:

In [17]:
mars_temperature = "La temperatura más baja de marte es de 60 C".lower()
if mars_temperature.endswith("c"):
    print("Esta temperatura está en celsius")

Esta temperatura está en celsius


# Transformar texto

Hay otros métodos que ayudan en situaciones en las que el texto se debe transformar en algo distinto. Hasta ahora, ha visto cadenas que pueden usar C para Celsius y F para Fahrenheit. Puede usar el método .replace() para buscar y reemplazar repeticiones de un carácter o grupo de caracteres:

In [20]:
text = "Saturn has a daytime temperature of -170 degrees Celsius, while Mars has -28 Celsius."
text.replace("Celsius", "C")


'Saturn has a daytime temperature of -170 degrees C, while Mars has -28 C.'

Como se ha mencionado antes, .lower() es una buena manera de normalizar el texto para realizar una búsqueda sin distinguir mayúsculas de minúsculas. Ahora se comprobará rápidamente si algún texto analiza las temperaturas:

In [21]:
text = "Temperatures on the Moon can vary wildly."
"temperatures" in text

False

In [22]:
"temperatures" in text.lower()


True

Es posible que no tenga que realizar la comprobación sin distinguir mayúsculas de minúsculas todo el tiempo, pero convertir en minúsculas todas las letras es un buen enfoque cuando en el texto se usa una mezcla de mayúsculas y minúsculas.

Después de dividir el texto y realizar las transformaciones, es posible que tenga que volver a ensamblar todas las piezas. Al igual que el método .split() puede separar caracteres, el método .join() puede volver a agruparlos.

El método .join() necesita un elemento iterable (como una lista de Python) como argumento, por lo que su uso es diferente al de otros métodos de cadena:

In [28]:
moon_facts = ["The Moon is drifting away from the Earth." , "On average, the Moon is moving about 4cm every year."]
"\n".join(moon_facts)


'The Moon is drifting away from the Earth.\nOn average, the Moon is moving about 4cm every year.'

# Ejercicio: Transformación de texto mediante métodos de cadena


Ejercicio: Transformar cadenas
Hay varias operaciones que puede realizar en cadenas cuando las manipula. En este ejercicio, utilizará métodos de cadena para modificar texto con datos sobre la Luna y luego extraerá información para crear un breve resumen.

Este ejercicio se divide en una serie de pasos. Para cada paso, se le presentará el objetivo del paso, seguido de una celda vacía. Ingrese su Python en la celda y ejecútelo. La solución para cada paso seguirá a cada celda.

Análisis de datos interesantes sobre la luna
Comience almacenando el siguiente párrafo en una variable llamada text:

Interesting facts about the Moon. The Moon is Earth's only satellite. There are several interesting facts about the Moon and how it affects life here on Earth. 
On average, the Moon moves 4cm away from the Earth every year. This yearly drift is not significant enough to cause immediate effects on Earth. The highest daylight temperature of the Moon is 127 C.

In [29]:
text = """ Interesting facts about the Moon. The Moon is Earth's only satellite. There are several interesting facts about the Moon and how it affects life here on Earth. 
On average, the Moon moves 4cm away from the Earth every year. This yearly drift is not significant enough to cause immediate effects on Earth. The highest daylight temperature of the Moon is 127 C. """

Separar el párrafo en oraciones.
En inglés cada oración termina con un punto. Usará esto para dividir el párrafo en oraciones diferenciadas. Usar el splitmétodo para dividir el texto en oraciones buscando la cadena .(un punto seguido de un espacio). Almacene el resultado en una variable llamada sentences. Imprime el resultado.

In [30]:
separate = text.lower()
separate_for_point = separate.split('.')
print(separate_for_point)

[' interesting facts about the moon', " the moon is earth's only satellite", ' there are several interesting facts about the moon and how it affects life here on earth', ' \non average, the moon moves 4cm away from the earth every year', ' this yearly drift is not significant enough to cause immediate effects on earth', ' the highest daylight temperature of the moon is 127 c', ' ']


# Buscar palabras clave
Terminará su programa agregando el código para encontrar oraciones que mencionen la temperatura. Agregue código para recorrer la sentencesvariable. Para cada oración, busque la palabra temperature. Si encuentra la palabra, imprima la oración.

In [31]:
for item in separate_for_point:
    if "moon" in item:
        print(item)

 interesting facts about the moon
 the moon is earth's only satellite
 there are several interesting facts about the moon and how it affects life here on earth
 
on average, the moon moves 4cm away from the earth every year
 the highest daylight temperature of the moon is 127 c
