## Cadenas

En Python parecen ser simples y directas, hay cierta complejidad en las reglas de cadena que es importante comprender. Conocer las reglas le ayuda a evitar ser sorprendido por el comportamiento de las cadenas cuando modifica valores o da formato al texto.

### Inmutabilidad de las cadenas

Es decir, no pueden cambiar 

In [4]:
fact = 'La luna no tiene atmosfera.'
fact + 'No se puede escuchar ningun sonido en la luna.'

fact

'La luna no tiene atmosfera.No sound can be heard on the Moon.'

El truco aquí es que debes usar un valor devuelto. Cuando agregas cadenas, Python no modifica ninguna cadena, pero devuelve una nueva cadena como resultado. Para mantener este nuevo resultado, asígnelo a una nueva variable:

In [5]:
two_facts = fact + 'No sound can be heard on the Moon.'
two_facts

'La luna no tiene atmosfera.No sound can be heard on the Moon.'

### Uso de comillas

Puedes incluir cadenas de Python entre comillas simples, dobles o triples. Aunque puedes usarlos indistintamente, es mejor usar un tipo de manera consistente dentro de un proyecto. Por ejemplo, la siguiente cadena utiliza comillas dobles

cuando una cadena contiene palabras, números o caracteres especiales (una subcadena) que también están entre comillas, debes usar un estilo diferente. Por ejemplo, si una subcadena utiliza comillas dobles, encierra toda la cadena entre comillas simples,

In [7]:
moon_radius = "The Moon has a radius of 1,080 miles"
'The "near side" is the part of the Moon that faces the Earth'

'The "near side" is the part of the Moon that faces the Earth'

Del mismo modo, si hay comillas simples (o un apóstrofo, como en Moon en el siguiente ejemplo) en cualquier lugar dentro de la cadena, encierra toda la cadena entre comillas dobles


In [None]:
"We only see about 60% of the Moon's surface"

Cuando el texto tiene una combinación de comillas simples y dobles, puedes utilizar comillas triples para evitar problemas con el intérprete:

In [None]:
"""We only see about 60% of the Moon's surface, this is known as the "near side"."""

### Texto multilínea

Hay algunas maneras diferentes de definir varias líneas de texto como una sola variable. Las formas más comunes son:

    Utiliza un carácter de nueva línea ().\n
    Utiliza comillas triples (""")..
    Los caracteres de nueva línea separan el texto en varias líneas al imprimir la salida:


In [8]:
multiline = "Facts about the Moon:\n There is no atmosphere.\n There is no sound."
print(multiline)

Facts about the Moon:
 There is no atmosphere.
 There is no sound.


In [9]:
multiline = """Facts about the Moon:
...  There is no atmosphere.
...  There is no sound."""
print(multiline)

Facts about the Moon:
 There is no atmosphere.
 There is no sound.


### Métodos string en Python

Python incluye varios métodos de cadena que están diseñados para realizar las transformaciones más comunes y útiles. Los métodos de cadena forman parte del tipo str. Esto significa que los métodos existen como variables de cadena o parte de la cadena directamente.

In [10]:
'temperatures and facts about the moon'.title()

'Temperatures And Facts About The Moon'

In [11]:
heading = 'temperatures and facts about the moon'
heading.title()

'Temperatures And Facts About The Moon'

### Dividir una cadena

Un método de cadena común es .split() . Sin argumentos, el método separará la cadena en cada espacio. Esto crearía una lista de cada palabra o número que está separado por un espacio

In [12]:
temperatures = '''Daylight: 260 F
... Nighttime: -280 F'''
temperatures .split()

['Daylight:', '260', 'F', 'Nighttime:', '-280', 'F']

In [13]:
#el carácter de nueva línea (implícito) se puede utilizar para dividir la cadena al final de cada línea, 
# creando líneas individuales
temperatures .split('\n')

['Daylight: 260 F', 'Nighttime: -280 F']

### Buscar una cadena

Un enfoque para encontrar la posición de una palabra específica en una cadena es usar el método .find()

In [15]:
temperatures = """Saturn has a daytime temperature of -170 degrees Celsius,
... while Mars has -28 Celsius."""

temperatures.find('Moon')

temperatures.find('Mars')

64

Otra forma de buscar contenido es usar el método .count(), que devuelve el número total de apariciones de una determinada palabra en una cadena

In [16]:
temperatures.count('Mars')

1

Las cadenas en Python distinguen entre mayúsculas y minúsculas, lo que significa que Luna (Moon) y luna (moon) se consideran palabras diferentes. Para realizar una comparación sin distinción de mayúsculas y minúsculas, puedes convertir una cadena en todas las letras minúsculas mediante el método: .lower()

In [17]:
"The Moon And The Earth".lower()

'the moon and the earth'

Al igual que el método .lower(), las cadenas tienen un método que hace lo contrario .upper(), convirtiendo cada carácter en mayúsculas

In [18]:
'The Moon And The Earth'.upper()

'THE MOON AND THE EARTH'

### Comprobar el contenido

Hay ocasiones en las que procesarás texto para extraer información que es irregular en su presentación. Por ejemplo, la siguiente cadena es más sencilla de procesar que un párrafo no estructurado.

Los métodos siguientes confían ciegamente en que todo lo que está después de los dos puntos (:) es una temperatura. La cadena se divide en cuanto encuentra :, lo que produce una lista de dos elementos. Usando [-1] en la lista devuelve el último elemento, que es la temperatura

In [20]:
temperatures = 'Mars Average Temperature: -60 C'
#Para extraer la temperatura promedio en Marte (Mars)
parts = temperatures.split(':')
parts
parts[-1]

' -60 C'

Si el texto es irregular, no puedes usar los mismos métodos de división para obtener el valor. Debes iterar por todos los elementos y comprobar si los valores son de un tipo determinado. Python tiene métodos que ayudan a comprobar el tipo de caden

In [21]:
mars_temperature = 'The highest temperature on Mars is about 30 C'

for item in mars_temperature.split():
    if item.isnumeric():
        print(item)


30


Al igual que el método .isnumeric(), puedes comprobar si hay cadenas que se parezcan a decimales .isdecimal()

Dato: Podría ser sorprendente saber que "-70".isnumeric() regresa False. Esto se debe a que todos los caracteres de la cadena tendrían que ser numéricos y el guión (-) no es numérico. Si necesitas comprobar los números negativos en una cadena, el método .isnumeric() no funcionaría.

In [22]:
#Hay validaciones adicionales que puedes aplicar en cadenas para comprobar si hay valores. 
# Para los números negativos, el guión está prefijado al número, y eso se puede detectar con el método: 
# .startswith()

'-60'.startswith('-')

True

Del mismo modo, el método .endswith() ayuda a verificar el último carácter de una cadena

In [23]:
if "30 C".endswith("C"):
    print("This temperature is in Celsius")


This temperature is in Celsius


### Transformar texto

Puedes utilizar el método .replace() para buscar y reemplazar apariciones de un carácter o grupo de caracteres

In [24]:
'Saturn has a daytime temperature of -170 degrees Celsius, while Mars has -28 Celsius.'.replace('Celsius', 'C')

'Saturn has a daytime temperature of -170 degrees C, while Mars has -28 C.'

In [25]:
text = 'Temperatures on the Moon can vary wildly.'
'temperatures' in text

False

In [26]:
'temperatures' in text.lower()

True

Después de dividir el texto y realizar las transformaciones, es posible que debas volver a juntar todas las partes. Así como el método .split() puede separar caracteres, el método .join() puede volver a unirlos.

El método .join() requiere un iterable (como una lista de Python) como argumento, por lo que su uso se ve diferente de otros métodos de cadena:

In [27]:
#En este ejemplo, el carácter salto de línea '\n' (retorno de carro, newline) 
# se utiliza para unir todos los elementos de la lista.
moon_facts = ['The Moon is drifting away from the Earth.', 'On average, the Moon is moving about 4cm every year']
'\n'.join(moon_facts)

'The Moon is drifting away from the Earth.\nOn average, the Moon is moving about 4cm every year'

### Formato de cadenas en Python

Formato con signo de porcentaje El marcador de posición es %s, y la variable se pasa al texto después del carácter % fuera de la cadena.

In [28]:
mass_percentage = '1/6'
print('On the Moon, you would weigh about %s of your weight on Earth' % mass_percentage)

On the Moon, you would weigh about 1/6 of your weight on Earth


múltiples valores cambia la sintaxis, ya que requiere paréntesis para rodear las variables que se pasan

In [29]:
print("""Both sides of the %s get the same amount of sunlight,
    but only one side is seen from %s because
    the %s rotates around its own axis when it orbits %s.""" % ('Moon', 'Earth', 'Moon', 'Earth'))

Both sides of the Moon get the same amount of sunlight,
    but only one side is seen from Earth because
    the Moon rotates around its own axis when it orbits Earth.


El método .format()utiliza llaves ({}) como marcadores de posición dentro de una cadena y utiliza la asignación de variables para reemplazar el texto.

In [30]:
mass_percentage = '1/6'
print('On the Moon, you would weigh about {} of your weight on Earth'.format(mass_percentage))

On the Moon, you would weigh about 1/6 of your weight on Earth


No es necesario asignar variables repetidas varias veces, lo que lo hace menos detallado porque se deben asignar menos variables:

In [31]:
print("""You are lighter on the {0}, because on the {0} 
... you would weigh about {1} of your weight on Earth""".format("Moon", mass_percentage))

You are lighter on the Moon, because on the Moon 
you would weigh about 1/6 of your weight on Earth


Si queremos usar en el primer argumento {0} (índice de cero) en este caso Moon{0} sería con el método .format(). Para la repetición simple {0} funciona bien, pero reduce la legibilidad. Para mejorar la legibilidad, utilizamos argumentos de palabras clave en .format()

In [32]:
print("""You are lighter on the {moon}, because on the {moon} 
... you would weigh about {mass} of your weight on Earth""".format(moon="Moon", mass=mass_percentage))

You are lighter on the Moon, because on the Moon 
you would weigh about 1/6 of your weight on Earth


### Acerca de las cadenas con f

A partir de la versión 3.6 de Python, es posible usar f-strings. Estas cadenas parecen plantillas con las mismas variables con nombre que las del código. El uso de cadenas f en el ejemplo anterior se vería así:

In [33]:
#Las variables van dentro de llaves y la cadena debe usar el prefijo f
print(f'On the Moon, you would weigh about {mass_percentage} of your weight on Earth')

On the Moon, you would weigh about 1/6 of your weight on Earth


Las cadenas f son menos detalladas que cualquier otra opción de formato, es posible usar expresiones dentro de las llaves. Estas expresiones pueden ser funciones u operaciones directas.

In [34]:
#si deseas representar el valor 1/6 como un porcentaje con un decimal, puede utilizar la función round() 
round(100/6, 1)

16.7

In [35]:
#Con las cadenas f, no es necesario asignar un valor a una variable de antemano
print(f'On the Moon, you would weigh about {round(100/6, 1)}% of your weight on Earth')

On the Moon, you would weigh about 16.7% of your weight on Earth


In [36]:
#El uso de una expresión no requiere una llamada a una función. 
#Cualquiera de los métodos de cadena también son válidos. 
#Por ejemplo, la cadena podría imponer un estilo de escritura específico para crear un título:
subject = 'interesting facts about the moon'
f'{subject.title()}'

'Interesting Facts About The Moon'