# Cadenas de texto

Utilizamos las cadenas de texto (STRing) para almacenar texto y es uno de los tipos básicos de objetos de los que Python dispone.
Crear una cadena de texto es muy sencillo, basta con escribir un texto entre comillas simples, dobles o triples.

In [1]:
'Monty'

'Monty'

In [2]:
"Python"

'Python'

In [3]:
"""42"""

'42'

Las comillas simples y dobles son completamente equivalentes mientras que las triples nos permiten introducir cadenas de texto que incluyan saltos de línea.

In [4]:
'''The life of Brian,
a movie by the Monty Python'''

'The life of Brian,\na movie by the Monty Python'

Otro modo de crear una cadena de texto a partir de cualquier tipo de variable es utilizar la función str(). Por ejemplo, imaginemos que queremos transformar un entero en texto.

In [5]:
str(42)

'42'

## Métodos de las cadenas de texto

Las cadenas de texto, como cualquier otro tipo en Python, son [objetos](https://es.wikipedia.org/wiki/Objeto_(programaci%C3%B3n)) y disponen de una rica funcionalidad implementada en sus [métodos](https://es.wikipedia.org/wiki/M%C3%A9todo_(inform%C3%A1tica)).
Puedes acceder a toda la información sobre los métodos disponibles en los objetos str mediante la función help.

In [27]:
', '.join([method for method in dir(str) if not method.startswith('_')])

'capitalize, casefold, center, count, encode, endswith, expandtabs, find, format, format_map, index, isalnum, isalpha, isdecimal, isdigit, isidentifier, islower, isnumeric, isprintable, isspace, istitle, isupper, join, ljust, lower, lstrip, maketrans, partition, replace, rfind, rindex, rjust, rpartition, rsplit, rstrip, split, splitlines, startswith, strip, swapcase, title, translate, upper, zfill'

### Métodos más relevantes

In [19]:
len('Monty')

5

In [7]:
' ATGC '.strip()

'ATGC'

In [8]:
help(str.strip)

Help on method_descriptor:

strip(...)
    S.strip([chars]) -> str
    
    Return a copy of the string S with leading and trailing
    whitespace removed.
    If chars is given and not None, remove characters in chars instead.



In [9]:
'GATA'.count('A')

2

In [10]:
help(str.count)

Help on method_descriptor:

count(...)
    S.count(sub[, start[, end]]) -> int
    
    Return the number of non-overlapping occurrences of substring sub in
    string S[start:end].  Optional arguments start and end are
    interpreted as in slice notation.



In [11]:
'GATA'.lower()

'gata'

In [12]:
'gata'.upper()

'GATA'

In [13]:
'GATC'.replace('C', 'A')

'GATA'

In [14]:
help(str.replace)

Help on method_descriptor:

replace(...)
    S.replace(old, new[, count]) -> str
    
    Return a copy of S with all occurrences of substring
    old replaced by new.  If the optional argument count is
    given, only the first count occurrences are replaced.



In [15]:
'GATA'.find('T')

2

In [16]:
'GATA'.find('A')

1

In [17]:
'GATA'.find('O')

-1

In [18]:
help(str.find)

Help on method_descriptor:

find(...)
    S.find(sub[, start[, end]]) -> int
    
    Return the lowest index in S where substring sub is found,
    such that sub is contained within S[start:end].  Optional
    arguments start and end are interpreted as in slice notation.
    
    Return -1 on failure.



In [20]:
'Monty Python'.split()

['Monty', 'Python']

In [21]:
help(str.split)

Help on method_descriptor:

split(...)
    S.split(sep=None, maxsplit=-1) -> list of strings
    
    Return a list of the words in S, using sep as the
    delimiter string.  If maxsplit is given, at most maxsplit
    splits are done. If sep is not specified or is None, any
    whitespace string is a separator and empty strings are
    removed from the result.



In [22]:
'Monty' + 'Python'

'MontyPython'

In [23]:
','.join(['Monty', 'Python'])

'Monty,Python'

## Secuenciales e inmutables

Las cadenas de texto son una secuencia de carácteres (0, 1 o varios caracteres) y, como cualquier otro [tipo secuencial](https://docs.python.org/3.6/library/stdtypes.html#typesseq), podemos obtener subcadenas utilizando índices.

In [30]:
texto = 'Monty Python'
print('0', texto[0])
print('0:3', texto[0:3])
print('None:3', texto[:3])
print('2:4', texto[2:4])
print('-1', texto[-1])
print('-2:None', texto[-2:])

0 M
0:3 Mon
None:3 Mon
2:4 nt
-1 n
-2:None on


Las cadenas de texto en Python son [inmutables](https://es.wikipedia.org/wiki/Objeto_inmutable), una vez creadas no pueden ser modificadas.
Como hemos visto podemos utilizar sus métodos para obtener nuevas cadenas modificadas a partir de la original, pero la original siempre quedará inalterada.

In [31]:
texto = 'gato'
texto2 = texto.replace('o', 'a')
print(texto)
print(texto2)

gato
gata


## Formateo de cadenas de texto

Python ha ido incorporando a lo largo del tiempo distintos métodos para formatear cadenas de texto a partir de variables.
El método más antiguo es equivalente al [printf](https://docs.python.org/3.6/library/stdtypes.html#old-string-formatting) de otros lenguajes y se invoca utilizando el operador %.

In [39]:
'La suma de 1 + 2 es %d' % (1 + 2)

'La suma de 1 + 2 es 3'

Alternativamente se puede utilizar el método [format](https://docs.python.org/3.6/library/stdtypes.html#str.format) que tiene su propia sintaxis.

In [35]:
"La suma de 1 + 2 es {0}".format(1+2)

'La suma de 1 + 2 es 3'

Pero tal vez el método más cómodo sean las nuevas f-strings (a partir de Python 3.6) que permiten utilizar las variables definidas en el presente ámbito.

In [36]:
suma = 1 + 2
f'La suma de 1 + 2 es {suma}'

'La suma de 1 + 2 es 3'