# Strings

Además de números, Python puede manipular cadenas de caracteres de varias maneras. Pueden estar entre comillas simples ('...') o dobles ("...") con el mismo resultado. La \ se usa como caracter de escape.

In [1]:
'spam eggs'  # single quotes

'spam eggs'

In [2]:
'doesn\'t'  # use \' to escape the single quote...

"doesn't"

In [3]:
"doesn't"  # ...or use double quotes instead

"doesn't"

In [4]:
'"Yes," they said.'

'"Yes," they said.'

In [5]:
"\"Yes,\" they said."

'"Yes," they said.'

In [6]:
'"Isn\'t," they said.'

'"Isn\'t," they said.'

En el intérprete interactivo, la cadena de salida se muestra entre comillas, los caracteres especiales se "escapan" con \\. A pesar de que puede a veces tener una diferente apariencia que la entrada las dos cadenas son equivalentes. La cadena se muestra entre comillas dobles si contiene comillas simples y viceversa. La función print() produce una salida más legible omitiendo las comillas y mostrando los caracteres especiales: 

In [7]:
'"Isn\'t," they said.'

'"Isn\'t," they said.'

In [8]:
print('"Isn\'t," they said.')

"Isn't," they said.


In [6]:
s = 'First line.\nSecond line.'  # \n means newline
s  # without print(), \n is included in the output

'First line.\nSecond line.'

In [7]:
print(s)  # with print(), \n produces a new line

First line.
Second line.


Si no se desea que los caracteres antecedidos de \ se interpreten como caracteres especiales, se pueden usar cadenas en crudo agregando una r antes de las primeras comillas.

In [8]:
print('C:\some\name')  # here \n means newline!

C:\some
ame


In [9]:
print(r'C:\some\name')  # note the r before the quote

C:\some\name


Las cadenas literales pueden expandir múltiples líneas. 
Una forma es usando triples comillas: """...""" or '''...'''.''''
Los finales de líneas se incluyen automáticamente en la cadena, pero es posible evitar esto agregando una \ al final de la línea. Ejemplo:

In [10]:
print("""\
Usage: thingy [OPTIONS]
     -h                        Display this usage message
     -H hostname               Hostname to connect to
""")

Usage: thingy [OPTIONS]
     -h                        Display this usage message
     -H hostname               Hostname to connect to



Se pueden concatenar cadenas con el operador + y se pueden repetir con *:

In [11]:
# 3 times 'un', followed by 'ium'
3 * 'un' + 'ium'

'unununium'

Dos o más cadenas literales yuxtapuestas se concatenan automáticamente.

In [12]:
'Py' 'thon'

'Python'

Esto es particularmente útil para romper cadenas largas

In [13]:
text = ('Put several strings within parentheses '
...         'to have them joined together.')
text

'Put several strings within parentheses to have them joined together.'

Esto solo funciona con literales, no con variables ni expresiones

In [14]:
prefix = 'Py'
prefix 'thon'  # can't concatenate a variable and a string literal

SyntaxError: invalid syntax (<ipython-input-14-20527b549823>, line 2)

In [15]:
('un' * 3) 'ium'

SyntaxError: invalid syntax (<ipython-input-15-f4764cbe42a8>, line 1)

Para concatenar variables o variables y literales se usa +

In [16]:
prefix = 'Py'
prefix + 'thon'

'Python'

Las cadenas se pueden indexar, el primer caracter tiene el índice 0. No hay un caracter separador; un caracter es, simplemente, una cadena de largo 1.

In [17]:
word = 'Python'
word[0]  # character in position 0

'P'

In [18]:
word[5]  # character in position 5

'n'

Los índices pueden ser números negativos, empezando a contar desde la derecha. 

In [19]:
word[-1]  # last character

'n'

In [20]:
word[-2]  # second-last character

'o'

In [21]:
word[-6]

'P'

Los índices negativos arrancan desde -1. Además de indexar, también se puede hacer slicing para obtener subcadenas.

In [22]:
word[0:2]  # characters from position 0 (included) to 2 (excluded)

'Py'

In [23]:
word[2:5]  # characters from position 2 (included) to 5 (excluded)

'tho'

El comienzo siempre está incluido y el final, excluido. Eso asegura que s[:i] + s[i:] es siempre igual a s:

In [24]:
word[:2] + word[2:]

'Python'

In [25]:
word[:4] + word[4:]

'Python'

Los índices de slice tienen valores por defecto útiles; un índice inicial omitido por defecto es cero, un segundo índice por defecto es el tamaño de la cadena.

In [26]:
word[:2]   # character from the beginning to position 2 (excluded)

'Py'

In [27]:
word[4:]   # characters from position 4 (included) to the end

'on'

In [28]:
word[-2:]  # characters from the second-last (included) to the end

'on'

Una manera de recordar como funciona el slice es pensar en los índices como punteros entre caracteres, con el borde izquierdo del primer caracter numerado con 0. Entonces, el borde derecho del último caracter de una cadena de n caracteres tiene índice n, por ejemplo:

 <img src="Python.jpg"> 

La primera fila de números nos da la posición de los índices 0…6 en la cadena; la segunda fila nos da los índices negativos correspondientes. El slice de i a j consite en todos los caracteres entre los bordes etiquetados como i y j respectivamente.

Para los índices no negativos, la longitud del slice es la diferencia de los índices. Por ejemplo, la longitud de la palabra[1:3] es 2.

Al tratar de usar un índice fuera de rango nos dará un error:

In [29]:
word[42]  # the word only has 6 characters

IndexError: string index out of range

Sin embargo, los índices fuera de rango cuando hacemos slicing son tratados amigablemente:

In [30]:
>>> word[4:42]

'on'

In [31]:
word[42:]

''

Las cadenas no pueden modificarse, son inmutables. Por eso, al pretender asignar algo a una posición indexada de una cadena arroja un error:

In [32]:
word[0] = 'J'

TypeError: 'str' object does not support item assignment

In [33]:
word[2:] = 'py'

TypeError: 'str' object does not support item assignment

Si se necesita una cadena diferente hay que crearla:

In [34]:
'J' + word[1:]

'Jython'

In [35]:
word[:2] + 'py'

'Pypy'

<img src="Strings.jpg"> 

https://docs.python.org/3/library/stdtypes.html#textseq
https://docs.python.org/3/library/stdtypes.html#string-methods
https://docs.python.org/3/reference/lexical_analysis.html#f-strings
https://docs.python.org/3/library/string.html#formatstrings
https://docs.python.org/3/library/stdtypes.html#old-string-formatting