# Manipulación de strings

**Autor:** Roberto Muñoz <br />
**E-mail:** <rmunoz@metricarts.com> <br />
**Github:** <https://github.com/rpmunoz> <br />


## 1. Creación de strings

Python soporta de manera nativa las cadenas de caractéres o strings. Pueden estar encerradas en comillas simples (`'...'`) o dobles (`"..."`) con el mismo resultado. `\` puede ser usado para escapar comillas:



In [None]:
'huevos y pan'  # comillas simples

In [None]:
'doesn\'t'  # usa \' para escapar comillas simples...

In [None]:
"doesn't"  # o podemos usar comillas dobles

In [None]:
'"Si," le dijo.'

In [None]:
"\"Si,\" le dijo."

In [None]:
'"Isn\'t," she said.'

En el intéprete interactivo, la salida de cadenas está encerrada en comillas y los caracteres especiales son escapados con barras invertidas. Aunque esto a veces luzca diferente de la entrada (las comillas que encierran pueden cambiar), las dos cadenas son equivalentes. La cadena se encierra en comillas dobles si la cadena contiene una comilla simple y ninguna doble, de lo contrario es encerrada en comillas simples.

La función `print()` produce una salida más legible, omitiendo las comillas que la encierran e imprimiendo caracteres especiales y escapados:

In [None]:
'"Isn\'t," she said.'

In [None]:
print('"Isn\'t," she said.')

In [None]:
s = 'Primera línea.\nSegunda línea.'
s  # sin print(), \n es incluído en la salida

In [None]:
print(s)  # con print(), \n produce una nueva línea

Si no quieres que los caracteres antepuestos por \ sean interpretados como caracteres especiales, puedes usar cadenas crudas agregando una r antes de la primera comilla

In [None]:
print('C:\algun\nombre')  # aquí \n significa nueva línea!

In [None]:
print(r'C:\algun\nombre')  # nota la r antes de la comilla

Las cadenas de texto literales pueden contener múltiples líneas. Una forma es usar triple comillas: `"""..."""` o `'''...'''`. Los fin de línea son incluídos automáticamente, pero es posible prevenir esto agregando una \ al final de la línea. Por ejemplo:

In [None]:
print("""\
Uso: algo [OPTIONS]
     -h                        Muestra el mensaje de uso
     -H nombrehost             Nombre del host al cual conectarse
""")

## 2. Operaciones con strings

Las cadenas de texto pueden ser concatenadas (pegadas juntas) con el operador + y repetidas con *

In [None]:
# 3 veces 'un', seguido de 'ium'
3 * 'un' + 'ium'

Dos o más cadenas literales (aquellas encerradas entre comillas) una al lado de la otra son automáticamente concatenadas,

In [None]:
'Py' 'thon'

Esto solo funciona con dos literales, no con variables ni expresiones

In [None]:
prefix = 'Py'

In [None]:
prefix 'thon'  # no se puede concatenar una variable y una cadena literal

In [None]:
('un' * 3) 'ium'

En caso de querer concatenar variables o una variable con un literal, se debe usar `+`

In [None]:
prefix + 'thon'

Esta característica es particularmente útil cuando quieres separar cadenadas largas

In [None]:
texto = ('Pon muchas cadenas dentro de paréntesis '
        'para que ellas sean concatendas.')

texto

## 3. Uso de índices y slices

Las cadenas de texto se pueden indexar (subíndices), el primer carácter de la cadena tiene el índice 0. No hay un tipo de dato para los caracteres; un carácter es simplemente una cadena de longitud uno.

In [None]:
palabra = 'Python'

In [None]:
palabra[0]  # caracter en la posición 0

In [None]:
palabra[5]  # caracter en la posición 5

Los índices pueden ser números negativos, para empezar a contar desde la derecha

In [None]:
palabra[-1]  # último caracter

In [None]:
palabra[-2]  # ante último caracter

Además de los índices, los slices también están soportados. Mientras que los índices son usados para obtener caracteres individuales, los slices te permiten obtener sub-cadenas.

In [None]:
palabra[0:2]  # caracteres desde la posición 0 (incluída) hasta la 2 (excluída)

In [None]:
palabra[2:5]  # caracteres desde la posición 2 (incluída) hasta la 5 (excluída)

Nota como el primero es siempre incluído, y que el último es siempre excluído. Esto asegura que s[:i] + s[i:] siempre sea igual a s:

In [None]:
palabra[:2] + palabra[2:]

In [None]:
palabra[:4] + palabra[4:]

Los índices de los slices tienen valores por defecto útiles; el valor por defecto para el primer índice es cero, el valor por defecto para el segundo índice es la longitud de la cadena a rebanar.

In [None]:
palabra[:2]  # caracteres desde el principio hasta la posición 2 (excluída)

In [None]:
palabra[4:]  # caracterrs desde la posición 4 (incluída) hasta el final

In [None]:
palabra[-2:] # caracteres desde la ante-última (incluída) hasta el final

Intentar usar un índice que es muy grande resultará en un error

In [None]:
palabra[42]  # la palabra solo tiene 6 caracteres

Sin embargo, índices fuera de rango en slices son manejados satisfactoriamente

In [None]:
palabra[4:42]

In [None]:
palabra[42:]

Las cadenas de Python no pueden ser modificadas – son immutables. Por eso, asignar a una posición indexada de la cadena resulta en un error:

In [None]:
palabra[0] = 'J'

In [None]:
palabra[2:] = 'py'

En caso de necesitar de una cadena diferente, deberás crear una nueva

In [None]:
'J' + palabra[1:]

In [None]:
palabra[:2] + 'py'

La función incorporada len() devuelve la longitud de una cadena de texto:

In [None]:
s = 'supercalifrastilisticoespialidoso'
len(s)

## 4. Métodos de clase String

La clase string implementa la mayoría de las secuencias de operacion comúnes y múltiples métodos. Destacan los siguientes métodos,

- `S.count(sub[, start[, end]])`:
Devuelve el número de veces que se encuentra sub en la cadena. Los parámetros opcionales start y end definen una subcadena en la que buscar.

- `S.find(sub[, start[, end]])`: Devuelve la posición en la que se encontró por primera vez sub en la cadena o -1 si no se encontró.

- `S.join(sequence)`: Devuelve una cadena resultante de concatenar las cadenas de la secuencia seq separadas por la cadena sobre la que se llama el método.

- `S.partition(sep)`: Busca el separador sep en la cadena y devuelve una tupla con la subcadena hasta dicho separador, el separador en si, y la subcadena del separador hasta el final de la cadena. Si no se encuentra el separador, la tupla contendrá la cadena en si y dos cadenas vacías.

- `S.replace(old, new[, count])`: Devuelve una cadena en la que se han reemplazado todas las ocurrencias de la cadena old por la cadena new. Si se especifica el parámetro count, este indica el número máximo de ocurrencias a reemplazar.

- `S.split([sep [,maxsplit]])`: Devuelve una lista conteniendo las subcadenas en las que se divide nuestra cadena al dividirlas por el delimitador sep. En el caso de que no se especifique sep, se usan espacios. Si se especifica maxsplit, este indica el número máximo de particiones a realizar.


In [6]:
# Uso del método count

frase="El cielo es de color azul"

sub1="color azul"
sub2="azul"

frase.count(sub1)

1

In [5]:
# Uso del método find

frase.find(sub1)

15

In [4]:
frase[15:]

'color azul'

In [9]:
# Uso del método replace. No es mutador

frase.replace('azul', 'celeste')

'El cielo es de color celeste'

In [10]:
# Uso del método join

x=['1','2','3','4']
y=','.join(x)
y

'1,2,3,4'

In [11]:
#Uso del método split

y.split(',')

['1', '2', '3', '4']

---

# Ejercicios

Realice los siguientes ejercicios. En caso de tener dudas, puede apoyarse con sus compañeros, preguntarle al profesor y hacer búsquedas en internet.

1. Cree una variable x que contenga una lista de números enteros consecutivos entre el 1 y el 50 (es decir 1,2,3,...,49,50). Use la funcion `str()` y sus métodos para crear un string que corresponda a la unión de los valores de la lista x y que se use el símbolo `-` para unir los números (es decir queremos obtener un string tipo  '1-2-3-....-49-50').


2. En el laboratorio usamos una raspberry que interactúa con un dispositivo GSM para recibir y generar llamadas usando la la red de celular. Cada vez que se recibe una llamada, el raspberry recibe las siguiente mensajería contenida en la variable mensaje.

    Escriba un código de python que permita recorrer la lista y que obtenga el número telefónico que aparece justo después de la palabra +CLIP

In [19]:
mensaje = ["", "RING", "", "", "","+CLIP: ""+56 22 3547451"",161,"""",0,"""",0"]
print(mensaje)

['', 'RING', '', '', '', '+CLIP: +56 22 3547451,161,,0,,0']
