# Cadenas de caracteres

- Corresponden al tipo de dato `string` de Python.
- Se escriben encerrando texto entre comillas simples o comillas dobles.
- Para usar las comillas como parte de la cadena puede:
  - Usar la otra opción de comillas para declarar la cadena. Es decir, si uno quiere usar comilla simple en la cadena, declarar la cadena usando comillas dobles, o viceversa.  
  - Preceda la comilla con diagonal invertida.

In [None]:
s = "Usando 'comilla simple' en la cadena"
print(s)
r = 'Usando \'comilla simple\' en la cadena'
print(r)

# Operadores que trabajan con cadenas

- Concatenación: `<str> + <str>`. Une dos cadenas para formar una tercera.
- Repetición: `<str> * <int>`. Repite una cadena una cantidad de veces.


In [None]:
s = 'Hola' + 'mundo'
print(s)
r = 'Hola' * 4
print(r)

**Nota**:
- En Python las cadenas son inmutables, es
decir, una vez almacenadas no se pueden
cambiar.
- Lo operadores `+` y `*` dan como resultado una cadena nueva.

# Operadores de comparación

- Igualdad: `==`
- No igualdad: `!=`
- Orden lexicográfico (como en un diccionario): `<, <=, >, >=`

In [None]:
a = 'alfa'
b = 'Alfa'
c = 'alfas'

if a == b:
  print(a, 'es igual a', b)

if a != c:
  print(a, 'no es igual a', c)

if a < c:
  print(a, 'va primero que', c)

if a > c:
  print(c, 'va primero que', a)

# Indización y subcadenas

- Se pueden hacer referencia a caracteres individuales de una cadena usando índices.
- La notación para manejar índices requiere el uso de corchetes.  
  `str[indice]`
- Los índices empiezan desde cero.

In [None]:
pais = 'Puerto Rico'
print(pais[0])
print(pais[1])
print(pais[2])
print(pais[6])
print(pais[7])

- Se pueden usar índices negativos. Siendo:
  - `str[-1]` el último caracter de la cadena.
  - `str[-2]` el penúltimo caracter de la cadena.  
  ...


In [None]:
print(pais[-1])
print(pais[-2])

- La notación de índices soporta rangos. Un rango devuelve una subcadena o porción de la cadena original (*slicing*).  
  `str[n:m]` devuelve la subcadena que va desde el índice `n` hasta `m-1`.
- Omitir `n` o `m` en la notación se entiende como *desde el principio* o *hasta el final* respectivamente.


In [None]:
print(pais[2:9])
print(pais[:7])
print(pais[7:])
print(pais[2:-2])
print(pais[:])

- En la notación por rangos, se puede establacer cuantos caracteres se avanzará (de forma predeterminada se entiende de uno en uno).  
  `str[n:m:p]` devuelve la subcadena que va desde el índice `n` hasta `m-1` avanzando de `p` en `p` caracteres.

In [None]:
print(pais[1:10:2])
print(pais[:10:2])
print(pais[::-1])

# Funciones y métodos de cadenas

- Longitud de cadena (cantidad de caracteres): `len(str)`
- Conteo de ocurrencias: `str.count(sub [, start [, end ]])`  
  Significado: cuantas veces aparece `sub` en `str`.


In [None]:
frase = 'mi mama me mima'
print( len(frase) )
print( frase.count('ma') )

- Buscar posición:
  - `str.find(sub [, start [, end ]])`
  - `str.index(sub [, start [, end ]])`
  - `str.rfind(sub [, start [, end ]])`
  - `str.rindex(sub [, start [, end ]])`  
  Significado:
  - Buscar posición donde `sub` aparece en `str`
  - Normalmente la búsqueda es de izquierda a derecha. Las instrucciones que tienen un `r` por delante lo hacen de derecha a izquierda.
  - En caso `sub` no esté en `str`:
    - `find` devuelve -1.
    - `index` produce un error.

  

In [None]:
print( frase.find('ma') )
print( frase.index('ma') )
print( frase.rfind('ma') )
print( frase.rindex('ma') )
print( frase.find('mi',3,8) )
print( frase.index('mi',3) )

In [None]:
print( frase.find('mu') )
print( frase.index('mu') )

## Producir cadenas modificadas

- Mayúsculas/minúsculas
  - `str.title()`
  - `str.lower()`
  - `str.upper()`
  - `str.swapcase()`

In [None]:
texto = 'QuE MaL EsCrIbO!!'
print( texto.title() )
print( texto.lower() )
print( texto.upper() )
print( texto.swapcase() )

- Añaden carcateres:
  - `str.center(width [, fillchar ])`
  - `str.ljust(width [, fillchar ])`
  - `str.rjust(width [, fillchar ])`

In [None]:
print( texto.center(30, ' ') )
print( texto.ljust(30, '=') )
print( texto.rjust(30, '*') )

- Quitar caracteres del comienzo o final:
  - `str.lstrip( [chars] )`
  - `str.rstrip( [chars] )`
  - `str.strip( [chars] )`

In [None]:
espacios = '      tengo   muchos   espacios     '
print(espacios)
print(espacios.lstrip())
print(espacios.rstrip())
print(espacios.strip())

- Reemplazar subcadena
  - `str.replace(old, new [, count])`

In [None]:
print(espacios.replace('tengo', 'poseo'))
print(espacios.replace(' ', ''))
print(espacios.replace(' ', '', 10))

# Secuencias de escape

- Se usan dentro de cadenas para lograr diversos efectos.
- Se invocan al colocar el caracter `\` antes de un caracter de control que especifica la acción.

| Secuencia | Resultado |
|--:|:--|
| \b | Espacio atrás (BS) |
| \n | Salto de línea (LF) |
| \r | Retorno de carro (CR) |
| \t | Tabulador horizontal (TAB) |
| \\\\ | Caracter barra invertida (\) |
| \\' | Comilla simple (') |
| \\" | Comilla doble (") |


In [None]:
s = 'Prueba\n\tSecuencias\nde\t\tescape\b.'
print(s)

# Formateado de cadenas

## Método `format()`

- Una cadena de caracteres puede tener marcas de formato que el método `format()` usa para intercalar valores.
- Marcas de formato:
  - Especificar { [ campo [:formato] ] } dentro de una cadena.
  - campo: un entero
  - formato: especifica cómo se va a formatear la información.

### Formato

`[[relleno]alineamiento][signo][0][ancho][.precisión][código de tipo]`

- relleno: caracter para rellenar al alinear
- alineamiento: < izquierda, > derecha, ^ centralizar
- signo: + para forzar que aparezca signo
- 0: rellena con 0
- ancho: cantidad de caracteres que ocupa
- precisión: cantidad de decimales
- código de tipo:
  - enteros
    - b: binatio
    - d: base 10
    - x: hexadecimal
  - flotante
    - e: notación exponencial
    - f: notación punto fijo
    - g: formato general  
  

In [None]:
molde1 = 'Mi nombre es {}, tengo {} años y mis ahorros son de {} dólares.'

print(molde1.format('Jose',15,257.54))

In [None]:
molde2 = 'Su nombre es {0} y tiene {1} años.\nA sus {1} años, {0} ha logrado ahorrar {2:_^+20.4f} dólares.'

print(molde2.format('Jose',15,257.54))

In [None]:
molde3 = 'Su nombre es {0} y tiene {1} años.\nA sus {1} años, {0} ha logrado ahorrar {2:010.3f} dólares.'

print(molde3.format('Jose',15,257.54))

# Recorrido de cadenas

- Una cadena se puede considerar como una lista de caracteres.
- Una lista es un ejemplo de un iterable en Python. Por lo tanto, se puede usar en un ciclo `for`.

In [None]:
mensaje = 'Te tengo un mensaje.'
for caracter in mensaje:
  print(caracter)

## Ejemplo

Escriba un programa que pida una texto. Devuelva la cantidad de palabras que hay en el texto. Considere que cada palabra está separada por un espacio en blanco.

In [None]:
texto = input( 'Ingrese texto: ')
blancos = 0

for c in texto:
  if c == ' ':
    blancos += 1

print('El texto tiene {} palabras'.format(blancos+1))

In [None]:
texto = input( 'Ingrese texto: ')
blancos = 0

for i in range(len(texto)):
  if texto[i] == ' ':
    blancos += 1

print('El texto tiene {} palabras'.format(blancos+1))

# Ejercicios

1. Escriba un programa que lea una cadena y muestre el número de espacios en blanco que contiene.
  - Resuelva el problema usando el método `count`
  - Resuelva el problema usando recorrido de cadenas.
1. Escriba un programa que detecte si una cadena tiene una o más letras mayúsculas. Imprima un mensaje adecuado.
1. Escriba un programa que pida un texto y luego una palabra. El programa debe imprimir un mensaje indicando si la palabra está en el texto o no.
1. Escriba un programa que pida un texto y que luego devuelva el mismo texto con todas las vocales reemplazadas por `x`. Asuma que todo el texto siempre estará en minúsculas.
1. Escriba un programa que pida un número en binario (leído como una cadena) y notifique si la entrada es aceptable o si no lo es por tener caracteres diferentes de `'0'` y `'1'`.
1. Escriba un programa que convierte un número en binario (leído como una cadena) a decimal.
1. Escriba un programa que devuelva todos los dígitos numéricos que tenga una cadena. Ejemplo:
  ```python
  Ingrese texto: 3st4 c4d3n4 t13n3 v4r10s num3r0s
  3443413341030
  ```
  Sugerencia:
  - Averiguar qué es una tabla ASCII
  - Indagar qué hacen las funciones `ord()` y `chr()`
1. Escriba un programa que diga si una cadena tiene los 'paréntesis balanceados' o no. La cadena puede tener otros caracteres fuera de los paréntesis.
  ```python
  Ingrese texto: Este(es)un((buen(ejemplo)).)
  Parentesis balanceados
  ```
  ```python
  Ingrese texto: Este(es)un((mal(ejemplo)).
  Parentesis no balanceados
  ```
  Sugerencia:
  - Use una variable de control con las siguientes consideraciones:
    - Inicializar la variable en cero.
    - Cada vez se habra un paréntesis sume uno a la variable
    - Cada vez que se cierre un paréntesis reste uno a la variable.
  - Si los paréntesis están balanceados, ¿qué valor debería tener la variable al terminar el programa?


# Referencias

Parte del contenido de este documento está basado en:

- Andrés Marzal, Isabel Gracia, Pedro García. (2014).
Introducción a la programación con Python 3, Primera
Edición. Publicacions de la Universitat Jaume I. Servei de Comunicació i Publicacions.
- Sotero Esteva, J. O. (2020). Introducción a las Computadoras. Manuscrito sin publicar. Universidad de Puerto Rico en Humacao, Puerto Rico.