# **Cadenas de Caracteres**

Como vimos en sesiones anteriores, las cadenas de caracteres (str): Nos permiten guardar secuencias de caracteres.

Además de realizar estas operaciones que ya hemos estudiado:

* **Concatenación: +**: El operador + me permite unir datos de tipos secuenciales, en este caso dos cadenas de caracteres.
* **Repetición:*** : El operador * me permite repetir un dato de un tipo secuencial, en este caso de cadenas de caracteres.
* **Indexación**: Puedo obtener el dato de una secuencia indicando la posición en la secuencia. En este caso puedo obtener el carácter de la cadena indicando la posición (**empezando por la posición 0**).

**Para obtener la longitud de una cadena** (número de caracteres que tiene), utilizamos la función **len**.

In [None]:
cadena = "Hola que tal"

print('Concatenación: ' + cadena + cadena)

print('Repetición: ' + cadena*3)

print('Indexación: ' + cadena[0] + cadena[1])

print('Longitud de la cadena (len): ' + str(len(cadena)))

Concatenación: Hola que talHola que tal
Repetición: Hola que talHola que talHola que tal
Indexación: Ho
Longitud de la cadena (len): 12


### Tenemos más operaciones que podemos realizar:



* Las cadenas se pueden recorrer



In [None]:
cadena = 'informática'

for caracter in cadena:
  print(caracter, end="")

informática



* **Operadores de pertenencia**: Se puede comprobar si un elemento (subcadena) pertenece o no a una cadena de caracteres con los operadores **in** y **not in**.


In [None]:
print('a' in cadena)

print('p' in cadena)

print('p' not in cadena)

True
False
True


* Slice (rebanada): Puedo obtener una subcadena de la cadena de caracteres. Se indica el carácter inicial, y el carácter final, además podemos indicar opcionalmente un salto. Si no se indica el carácter inicial se supone que es desde el primero, sino se indica el carácter final se supone que es hasta el final. Por último podemos usar salto negativo para empezar a contar desde el final.

Como resumen de las distintas posibilidades podemos indicar:

  * **cadena[start:end]** # Elementos desde la posición start hasta end-1
  * **cadena[start:]** # Elementos desde la posición start hasta el final
  * **cadena[:end]** # Elementos desde el principio hasta la posición end-1
  * **cadena[:]** # Todos Los elementos
  * **cadena[start:end:step]** # Igual que el anterior pero dando step saltos.

  Veamos algunos ejemplos:

In [None]:
print(cadena[2:5])

# posición 2 hasta la 6 dando saltos de 2 en 2
print(cadena[2:7:2])

print(cadena[:5])

print(cadena[5:])
# desde el final hasta el inició - inveso
print(cadena[-1:-3])
# Invertir la cadena
print(cadena[::-1])

for
frá
infor
mática

acitámrofni


## Conversión de tipos

Podemos convertir cualquier número en una cadena de caracteres utilizando la función **str**:



In [None]:
strnum = str(7.8)

print(type(strnum))

print(strnum)

<class 'str'>
7.8


# **Las cadenas de caracteres son inmutables**

Cuando creamos una variable de tipo cadena de caracteres, estamos creando un **objeto de la clase str**.

Se trata de una clase especifica que podemos guardar en un tipo
de datos y lleva asociados una serie de operaciones que pueden
realizar.

Cada vez que creamos una variable de una determinada clase, **creamos un objeto**, que además de guardar información (en nuestro caso los caracteres de la cadena) puede realizar distintas operaciones que llamamos **métodos**.

**Nosotros ya hemos usado un método de la clase str**. El método **upper()** nos permite convertir la cadena a mayúsculas.

## **Pero ¿Qué significa que las cadenas de caracteres son inmutables?**
No podemos cambiar los caracteres de una cadena de la siguiente forma:

In [None]:
cadena = 'informática'

cadena[2] = 'g'

print(cadena)


TypeError: ignored

Esto implica que al usar un método la cadena original no cambia, el método devuelve otra cadena modificada.

Veamos un ejemplo:

In [None]:
cadena = 'informática'

print(cadena.upper())

print(cadena)

INFORMÁTICA
informática


# **Métodos principales de cadenas**

Aunque las cadenas de caracteres tiene muchos métodos definidos, vamos a estudiar los más importantes:

## **Métodos de Formato**

* **capitalize()** nos permite devolver la cadena con el primer carácter en mayúsculas.

In [None]:
cadena = "hola, ¿como estás?"
print(cadena.capitalize())

Hola, ¿como estás?


* **lower() y upper()** convierte la cadena de caracteres en minúsculas y mayúsculas respectivamente.

In [None]:
cadena = "Hola Mundo"

print(cadena.lower())

print(cadena.upper())

hola mundo
HOLA MUNDO


* **swapcase()**: devuelve una cadena nueva con las minúsculas convertidas a mayúsculas y viceversa. (Yo no termino de verle la utilidad pero bueno, ahí está)

In [None]:
print(cadena.swapcase())

hOLA mUNDO


* **title()**: Devuelve una cadena con los primeros caracteres en mayúsculas de cada palabra.

In [None]:
cadena = "esto es una cadena de caracteres"

print(cadena.title())

Esto Es Una Cadena De Caracteres


## **Métodos de Búsqueda**

* **`count()`**: Es un método al que indicamos como parámetro una subcadena y cuenta cuantas apariciones hay de esa subcadena en la cadena.

In [None]:
cadena = "bienvenido a mi aplicación"

print(cadena.count('a'))

3


Además podemos indicar otro parámetro para indicar la posición desde la que queremos iniciar la búsqueda. Y otro parámetro optativo para indicar la posición final de búsqueda.

In [None]:
print(cadena.count("a",16))
print(cadena.count('a',10,16))

2
1


* **find()** nos devuelve la posición de la subcadena que hemos indicado como parámetro. Si no se encuentra devuelve -1.

In [None]:
print(cadena.find('mi'))
print(cadena.find('hola'))

13
-1


## **Métodos de Validación**

* **startswith()**: nos indica con un valor lógico si la cadena empieza por la subcadena que hemos indicado como parámetro. Podemos indicar también con otro parámetro la posición donde tiene que buscar.

In [None]:
print(cadena.startswith('b'))

print(cadena.startswith('m'))

print(cadena.startswith('m',13))

True
False
True


* **endswith()** igual que la anterior pero indica si la cadena termina con la subcadena indicada. En este caso, se puede indicar la posición de inicio y final de búsqueda.

In [None]:
print(cadena.endswith('ción'))

print(cadena.endswith("ción",0,10))

print(cadena.endswith("nido",0,10))

True
False
True


## **Métodos de Sustitución**

* **replace()**: Devuelve una cadena donde se ha sustituido las apariciones de la primera subcadena indicada por la segunda subcadena indicada como parámetro.



In [None]:
buscar = "nombre apellido"
reemplazar = "Manu Rodríguez"

print ("Estimado Sr. nombre apellido:".replace(buscar, reemplazar))

Estimado Sr. Manu Rodríguez:


* **strip()**: Devuelve una cadena donde se han quitado los espacios del principio y del final. Si indicamos una subcadena como parámetro quitará dicha subcadena del principio y del final.

In [None]:
cadena = "    www.iesalandalus.org    "

print(cadena.strip())

cadena = "00000000123000000000000"

print(cadena.strip('0'))

www.iesalandalus.org
123


## **Métodos de unión y división**

aunque todavía no lo hemos estudiado, el método **split()** nos permite convertir una cadena en una lista. Lo usaremos más adelante.



In [None]:
hora = "14:37:23"

print(hora.split(':'))

print(type(hora.split(':')))

['14', '37', '23']
<class 'list'>


* **splitlines()**: Nos permite separar las líneas que hay en una cadena (indicada con el carácter \n) en una lista.

In [None]:
multi = "Cadena 1 \n Cadena 2 \n Cadena 3"

print(multi)

print(multi.splitlines())

Cadena 1 
 Cadena 2 
 Cadena 3
['Cadena 1 ', ' Cadena 2 ', ' Cadena 3']
