# Cadenas de texto

Las cadenas de texto son secuencias de caracteres. También se les conoce como «strings»
y nos permiten almacenar información textual de forma muy cómoda.

Es importante destacar que Python 3 almacena los caracteres codificados en el estándar
Unicode, lo que es una gran ventaja con respecto a versiones antiguas del lenguaje. Además permite representar una cantidad ingente de símbolos incluyendo los famosos emojis.

In [1]:
'Cadena de texto'

'Cadena de texto'

In [4]:
'Cadena de texto llamadas "String" y son cadenas de caracteres'

'Cadena de texto llamadas "String" y son cadenas de caracteres'

In [5]:
'Cadenas de texto llamadas \'string\' son cadenas de caracteres'

"Cadenas de texto llamadas 'string' son cadenas de caracteres"

In [8]:
"Cadenas de texto llamadas 'string' son cadenas de caracteres"

"Cadenas de texto llamadas 'string' son cadenas de caracteres"

In [11]:
parrafo = ''' Lorem Ipsum is simply dummy text of the printing and typesetting industry.
Lorem Ipsum has been the industry's standard dummy text ever since the 1500s, 
when an unknown printer took a galley of type and scrambled it to make a type specimen book. 
It has survived not only five centuries, but also the leap into electronic typesetting, remaining essentially unchanged. 
It was popularised in the 1960s with the release of Letraset sheets containing Lorem Ipsum passages, 
and more recently with desktop publishing software like Aldus PageMaker including versions of Lorem Ipsum.

'''
print(parrafo)

 Lorem Ipsum is simply dummy text of the printing and typesetting industry.
Lorem Ipsum has been the industry's standard dummy text ever since the 1500s, 
when an unknown printer took a galley of type and scrambled it to make a type specimen book. 
It has survived not only five centuries, but also the leap into electronic typesetting, remaining essentially unchanged. 
It was popularised in the 1960s with the release of Letraset sheets containing Lorem Ipsum passages, 
and more recently with desktop publishing software like Aldus PageMaker including versions of Lorem Ipsum.




Cadena Vacia:

In [13]:
""

''

### Conversiones

Podemos crear «strings» a partir de otros tipos de datos usando la función str():

In [14]:
str(3.1415)

'3.1415'

In [15]:
str(True)

'True'

In [16]:
str(36)

'36'

### Secuencias de escape

Python permite escapar el significado de algunos caracteres para conseguir otros resultados.
Si escribimos una barra invertida \ antes del caracter en cuestión, le otorgamos un significado
especial.

Quizás la secuencia de escape más conocida es \n que representa un salto de línea, pero
existen muchas otras:

In [22]:
msg = 'Primera línea\nSegunda línea\nTercera línea'
print(msg)
# Tabulador
msg_2 = 'Valor = \t40'
print(msg_2)
# Comillas sencillas en la cadena
msg_3 = 'Necesitamos \'escapar\' la comilla simple'
print(msg_3)
msg_4 = 'Capítulo \\ Sección \\ Encabezado'
print(msg_4)

Primera línea
Segunda línea
Tercera línea
Valor = 	40
Necesitamos 'escapar' la comilla simple
Capítulo \ Sección \ Encabezado


### Expresiones literales

Hay situaciones en las que nos interesa que los caracteres especiales pierdan ese significado y
poder usarlos de otra manera. Existe un modificar de cadena que proporciona Python para
tratar el texto en bruto. Es el llamado «raw data» y se aplica anteponiendo una r a la cadena
de texto.

In [23]:
text = 'abc\ndef'
print(text)
# Anteponiendo la r
text = r'abc\ndef'
print(text)

abc
def
abc\ndef


In [25]:
text = 'a\tb\tc'
print(text)
text = r'a\tb\tc'
print(text)

a	b	c
a\tb\tc


### Función print

In [32]:
msg1 = 'Mi nombre es:'
msg2 = 'Jaime Alejandro Cruz Córdova'
msg3 = 'Software'
print(msg1)
print (msg1, msg2, msg3)
print (msg1, msg2, sep= ' * ')
print (msg1, msg2, end='!}}!')

Mi nombre es:
Mi nombre es: Jaime Alejandro Cruz Córdova Software
Mi nombre es: * Jaime Alejandro Cruz Córdova
Mi nombre es: Jaime Alejandro Cruz Córdova!}}!

### Leer datos desde teclado

Los programas se hacen para tener interacción con el usuario. Una de las formas de
interacción es solicitar la entrada de datos por teclado. Como muchos otros lenguajes de
programación, Python también nos ofrece la posibilidad de leer la información introducida
por teclado. Para ello se utiliza la función input():

In [33]:
nombre = input('Mi nombre es:')
print ('Tu nombre es: ' + nombre)

Tu nombre es: Jaime


In [34]:
type(nombre)

str

In [37]:
edad = input('Tu edad es:')

type(edad)
print(type(edad))
print(edad)




<class 'str'>
45


In [39]:
print(edad)

45


## Ejercicio a realizar:

Escriba un programa en Python que lea por teclado dos números enteros y muestre por
pantalla el resultado de realizar las operaciones básicas entre ellos.

Valores de entrada 7 y 4.

Salida esperada:

7+4=11 

7-4=3 

7*4=28 

7/4=1.75 


### Obtener un caracter

Los «strings» están indexados y cada caracter tiene su propia posición. Para obtener un
único caracter dentro de una cadena de texto es necesario especificar su índice dentro de
corchetes [...].

<img src="../img/cadena.PNG">

In [38]:
cadena = 'Hola, Mundo'

print (cadena[0])

print (cadena[3])

print (cadena[-1])

print (cadena[-2])

H
a
o
d


Las cadenas son inmutable, esto quiere decir que no puede modificarse ningun elemento de la cadena

In [39]:
cadena[2] = 'W'

TypeError: 'str' object does not support item assignment

### Trocear una cadena

Es posible extraer «trozos» («rebanadas») de una cadena de texto2. Tenemos varias
aproximaciones para ello:

[:] Extrae la secuencia entera desde el comienzo hasta el final. Es una especia de copia de
toda la cadena de texto.

[start:] Extrae desde start hasta el final de la cadena.

[:end] Extrae desde el comienzo de la cadena hasta end menos 1.

[start:end] Extrae desde start hasta end menos 1.

[start:end:step] Extrae desde start hasta end menos 1 haciendo saltos de tamaño step.

In [40]:
dicho = 'arbol que nace torcido, jamás su rama endereza'

dicho[:]

'arbol que nace torcido, jamás su rama endereza'

In [41]:
dicho[24:]

'jamás su rama endereza'

In [42]:
dicho[:22]

'arbol que nace torcido'

In [43]:
dicho[15:22]

'torcido'

In [44]:
dicho[24:29]


'jamás'

In [52]:
dicho[24:29:2]

'jms'

### Longitud de una cadena

Para obtener la longitud de una cadena podemos hacer uso de len(), una función común a
prácticamente todos los tipos y estructuras de datos en Python:

In [53]:
len(dicho)

46

In [54]:
empty=''
len(empty)

0

### Pretenece a una cadena

Si queremos comprobar que una determinada subcadena se encuentra en una cadena de texto
utilizamos el operador in para ello. Se trata de una expresión que tiene como resultado un
valor «booleano» verdadero o falso:

In [57]:
'arbol' in dicho

True

In [58]:
'arbolito' in dicho

False

In [61]:
not('arbol' in dicho)

False

In [62]:
'arbolito' not in dicho

True

### Dividir una cadena

Una tarea muy común al trabajar con cadenas de texto es dividirlas por algún tipo
de separador. En este sentido, Python nos ofrece la función split(), que debemos usar
anteponiendo el «string» que queramos dividir:

In [63]:
dicho.split()

['arbol', 'que', 'nace', 'torcido,', 'jamás', 'su', 'rama', 'endereza']

In [64]:
dicho.split(',')

['arbol que nace torcido', ' jamás su rama endereza']

### Limpiar cadenas

Cuando leemos datos del usuario o de cualquier fuente externa de información, es bastante
probable que se incluyan en esas cadenas de texto, caracteres de relleno3 al comienzo y
al final. Python nos ofrece la posibilidad de eliminar estos caracteres u otros que no nos
interesen.

La función strip() se utiliza para eliminar caracteres del principio y del final de un
«string». También existen variantes de esta función para aplicarla únicamente al comienzo
o únicamente al final de la cadena de texto.

Supongamos que debemos procesar un fichero con números de serie de un determinado
artículo. Cada línea contiene el valor que nos interesa pero se han «colado» ciertos caracteres
de relleno que debemos limpiar:

In [65]:
variable = '\n \t    \n  242424235634645646 \t \n    \n'
variable.strip()


'242424235634645646'

In [66]:
variable = '\n \t    \n  242424235634645646 \t \n    \n'
variable.lstrip()


'242424235634645646 \t \n    \n'

In [67]:
variable_3 = '\n \t    \n  242424235634645646 \t \n    \n'
variable_3.rstrip()


'\n \t    \n  242424235634645646'

In [69]:
variable_4 = '\n \t    \n  242424235634645646 \t \n    \n'
variable_4.strip('\n \t')


'242424235634645646'

### Realizar búsquedas

In [72]:
dicho.find('rama')

33

In [74]:
dicho.index('rama')

33

### Contar subcadenas

In [75]:
dicho.count('r')

4

### Interpolación de cadenas

La interpolación en cadenas de texto es un concepto que existe en la gran mayoría de
lenguajes de programación y hace referencia al hecho de sustituir los nombres de variables
por sus valores cuando se construye un «string».

Para indicar en Python que una cadena es un «f-string» basta con precederla de una f e
incluir las variables o expresiones a interpolar entre llaves {...}.

In [76]:
nombre = 'Jaime Alejandro Cruz Córdova'
edad = 45
materia = 'Software de sistemas II'

f'Me llamo {nombre} y tengo {edad} años de edad y soy docente de la materia {materia}'

'Me llamo Jaime Alejandro Cruz Córdova y tengo 45 años de edad y soy docente de la materia Software de sistemas II'

# Ejercicios

e = 2.71828

obtenga los siguientes resultados utilizando «f-strings»:



<img src='../img/ejercicio-string-1.PNG'>
<img src='../img/ejercicio-string-2.PNG'>

### Tipo de objeto

In [78]:
dir(dicho)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'capitalize',
 'casefold',
 'center',
 'count',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'format_map',
 'index',
 'isalnum',
 'isalpha',
 'isascii',
 'isdecimal',
 'isdigit',
 'isidentifier',
 'islower',
 'isnumeric',
 'isprintable',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'maketrans',
 'partition',
 'removeprefix',
 'removesuffix',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',
