# Strings
(celda markdown)

In [None]:
# Make a 4-character string, and assign it to a name <= esto es un comentario en Python
S = 'Spam'
print(S)

Spam


## Length

In [None]:
len(S) # nos devuelve el número de caracteres del string.

4

## The first item in S, indexing by zero-based position
En Python, los índices empeizan en el `0:` el primer item es un index `0`, el segundo es el índice `1`, igual con el resto.



In [None]:
S[0]

'S'

## EL segundo item por la izquierda

In [None]:
S[1]

'p'

In [None]:
# Si te sales de los límites
S[8] # habrá una excepción de tipo IndexError.

IndexError: string index out of range

## El últmio item del string
In Python, we can also _index backward_, from the end—positive indexes count from the left, and negative indexes count back from the right.

In [None]:

S[-1]

'm'

## El penúltimo por la izquierda

In [None]:
S[-2]

'a'

## Backus-Naur
Negative indexing, the hard way. Expresiones en Python <=> resolver por Backus-Naur

Backus-Naur es un método de notación que describe la sintaxis de lenguaje de marcas.

In [None]:
S[len(S) - 1] # Backus-Naur, lee de derecha a izquierda, primero hace resuelve lo que hay dentro de los corchetes y después saca el valor.

'm'

## Slice of S

In [None]:
# incluye la posición 1 y 2, no la 3.
S[1:3]

'pa'

In [None]:
# Todo menos la primera posición.
S[1:]


'pam'

In [None]:
# El string no cambia, es inmutable.
S

'Spam'

In [None]:
# Todo menos el último.
S[0:3]

'Spa'

In [None]:
# Es lo mismo que S[0:3]
S[:3]

'Spa'

In [None]:
# Todo menos la última, más simple que [0:-1]
S[:-1]

'Spa'

In [None]:
# Selecciona todo S, también (0:len(S))
S[:]

'Spam'

## Concatenación y repetición

In [None]:
S + 'eggs'

'Spameggs'

In [None]:
# S no cambia
S

'Spam'

In [None]:
# Se repite
S * 6

'SpamSpamSpamSpamSpamSpam'

## Polimorfismo
El signo más `+` tiene diferentes significados para distintos objetos: suma para números y concatenación para cadenas.

Esta es una propiedad general de Python llamada **polimorfismo**.

El significado de una operación depende de los objetos sobre los que se opera.

Como veremos al estudiar el **tipado dinámico**, esta propiedad de polimorfismo explica gran parte de la concisión y flexibilidad del código Python.

Dado que los tipos no están restringidos, una operación codificada en Python normalmente puede funcionar con muchos tipos diferentes de objetos de forma automática, siempre que admitan una interfaz compatible (como la operación `+` en este caso).


## Inmutabilidad

Los objetos inmutables no pueden ser cambiados.

En Python, cada objeto se clasifica como inmutable (no modificable) o no.

En cuanto a los tipos básicos:
- **Los números, las cadenas y las tuplas son _inmutables_**;

- **Las listas, los diccionarios y los conjuntos son _mutables_**.


In [None]:
S[0] = 'z'

TypeError: 'str' object does not support item assignment

## Podemos utilizar expresiones para hacer nuevos objetos

In [None]:
S = 'z' + S[1:]
S

'zpam'

## Strings y listas
Propiedades de los objetos

In [None]:
E = 'egss'
L = list(E)
print(L)
L[0] = 'z'
L

['e', 'g', 's', 's']


['z', 'g', 's', 's']

In [None]:
''.join(L)
# L es ['z', 'g', 's', 's']

'zgss'

## Type-Specific Methods
### Find

In [None]:
# Encuentra la primera posición donde empieza el substring dentro del string
S = 'SpamEggsSpam'
S.find('pa')

1

In [None]:
S.find('pa', 3) # busca a partir de la posición 3.

9

In [None]:
S.find(S) # S dentro de S empieza en 0.

0

In [None]:
# Si no existe el caracter => -1
S.find('z')

-1

### Replace

In [None]:
S.replace('Eggs', 'Bacon') # reemplaza (esto, por esto)
# S es inmutable! S = 'SpamEggsSpam'

'SpamBaconSpam'

### Mayúsculas

In [None]:
S.upper()
# S es inmutable! S = 'SpamEggsSpam'

'SPAMEGGSSPAM'

In [None]:
print("S is alpha", S.isalpha())
print("S is digit", S.isdigit())

S is alpha True
S is digit False


### Split

In [None]:
S = 'spams-spam-eggs-spam-bacon'
S.split('-')

['spams', 'spam', 'eggs', 'spam', 'bacon']

### Rstrip
Elimina espacios en blanco a la derecha

In [None]:
line = 'aaa\t,bbb\t,\nccccc,\tdd\n'
print(line)

aaa	,bbb	,
ccccc,	dd



In [None]:
line.rstrip()

'aaa\t,bbb\t,\nccccc,\tdd'

In [None]:
line.lstrip()

'aaa\t,bbb\t,\nccccc,\tdd\n'

In [None]:
# Combine two operations
line.rstrip().split(',')

['aaa\t', 'bbb\t', '\nccccc', '\tdd']

### Formatting
Los strings soportan una opción avanzada de sustitución llamada **formatting**

In [None]:
# # Formatting expression
'%s, eggs, and %s' % ('spam', 'SPAM!')

'spam, eggs, and SPAM!'

In [None]:
# Formatting method
'{}, eggs, and {}'.format('spam', 'SPAM!')

'spam, eggs, and SPAM!'

In [None]:
S = 'SpamEggsSpam'
f'{S}'

'SpamEggsSpam'

In [None]:
'{0}'.format(S)

'SpamEggsSpam'

### String Conversion Tools


In [None]:
"42" + 1

TypeError: can only concatenate str (not "int") to str

In [4]:
int("42") + 1    # suma

43

In [None]:
"42" + str(1)    # concatenacion

'421'

In [None]:
repr(42)    # repr function convierte un objeto en su representación como string.

'42'

In [None]:
repr("42")

"'42'"

### Conversiones de códigos de caracteres

Convierta un solo carácter a su código entero subyacente (por ejemplo, su **valor de byte ASCII**) pasándolo a la función integrada `ord`. Esta función devuelve el valor binario real utilizado para representar el carácter correspondiente en la memoria.

Para texto ASCII, se trata del conocido entero de 7 bits que cabe en un solo byte de memoria, pero el rango de puntos de código para otros tipos de texto **Unicode** puede ser mayor.

In [2]:
ord('s')

115

La función `chr` realiza la operación inversa, tomando un código entero y convirtiéndolo al carácter correspondiente:

In [3]:
chr(115)

's'