## Cadenas

Como ya vimos una _cadena_ es un tipo de variable que almacena texto. Las cadenas deben definirse usando comillas dobles `" "` o simples `' '`.

In [1]:
s = "Hola mundo"
type(s)

str

Las cadenas tienen algunas similitudes con las listas. Por ejemplo es posible determinar la longitud de una cadena, es decir el número de caracteres que la componen.

In [2]:
len(s)

10

Es posible usar enteros para indexar cadenas.

In [3]:
s[0]

'H'

Si quisieramos obtener el último elemento de una cadena podemos hacer.

In [4]:
s[-1]

'o'

Además es posible obtener rebanadas (slices), mediante la sintaxis, _[desde:hasta]_

In [5]:
s[0:4]

'Hola'

In [6]:
s[5:10]

'mundo'

Es posible omitir el _desde_, Python asumirá que es desde el principio. De la misma forma es posible omitir el _hasta_, Python asumirá que es hasta el final.

In [7]:
s[:4]

'Hola'

In [8]:
s[5:]

'mundo'

In [9]:
s[:] # esto es lo mismo que s

'Hola mundo'

Además es posible definir el _paso_ de las rebanadas (slices), usando la sintaxis  _[desde:hasta:paso]_

In [10]:
s[::1]  # esto es lo mismo que s o s[:]

'Hola mundo'

In [11]:
s[::3]

'Hauo'

En Python es posible sumar cadenas.

In [12]:
r = '!'
s + r 

'Hola mundo!'

Se dice que el operador `+` está sobrecargado (overloaded) ya que además de su definición matemática original aplicable a números es posible aplicarlo a cadenas, resultando en la concatenación de las mismas.

También es posible multiplicar cadenas por enteros.

In [13]:
s + r*3

'Hola mundo!!!'

### Métodos de cadenas

Con lo que hemos visto podemos crear una función para determinar si una palabra es palíndromo

In [14]:
def es_palindromo(palabra):
    return palabra == palabra[::-1]

es_palindromo('somos')

True

Ahora veamos como generalizar esta función para más de una palabra, por ej "luz azul"

In [15]:
es_palindromo('luz azul')

False

Las cadenas en Python tienen muchos métodos, por ejemplo `split` devuelve una lista de strings por defecto la lista es generada "separando" un strings cada vez que se encuentra un espacio en blanco.

In [16]:
aforismo = 'A más cómo, menos por qué'
aforismo.split()

['A', 'más', 'cómo,', 'menos', 'por', 'qué']

Este comportamiento lo podemos cambiar pasando como argumento el caracter que queremos usar como separador.

In [17]:
aforismo.split(',')

['A más cómo', ' menos por qué']

Otro método es `lower` que tiene como efecto devolver una nueva cadena donde todos los caracteres son minúsculas

In [18]:
'LuZ AzUl'.lower()

'luz azul'

otro método es replace que nos permite reeplazar caracteres, incluso podemos reemplazar un espacio en blanco por nada.

In [19]:
'Luz azul'.replace(' ', '')

'Luzazul'

Combinando estos dos últimos métodos podemos crear una versión más versatil de `es_palindromo`.

In [20]:
def es_palindromo(palabra):
    nueva_palabra = palabra.lower().replace(' ', '')  # es posible concatenar métodos
    return nueva_palabra == nueva_palabra[::-1]

es_palindromo('Luz azul')

True

Las cadenas poseen muchos otros métodos, como por ejemplo

In [21]:
s.upper()  # Devuelve una copia de la cadena original, pero en mayúsculas

'HOLA MUNDO'

In [22]:
s.count('o')  # cuenta la cantidad de veces que una subcadena aparece en una cadena

2

In [23]:
s.index('o')  # devuelve el índice en el cual una subcadena aparece (por primera vez)

1

Para seguir explorando otras funciones aplicables a cadenas podés usar la sugerencia que ofrece Jupyter al presionar _tab_.

In [24]:
# s.

####  Formateado de cadenas

En muchas ocasiones es necesario dar algún formato específico a cadenas, por ejemplo al imprimir resultados en pantalla o guardar datos en un archivo. Algunos de los casos más usados son:

In [25]:
val = 42
"valor = {:.3f} unidades".format(val)

'valor = 42.000 unidades'

In [26]:
"{:.3f}, {:03d}, {}, {:>10}".format(3.1415, 42, 'abc', 'xyz')

'3.142, 042, abc,        xyz'

A partir de Python 3.6 se incorporó una nueva forma de formatear cadenas, las `f-strings`. Qué es la más usada y recomendada actualmente.

In [27]:
f"valor = {val:.3f} unidades"

'valor = 42.000 unidades'

Como pueden ver las f-strings son similares a `.format()`, solo que un poco más directas ya que permiten pasar variables directamente dentro de la cadena. Incluso podemos realizar operaciones con la variable dentro de la cadena.

In [28]:
f"valor = {(val**2)/3:.3f} unidades"

'valor = 588.000 unidades'

Podríamos querer que la función `es_palindromo` nos devuelva un mensaje más amigable que True o False. Una opción que la función no devuelva ningún valor si no que imprima un mensaje, por ejemplo

In [29]:
def es_palindromo(palabra):
    nueva_palabra = palabra.lower().replace(' ', '')
    if nueva_palabra == nueva_palabra[::-1]:
        print(f'{palabra} es un palíndromo')
    else:
        print(f'{palabra} no es un palíndromo')
        
es_palindromo('Luz azul')

Luz azul es un palíndromo


In [30]:
def histograma(cadena):
    visto = []
    cadena_nueva = cadena.lower().replace(' ', '')
    for c in cadena_nueva:
        if c not in visto:
            print(f'{c} aparece {cadena_nueva.count(c)} veces')
            visto.append(c)

In [31]:
cadena="Aquella solitaria vaca cubana."
histograma(cadena)

a aparece 8 veces
q aparece 1 veces
u aparece 2 veces
e aparece 1 veces
l aparece 3 veces
s aparece 1 veces
o aparece 1 veces
i aparece 2 veces
t aparece 1 veces
r aparece 1 veces
v aparece 1 veces
c aparece 2 veces
b aparece 1 veces
n aparece 1 veces
. aparece 1 veces


Podemos mejorar algunos aspectos de esta función, por ejemplo unificar caracteres con y sin tilde. y eliminar signos de puntuación no solo espacios en blanco. Para ello vamos a usar el método `maketrans` que nos permite crear una tabla de correspondencia entre el primer y segundo argumento. El tercer argumento indica los caracteres que sean reemplazados por nada. Otro truco de la siguiente función es que usa "vez" y "veces" según corresponda (queda como ejercicio explicar como se logra esto).

In [32]:
def histograma(cadena):
    visto = []
    trans = str.maketrans('áéíóúü','aeiouu', ':,. ')
    cadena_nueva = cadena.lower().translate(trans)
    for c in cadena_nueva:
        if c not in visto:
            cantidad = cadena_nueva.count(c)
            d = 'vez' if cantidad == 1  else 'veces'
            print(f'{c} aparece {cantidad} {d}')
            visto.append(c)
            

histograma(cadena)

a aparece 8 veces
q aparece 1 vez
u aparece 2 veces
e aparece 1 vez
l aparece 3 veces
s aparece 1 vez
o aparece 1 vez
i aparece 2 veces
t aparece 1 vez
r aparece 1 vez
v aparece 1 vez
c aparece 2 veces
b aparece 1 vez
n aparece 1 vez


### Listas

A continuación vamos a extender lo que ya vimos de listas anteriormente. Como ya vimos las listas y las cadenas comparten varias características, como la posibilidad de indexarlas y de tomar rebanadas. La principal diferencia es que las listas pueden contener elementos de distintos tipos, como enteros, cadenas e incluso otras listas.


In [33]:
lista = [1, 'a', 1.0, [42, 7]]
lista

[1, 'a', 1.0, [42, 7]]

Una lista que contiene a una o más listas es llamada _anidada_. Otro ejemplo de lista anidada podría ser:

In [34]:
m = [[0, 1], [2, 3]]
m

[[0, 1], [2, 3]]

Dado que la lista _m_ es una lista de listas es necesario usar dos indices para acceder a cada entero almacenado en _m_. Veamos.


In [35]:
m[1] # el segundo elemento de la lista m es otra lista.

[2, 3]

In [36]:
m[1][0]  # el primer elemento de la segunda lista

2

###  Métodos de las listas

Python provee de varios _métodos_ que permiten operar sobre listas como el _método_ _append_ que permite agregar un elemento al final de una lista.

In [37]:
l = [] # crea una lista vacía
l

[]

In [38]:
l.append(10)
l.append(9)
l.append(8)

In [39]:
l

[10, 9, 8]

O el método _extend_ que permite agregar los elementos de una lista al final de otra lista

In [40]:
lista.extend(l)
lista

[1, 'a', 1.0, [42, 7], 10, 9, 8]

Ordenar elementos de una lista suele ser una tarea común en programación. En Python encontramos el método _sort_ que ordena los elementos de una lista.

In [41]:
lista = [1, 10, 100, 1000]
lista.sort(reverse=True)
lista

[1000, 100, 10, 1]

Otro método comunmente usado es _pop_ que devuelve un valor de una lista y lo elimina. Si no se usa ningún argumento, por defecto devolverá el último valor de la lista.

In [42]:
lista.pop()

1

In [43]:
lista # ahora lista no contiene el elemento 1

[1000, 100, 10]

Algo similar al método _pop_ es el comando _del_

In [44]:
del lista[0]
lista # el elemento con indice 0, es decir, el número 1000 ya no está en la lista

[100, 10]

También es posible eliminar elementos, indicando el elemento que se desea borrar y no el índice.

In [45]:
lista.remove(10) # se borró el número 4
lista

[100]

### Tuplas

Las tuplas son como las listas, pero son inmutables, es decir una vez creadas no pueden ser modificadas. 

En Python, las tuplas son creadas usando la sintaxis _(..., ..., ...)_ o _...,...,..._

In [46]:
tupla = (10, 20)
tupla, type(tupla)

((10, 20), tuple)

In [47]:
tupla = 10, 20
tupla, type(tupla)

((10, 20), tuple)

Es posible usar una tupla para asignar más de una variable al mismo tiempo.

In [48]:
x, y = tupla
x, y

(10, 20)

Si intentamos asignar un nuevo valor a un elemento de una tupla obtenemos un error:

In [49]:
tupla[0] = 42

TypeError: 'tuple' object does not support item assignment

Aveces suele ser necesario, intercambiar los valores de dos variables. Usando la asignación convencional se requiere de una variable temporaria. 

In [50]:
a, b = 1, 2
temp = a
a = b
b = temp

a, b

(2, 1)

Una version más simple es usar tuplas

In [51]:
a, b = 1, 2
a, b = b, a
a, b

(2, 1)

El número de variables a la izquierda debe coincidir con el número de valores a la derecha.

In [52]:
a, b = 1, 2, 3

ValueError: too many values to unpack (expected 2)

Dado que las tuplas y las listas son tan parecidas es común que surga la pregunta ¿Cúando es conveniente usar una y cuando la otra?

Al ser las tuplas inmutables, son más eficientes (en términos de memoria y procesador) que la listas. Por lo que si algún problema puede resolverse tanto con listas como por tuplas, entonces las tuplas se prefieren si la eficiencia es importante.

Una diferencia que puede resultar algo más sutil es la siguiente. Si bien las listas pueden contener elementos de distinto tipo (heterogéneas) su uso más común es cuando todos los elementos son del mismo tipo (homogéneas). Por otro lado es más común que las tuplas sean heterogéneas. En general en una tupla las posiciones tienen significado, mientras que las listas no. Por ejemplo para representar la localización geográfica de sensores podríamos usar una lista de tuplas, la longitud de la lista sería equivalente a la cantidad de sensores desplegados y usaríamos una tupla de tres elementos para indicar la latitud, longitud y altitud. En este ejemplo se puede ver que el ordenamiento de los sensores en la lista podría ser arbitrario, pero en cambio las posiciones en la tupla tienen un significado algo más preciso (ya sea por convención con nuestros pares o por que podríamos tener alguna función que espera un orden particular). Otro ejemplo es usar una lista de tuplas para guardar los nombres de nuestros contactos (una tupla por contacto), donde el primer elemento de la tupla sería el nombre y el segundo el apellido.

## Diccionarios

Los diccionarios son parecidos a las listas y a las tuplas, excepto que cada elemento es un par clave-valor. Otra diferencia es que los elementos de un diccionario no están ordenados. Es por ello que en vez de usar índices accedemos a un diccionario usando _claves_.

La sintaxis de los diccionarios es 
_{clave1 : valor1, clave2 : valor2, ...}_:

In [53]:
parametros = {"parametro1" : 1.0,
              "parametro2" : 2.0,
              "parametro3" : 3.0,}

parametros, type(parametros)

({'parametro1': 1.0, 'parametro2': 2.0, 'parametro3': 3.0}, dict)

In [54]:
parametros["parametro2"]

2.0

Si necesitamos agregar una nueva entrada basta con

In [55]:
parametros["parametro4"] = "D"
parametros

{'parametro1': 1.0, 'parametro2': 2.0, 'parametro3': 3.0, 'parametro4': 'D'}

In [56]:
def histograma(cadena):
    dic = dict()
    trans = str.maketrans('áéíóúü','aeiouu', ':,. ')
    cadena_nueva = cadena.lower().translate(trans)
    
    for c in cadena_nueva:
        if c not in dic:
            dic[c] = 1
        else:
            dic[c] += 1
        
            
    return dic

dic = histograma(cadena)
dic

{'a': 8,
 'q': 1,
 'u': 2,
 'e': 1,
 'l': 3,
 's': 1,
 'o': 1,
 'i': 2,
 't': 1,
 'r': 1,
 'v': 1,
 'c': 2,
 'b': 1,
 'n': 1}

In [57]:
for k, v in dic.items():
    d = 'vez' if v == 1  else 'veces'
    print(f'{k} aparece {v} {d}')

a aparece 8 veces
q aparece 1 vez
u aparece 2 veces
e aparece 1 vez
l aparece 3 veces
s aparece 1 vez
o aparece 1 vez
i aparece 2 veces
t aparece 1 vez
r aparece 1 vez
v aparece 1 vez
c aparece 2 veces
b aparece 1 vez
n aparece 1 vez


In [58]:
histograma(cadena)

{'a': 8,
 'q': 1,
 'u': 2,
 'e': 1,
 'l': 3,
 's': 1,
 'o': 1,
 'i': 2,
 't': 1,
 'r': 1,
 'v': 1,
 'c': 2,
 'b': 1,
 'n': 1}

-------------
### Ejercicio

1. Los diccionarios tienen un método `get` que toma una clave y un valor predeterminado. Si la clave aparece
en el diccionario, `get` devuelve el valor correspondiente, de lo contrario, devuelve el valor predeterminado.
Use `get` para escribir una versión más concisa de `histograma`. Debería poder eliminar la declaración `if`.

-------------