# tuplas y strings

# Cadenas (_strings_)

Una cadena es una secuencia de caracteres. Las cadenas son similares a las listas pero más específicas, ya que solo puede contener caracteres.

Para definir una cadena en Python usamos comillas simples `'`, dobles `"` o triples. Lo más común es usar comillas simples

In [23]:
'hola'

'hola'

In [24]:
 type('hola')

str

Las comillas simples o dobles son totalmente equivalentes. Mientras que las triples son usadas cuando necesitamos escribir una cadena en varias lineas. Recuerden cuando vimos `docstrings`.

Vamos usar  un aforismo de Jorge Wagensberg para ejemplificar como trabajar con cadenas bajo Python

In [29]:
cadena = 'A más cómo, menos por qué'

Como ya dijimos las listas y las cadenas comparten características, por ejmplo ambas pueden ser indexadas

In [33]:
cadena[3]

'á'

Además podemos hacer otras operaciones como tomar rebanadas _slices_

In [80]:
cadena[:5]

'A más'

Esto nos podría servir para crear una función que detecte palíndromos.

In [41]:
def es_palindromo(palabra):
    return palabra == palabra[::-1]

es_palindromo('somos') # Luz azul

True

Un problema con este función es que falla con frases como `Luz azul`. Hay dos razones para esto

1. un espacio es un caracter válido para Python
2. las mayusculas son caracteres distintos a las minúsculas

Python nos ofrece una herramienta muy potente para mejorar la función `es_palindromo`, los métodos de cadenas.

Un método es similar a una función, pero con una sintáxis diferente. Cuando veamos programación orientada a objetos quedará claro su significado.

Las cadenas tienen muchos métodos, por ejemplo `split` devuelve una lista de strings por defecto la lista es generada "separando" un strings cada vez que se encuentra un espacio en blanco.

In [82]:
cadena.split()

['A', 'más', 'cómo,', 'menos', 'por', 'qué']

Este comportamiento lo podemos cambiar pasando como argumento el caracter que queremos usar como separador.

In [85]:
cadena.split(',')

['A más cómo', ' menos por qué']

Otro método es `lower` que tiene como efecto devolver una nueva cadena donde todos los caracteres son minúsculas

In [88]:
'LuZ AzUl'.lower()

'luz azul'

otro método es replace que nos permite reeplazar caracteres, incluso podemos reemplazar un espacio en blanco por nada.

In [51]:
'Luz azul'.replace(' ', '')

'Luzazul'

Combinando estos dos últimos métodos podemos crear una versión más versatil de `es_palindromo`.

In [53]:
def es_palindromo(palabra):
    nueva_palabra = palabra.lower().replace(' ', '')  # es posible concatenar métodos
    return nueva_palabra == nueva_palabra[::-1]

es_palindromo('Luz azul')

True

Podríamos querer que la función `es_palindromo` nos devuelva un mensaje más amigable que True o False. Una opción que la función no devuelva ningún valor si no que imprima un mensaje, por ejemplo

In [60]:
def es_palindromo(palabra):
    nueva_palabra = palabra.lower().replace(' ', '')
    if nueva_palabra == nueva_palabra[::-1]:
        print(f'{palabra} es un palíndromo')
    else:
        print(f'{palabra} no es un palíndromo')
        
es_palindromo('Luz azul')

Luz azul es palíndromo


El ejemplo anterior anterior muestra lo que se llama formateo de cadenas, hay varias formas de dar formato a cadenas (referencia), en el ejeplo anterior hemos usado lo que se conoce como f-strings, que es la forma más nueva (solo funciona en Python 3.6 en adelante). Las f-strings nos permite crear strings usando variables (en este caso la variable `palabra`) y también nos permite pasar expresiones de Python y darle formato a las al resultado de esas expresiones, como se puede ver en el siguiente ejemplo.

In [65]:
def es_palindromo(palabra):
    nueva_palabra = palabra.lower().replace(' ', '')
    if nueva_palabra == nueva_palabra[::-1]:
        print(f'{palabra} es un palíndromo de {len(nueva_palabra):03d} caracteres')
    else:
        print(f'{palabra} no es un palíndromo')
        
es_palindromo('Luz azul')

Luz azul es un palíndromo de 007 caracteres


Fijense que `len()` funciona con las cadenas igual que con las listas. el formato `03d`, quiere decir que la variable es un entero (d) y que use 3 espacios para representar a ese entero. Si no hay suficientes dígitos complete con ceros. Existen varias otras opciones para dar formato como:

In [68]:
f'{3.1415:.2f}'

'3.14'

Las cadenas son iterables (al igual que las listas). Por ejemplo si estuvieramos interesados en saber la frecuencia con la que aparecen caracteres en una cadena podríamo escribir.

In [121]:
def frecuencia(cadena):
    visto = []
    cadena_nueva = cadena.lower().replace(' ', '')
    for c in cadena_nueva:
        if c not in visto:
            print(f'{c} aparece {cadena_nueva.count(c)} veces')
            visto.append(c)

frecuencia(cadena)

a aparece 1 veces
m aparece 3 veces
á aparece 1 veces
s aparece 2 veces
c aparece 1 veces
ó aparece 1 veces
o aparece 3 veces
, aparece 1 veces
e aparece 1 veces
n aparece 1 veces
p aparece 1 veces
r aparece 1 veces
q aparece 1 veces
u aparece 1 veces
é aparece 1 veces


Podemos mejorar algunos aspectos de esta función, por ejemplo unificar caracteres con y sin tilde. y eliminar signos de puntuación no solo espacios en blanco. Para ello vamos a usar el método `maketrans` que nos permite crear una tabla de correspondencia entre el primer y segundo argumento. El tercer argumento indica los caracteres que sean reemplazados por nada. Otro truco de la siguiente función es que usa "vez" y "veces" según corresponda (queda como ejercicio explicar como se logra esto).

In [123]:
def frecuencia(cadena):
    visto = []
    trans = str.maketrans('áéíóúü','aeiouu', ':,. ')
    cadena_nueva = cadena.lower().translate(trans)
    for c in cadena_nueva:
        if c not in visto:
            cantidad = cadena_nueva.count(c)
            d = 'vez' if cantidad == 1  else 'veces'
            print(f'{c} aparece {cantidad} {d}')
            visto.append(c)
            

frecuencia(cadena)

a aparece 2 veces
m aparece 3 veces
s aparece 2 veces
c aparece 1 vez
o aparece 4 veces
e aparece 2 veces
n aparece 1 vez
p aparece 1 vez
r aparece 1 vez
q aparece 1 vez
u aparece 1 vez


Una diferencia con las listas es que las cadenas son inmutables, es decir una vez creada no pueden ser modificacas. Por lo que siguiente operación es inválida

In [None]:
cadena[0] = 'f' 

El error nos dice que el `objeto str` (en este caso `cadena`) no soporta la operación de asignación de item.

In [99]:
', '.join(['trenes', 'camiones', 'tractores'])

'trenes, camiones, tractores'

In [92]:
cadena.isalpha() #  devuelve verdadero si los caracteres son alfabéticos

False

In [93]:
cadena[:4].isalpha() 

True

In [94]:
'42a'.isalnum()  # devuelve verdadero si los caracteres son alfanuméricos

True

In [95]:
'42a'.isnumeric()  # devuelve verdadero si los caracteres son numéricos

False

In [96]:
'hola'.startswith('hola')

True

## Operadores válidos para cadenas

Usando el operador `in` podemos preguntar si un caracter (o una subcadena) está contenido en una cadena

In [38]:
'h' in cadena

True

In [39]:
'hola' in cadena

True

In [43]:
def in_both(word1, word2):
    for letter in word1:
        if letter in word2:
            print(letter)

in_both('peras', 'manzanas')

a
s


# Tuplas

Una tupla es una colecciones de valores, los valores pueden ser de cualquier tipo en ese sentido las tuplas se parecen a las listas, pero las tuplas son inmutables y en ese sentido se parecen a las cadenas.

In [103]:
una_tupla = 42, 23, 13
una_tupla

(42, 23, 13)

In [102]:
Aunque no es necesario es común encerrar una tupla entre paréntesis

(42, 23, 13)

In [106]:
otra_tupla = 42, 23, 13

Ambas formas son equivalentes:

In [109]:
una_tupla == otra_tupla

True

In [110]:
t1 = 'a',
t2 = ('a')

type(t1), type(t2)

(tuple, str)

In [112]:
t = tuple('hola mundo')
t

('h', 'o', 'l', 'a', ' ', 'm', 'u', 'n', 'd', 'o')

La mayoría de las operaciones válidas para listas lo son también para tuplas

In [113]:
t[5]

'm'

In [115]:
t[:4]

('h', 'o', 'l', 'a')

Excepto las que modifican una tupla, ya que como dijimos anterioremente las tuplas son inmutables

In [120]:
t[0] = 'j'

TypeError: 'tuple' object does not support item assignment

## Asignación de tuplas

In [124]:
a, b = 3, 45

a, b

(3, 45)

La cantidad de elementos a ambos lados del `=` deben ser los mismos, caso contrario obtendremos un error

In [132]:
a, b, = 3, 45, 2

ValueError: too many values to unpack (expected 2)

Salvo que usemos la siguiente sintáxis

In [134]:
a, *b, = 3, 45, 2
a, b

(3, [45, 2])

In [136]:
email = 'monty@python.org'
usuario, dominio = email.split('@')

usuario, dominio

('monty', 'python.org')

Las funciones en Python solo pueden devolver un solo valor, por lo que uno podría pensar que la siguiente no es una función válida. Sin embargo la siguiente función si es valida, por que la función efectivamente devuelve un solo valor, una tupla con dos elementos.

In [142]:
def min_max(t):
    return min(t), max(t)

min_max([0, 13, 42, 100])  ## use la función type para probar que está función devuelve una tupla

(0, 100)