#Colecciones
Una colección permite agrupar varios objetos bajo un mismo nombre. Por ejemplo, si necesitamos almacenar en nuestro programa los nombres de unos alumnos, será más conveniente ubicarlos a todos dentro de una misma colección de nombre alumnos, en lugar de crear los objetos alumno1, alumno2, etc.

En Python existen tres colecciones básicas, a saber: las listas, las tuplas y los diccionarios.

##Listas
Una lista es un conjunto ordenado de objetos. Por objetos entendemos cualquiera de los tipos de dato ya mencionados, incluso otras listas.

Para crear una lista, especificamos sus elementos entre corchetes y separados por comas.

In [None]:
lenguajes = ["Python", "Java", "C", "C++"]

Dado que se trata de una colección ordenada, accedemos a cada uno de los elementos a partir de su posición, comenzando desde el 0.
##IMPORTANTE 
El primer elemento está en la posición 0

In [None]:
lenguajes[0]

In [None]:
lenguajes[1]

(En Python, las cadenas de caracteres pueden estar formadas tanto por comillas dobles como por comillas simples).

La posición de un elemento, también conocida como índice, aumenta de izquierda a derecha cuando éste es positivo. Indicando un número negativo, los elementos se obtienen de derecha a izquierda.

In [None]:
lenguajes[-1]

In [None]:
lenguajes[-2]

In [None]:
lenguajes[0] == lenguajes [-4]

Para cambiar un elemento, combinamos la nomenclatura descrita con la asignación.

In [None]:
lenguajes[1] = "Rust"
lenguajes

Para eliminar un elemento, utilizamos la palabra reservada del.

In [None]:
del lenguajes[1]
lenguajes

Fíjense que cuando un elemento es eliminado, a excepción del último, todos los que lo suceden se ruedan una posición hacia la izquierda.

La operación inversa es la de insertar un elemento en una posición determinada, desplazando el resto que le sucede una posición hacia la derecha, vía el método insert().

In [None]:
# Insertar la cadena "Elixir" en la posición 1.
lenguajes.insert(1, "Elixir")
lenguajes

Por último, la operación más común es la de agregar un elemento al final de la lista. Para ello empleamos append().

In [None]:
lenguajes.append("Haskell")
lenguajes


##Tuplas
Las tuplas, al igual que las listas, son colecciones ordenadas. No obstante, a diferencia de éstas, son inmutables. Es decir, una vez asignados los elementos, no pueden ser alterados. En términos funcionales, podría decirse que las tuplas son un subconjunto de las listas, por cuanto soportan las operaciones con índices para acceder a sus elementos, pero no así las de asignación.

In [None]:
# Indicamos los elementos entre paréntesis.
lenguajes = ("Python", "Java", "C", "C++")
lenguajes[0]

In [None]:
lenguajes[-1]

Un intento por eliminar un elemento de una tupla o asignarle un nuevo valor arrojará un error.

Ahora bien, si las listas hacen todo lo que hace una tupla, ¿para qué, entonces, existen las tuplas? Sencillamente porque una tupla, justamente por carecer de todas las funcionalidades de mutación de elementos, es un objeto más liviano y que se crea más rápido.

La función del programador será la de dirimir si para una determinada colección ordenada de objetos le conviene más una lista o una tupla, según sus elementos deban ser alterados en el futuro o no.

##Diccionarios
Los diccionarios, a diferencia de las listas y las tuplas, son colecciones no ordenadas de objetos. Además, sus elementos tienen una particularidad: siempre conforman un par clave-valor. Es decir, cuando añadimos un valor a un diccionario, se le asigna una clave única con la que luego se podrá acceder a él (pues la posición ya no es un determinante).

Para crear un diccionario, indicamos los pares clave-valor separados por comas y estos, a su vez, separados por dos puntos.

In [None]:
d = {"Python": 1991, "C": 1972, "Java": 1996}

En este ejemplo, creamos un diccionario con tres elementos, cuyas claves son "Python", "C" y "Java" y sus valores los años en los que fueron creados, a saber: 1991, 1972 y 1996, respectivamente.

Para acceder a cualquiera de los valores, debemos indicar su clave entre corchetes.

In [None]:
d["Java"]

1996

Las operaciones de añadir, modificar o eliminar valores son similares a las de las listas.

In [None]:
# Añadir un par clave/valor.
d["Elixir"] = 2011

In [None]:
# Modificar uno existente.
d["Python"] = 3000

In [None]:
# Eliminar.
del d["C"]
d

Las claves típicamente serán números o cadenas, aunque bien podrían ser de cualquier otro tipo de dato inmutable (todos los vistos hasta ahora son inmutables, a excepción de las listas y los diccionarios). Además, nunca puede haber claves repetidas, ya que actúan como identificadores únicos para un valor determinado. Los valores, en cambio, pueden ser de cualquier tipo de dato, ¡incluyendo otros diccionarios!

#Operaciones comunes en colecciones
Hemos visto cómo del se aplica tanto a listas como a diccionarios. Existen varias funciones que operan sobre distintos tipos de colecciones. Por ejemplo, la función incorporada len() retorna el número de elementos en una colección.

In [None]:
len([1, 2, 3, 4])

In [None]:
len({"Python": 1991, "C": 1972})

In [None]:
len(("¡Hola, mundo!",))

1

En la tercera llamada pasamos como argumento una tupla que contiene un solo elemento (una cadena). No obstante, dado que para definir tuplas se emplean paréntesis, es necesario añadir una coma al final para que Python entienda que se trata de una tupla en lugar de una expresión (los paréntesis también son utilizados para agrupar expresiones, como en matemática).

Una cadena es, en rigor, una colección de caracteres. Por ello también soporta las operaciones de acceso a sus elementos (¡no así las de asignación, ya que son inmutables!).

In [None]:
s = "¡Hola, mundo!"
s[4]

In [None]:
len(s)

Por último, para saber si un elemento está dentro de una colección, empleamos la palabra reservada in.

In [None]:
10 in (1, 2, 3, 4)


In [None]:
"mundo" in "¡Hola, mundo!"

In [None]:
"Python" in {"Python": 1991, "C": 1972}

Nótese que el operador in en los diccionarios actúa sobre las claves, no sobre los valores.

#«Slicing»
Las listas, tuplas y cadenas soportan una propiedad llamada slicing. No hay un concepto en español que haya ocupado definitivamente su lugar, así que mantendremos el término original. Se trata de una funcionalidad de las colecciones ordenadas que nos permite acceder a un subconjunto de ellas. Consideremos la siguiente lista.

In [None]:
lenguajes = ["Python", "C", "C++", "Java", "Elixir"]

Usando la nomenclatura coleccion[inicio:fin], podemos obtener una porción de ella según los límites indicados.

In [None]:
# Obtiene desde el segundo elemento (índice 1) inclusive hasta el cuarto.
lenguajes[1:4]

Si inicio o fin están ausentes, por defecto serán 0 y len(coleccion) (es decir, todos los elementos de la colección), respectivamente.

In [None]:
lenguajes[1:]


In [None]:
lenguajes[1:len(lenguajes)]

In [None]:
lenguajes[:4]

In [None]:
lenguajes[0:4]

In [None]:
lenguajes[:]

In [None]:
lenguajes[0:len(lenguajes)]

El segundo indicador (fin) puede ser un número negativo, lo cual comienza la cuenta desde el final de la colección.

In [None]:
# Todos los elementos a excepción del último.
lenguajes[:-1]

Un tercer número indica el intervalo según el cual se obtienen elementos de la colección (1 por defecto).

In [None]:
lenguajes[::2]

In [None]:
lenguajes[1:-1:2]

Si el intervalo es negativo, los elementos se empiezan a obtener en modo inverso, de modo que coleccion[::-1] retorna todos sus elementos al revés.

In [None]:
lenguajes[::-1]

Como mencionamos al principio, estas propiedades son también aplicables a tuplas y cadenas, del mismo modo.

In [None]:
s = "¡Hola, mundo!"
s[1::2]

In [None]:
s[::-1]

#«Unpacking»
La traducción más fiel para este concepto sería desempaquetamiento. La propiedad de unpacking nos permite "desempaquetar" los elementos de una colección en variables individuales.

In [None]:
t = (1, 2, 3)
a, b, c = t
a

In [None]:
b

In [None]:
c

¡Sencillo! Si no ha quedado lo suficientemente claro, el código anterior es similar al siguiente.

In [None]:
t = (1, 2, 3)
a = t[0]
b = t[1]
c = t[2]

Para que esta operación no arroje un error, el número de objetos separados por comas a la izquierda del signo igual debe coincidir con el número de elementos dentro de la colección a la derecha. Aunque vía slicing podemos, por ejemplo, desempaquetar los primeros dos elementos.

In [None]:
a, b = t[:2]

#O bien los últimos dos.

b, c = t[-2:]

Esta propiedad de las colecciones ordenadas nos permitirá hablar de una última cosa.

#Enumerando colecciones
Python incluye una función llamada enumerate(), que obtiene como argumento una colección y retorna sus elementos enumerados, como se observa a continuación.

In [None]:
lenguajes = ["Python", "C", "C++", "Java"]
list(enumerate(lenguajes))

(enumerate() opera del mismo modo que range(), en el sentido que no retorna una lista sino un objeto iterable cuyos elementos son generados al tiempo en que son utilizados, para optimizar el rendimiento del código. Por ello, para ver todos sus elementos al mismo tiempo, es necesario convertirlo a una lista).

El valor de retorno es un iterable cuyos elementos son tuplas, dentro de las cuales el primer elemento indica la posición del segundo en la colección pasada como argumento.

Ahora bien, esto es sumamente útil cuando, al recorrer una colección con un bucle for, estamos interesados tanto en los elementos como en sus posiciones.

In [None]:
for i, lenguaje in enumerate(lenguajes):
  print(i, lenguaje)

Lo cual es mucho más pythonico y rápido que:

In [None]:
# ¡¡¡Menos legible y más lento!!!
for i in range(len(lenguajes)):
  print(i, lenguajes[i])


https://recursospython.com/guias-y-manuales/30-metodos-de-las-cadenas/


#Métodos de las cadenas
El tipo de dato str es una clase incorporada cuyas instancias incluyen variados métodos ─más de treinta─ para analizar, transformar, separar y unir el contenido de las cadenas de caracteres. Detallamos los que consideramos más relevantes para tener siempre a mano.

##Métodos de análisis
El método count() retorna el número de veces que se repite un conjunto de caracteres especificado.

In [None]:
s = "Hola mundo"
s.count("Hola")

Los métodos find() e index() retornan la ubicación (comenzando desde el cero) en la que se encuentra el argumento indicado.

In [None]:
s.find("mundo")

In [None]:
s.index("mundo")

Difieren en que este último lanza ValueError cuando el argumento no es encontrado, mientras que el primero retorna -1.

In [None]:
s.find("world")

In [None]:
s.index("world")

En ambos métodos la búsqueda ocurre de izquierda a derecha. Para buscar un conjunto de caracteres desde el final, utilícense del mismo modo rfind() y rindex().

In [None]:
s = "C:/python36/python.exe"
s.find("/")  # Retorna la primera ocurrencia.

In [None]:
s.rfind("/")  # Retorna la última.

startswith() y endswith() indican si la cadena en cuestión comienza o termina con el conjunto de caracteres pasados como argumento, y retornan True o False en función de ello.

In [None]:
s = "Hola mundo"
s.startswith("Hola")

In [None]:
s.endswith("mundo")

In [None]:
s.endswith("world")

Ambos métodos son preferidos ante la opción de emplear slicing.

In [None]:
# Se prefiere startswith().
s[:4] == "Hola"

Los métodos isdigit(), isnumeric() e isdecimal() determinan si todos los caracteres de la cadena son dígitos, números o números decimales.

In [None]:
"1234".isnumeric()

In [None]:
"1234".isdecimal()

In [None]:
"abc123".isdigit()

Si bien estas definiciones resultam a priori similares, no lo son. La primera, isdigit(), considera caracteres que pueden formar números, incluidos aquellos correspondientes a lenguas orientales. isnumeric() es más amplia, pues incluye también caracteres de connotación numérica que no necesariamente son dígitos (por ejemplo, una fracción). La última, isdecimal(), es la más restrictiva al tener en cuenta únicamente números decimales; esto es, formados por dígitos del 0 al 9.

Las siguientes seis funciones de análisis son bastante explicativas por sí mismas.

In [None]:
# Determina si todos los caracteres son alfanuméricos.
"abc123".isalnum()

In [None]:
# Determina si todos los caracteres son alfabéticos.
"abcdef".isalpha()

In [None]:
"abc123".isalpha()

In [None]:
# Determina si todas las letras son minúsculas.
"abcdef".islower()

In [None]:
# Mayúsculas.
"ABCDEF".isupper()

In [None]:
# Determina si la cadena contiene todos caracteres imprimibles.
"Hola \t mundo!".isprintable()

In [None]:
# Determina si la cadena contiene solo espacios.
"Hola mundo".isspace()

In [None]:
"    ".isspace()

#Métodos de transformación
Recuérden que las cadenas son inmutables; por ende, todos los métodos a continuación no actúan sobre el objeto original sino que retornan uno nuevo.

capitalize() retorna la cadena con su primera letra en mayúscula.

In [None]:
"hola mundo".capitalize()
'Hola mundo'

encode() codifica la cadena con el mapa de caracteres especificado y retorna una instancia del tipo bytes.

In [None]:
"Hola mundo".encode("utf-8")
b'Hola mundo'

Los métodos center(), ljust() y rjust() alinean una cadena en el centro, la izquierda o la derecha respectivamente. Toman un argumento, la cantidad de caracteres respecto de la cual se producirá la alineación.

In [None]:
"Hola".center(10)

In [None]:
"Hola".ljust(10)

In [None]:
"Hola".rjust(10)

Estos métodos son especialmente útiles al imprimir en forma de tabla para que ésta se mantenga alineada. Un segundo argumento indica con qué caracter se deben llenar los espacios vacíos (por defecto un espacio en blanco).

In [None]:
"Hola".center(10, "*")

lower() y upper() retornan una copia de la cadena con todas sus letras en minúsculas o mayúsculas según corresponda.

In [None]:
"Hola Mundo!".lower()

In [None]:
"Hola Mundo!".upper()

swapcase(), por su parte, cambia las mayúsculas por minúsculas y viceversa.

In [None]:
"Hola Mundo!".swapcase()

Las funciones strip(), lstrip() y rstrip() remueven los espacios en blanco que preceden y/o suceden a la cadena.

In [None]:
s = " Hola mundo! "
s.strip()

In [None]:
# Remueve los de la derecha.
s.rstrip()

In [None]:
# Remueve los de la izquierda.
s.lstrip()

Por último, el método replace() ─ampliamente utilizado─ reemplaza una cadena por otra.

In [None]:
s = "Hola mundo"
s.replace("mundo", "world")

#Métodos de separación y unión
El método de división de una cadena según un caracter separador más empleado es split(), cuyo separador por defecto son espacios en blanco y saltos de línea.

In [None]:
"Hola mundo!\nHello world!".split()

O bien, para separar únicamente según saltos de línea:

In [None]:
# Equivalente a split("\n").
"Hola mundo!\nHello world!".splitlines()

Un segundo argumento en split() indica cuál es el máximo de divisiones que puede tener lugar (-1 por defecto para representar una cantidad ilimitada).

In [None]:
"Hola mundo hello world".split(" ", 2)

Un segundo método de separación es partition(), que retorna una tupla de tres elementos: el bloque de caracteres anterior a la primera ocurrencia del separador, el separador mismo, y el bloque posterior.

In [None]:
s = "Hola mundo. Hello world!"
s.partition(" ")

rpartition() opera de forma similar, pero realizando la búsqueda de derecha a izquierda.

In [None]:
s.rpartition(" ")

Por último, el método join() ─sumamente útil─, que debe ser llamado desde una cadena que actúa como separador para unir dentro de una misma cadena resultante los elementos de una lista.

In [None]:
" ".join(["Hola", "mundo"])


In [None]:
", ".join(["C", "C++", "Python", "Java"])

Como puede observarse, split() y join() son exactamente contrarios.

In [None]:
sep = " "
sep.join("Hola mundo!".split(sep))

#Formando cadenas de caracteres

Construir una única cadena de caracteres a partir de otras más pequeñas es algo que estarás haciendo practicamente siempre sea en Python o en cualquier otro lenguaje. Por esta razón, tener un buen dominio de las herramientas para llevarlo a cabo es fundamental para diseñar un mejor código: más eficiente, más legible. En este artículo intentaré transmitirle al lector los diversos métodos del formateo de cadenas y, por supuesto, recomendarte la manera «estándar» o correcta de hacerlo en Python.

Comencemos por observar una de las formas más básicas de concatenar dos cadenas.


In [None]:
nombre = "Juan"
"Tu nombre es: " + nombre

El operador de suma, cuando es utilizado entre dos cadenas, opera añadiendo la segunda inmediatamente luego de la primera. Generalmente este método es correcto y eficiente para pequeñas uniones como la anterior, pero se torna un tanto molesto cuando intentamos conformar una cadena a partir de numerosos fragmentos.

In [None]:
apellido = "Pérez"
sexo = "Masculino"
"Tu nombre es: " + nombre + ". Apellido: " + apellido + ". Sexo: " + sexo + "."

Incluso deberemos convertir (utilizando la función str) cualquier objeto que no sea una cadena para que la operación se concrete; por ejemplo, un entero.

In [None]:
edad = 20  #Se interpreta como número entero (int), no como texto (str)
"Tu nombre es " + nombre + " y tienes " + str(edad) + " años."

##Nuevo método en Python 3.6 para crear cadenas de caracteres
En Python 3.6 surgen las denominadas «f-strings» o «cadenas-f». Cuando una cadena esté precedida por una «f», utilizando llaves se podrán ubicar expresiones dentro de la misma que serán luego ejecutadas.

In [None]:
nombre = "Juan"
edad = 20
altura = 1.75
f"Te llamas {nombre}, tienes {edad} años y mides {altura} metros."

Nótese que son expresiones, no simples identificadores, a diferencia de los métodos anteriores.

In [None]:
f"Tu nombre al revés es {nombre[::-1]}."

In [None]:
f"Dentro de 5 años tendrás {edad + 5} años."