**Modulo 1: Python**
* Instructor: [Juan Maniglia](https://juanmaniglia.github.io)

# Parte 1.3: Python Listas, Diccionarios, Sets y JSON

Como la mayoría de los lenguajes de programación modernos, Python incluye listas, conjuntos, diccionarios y otras estructuras de datos como tipos incorporados. La apariencia de sintaxis de ambos es similar a JSON. La compatibilidad con Python y JSON se analiza más adelante en este módulo. Este curso se centrará principalmente en listas, conjuntos y diccionarios.

* **Diccionario** - Un diccionario es una colección desordenada mutable que Python indexa con pares de clave y valor.
* **Lista** - Una lista es una colección ordenada mutable que permite elementos duplicados.
* **Set** - Un set es una colección desordenada mutable sin elementos duplicados.
* **Tupla** - Una tupla es una colección ordenada inmutable que permite elementos duplicados.

### Listas y Tuplas

Para un programa de Python, las listas y las tuplas son muy similares. Es posible arreglárselas como programador usando solo listas e ignorando tuplas. Tanto las listas como las tuplas contienen una colección ordenada de elementos.

La principal diferencia que verá sintácticamente es que una lista está encerrada entre llaves [] y una tupla está encerrada entre paréntesis ().

In [1]:
l = ['a', 'b', 'c', 'd']
t = ('a', 'b', 'c', 'd')

print(l)
print(t)

['a', 'b', 'c', 'd']
('a', 'b', 'c', 'd')


La principal diferencia que verá programáticamente es que una lista es mutable, lo que significa que el programa puede cambiarla. Una tupla es inmutable, lo que significa que el programa no puede cambiarla.

In [2]:
l[1] = 'Cambiado'
#t[1] = 'Cambiado' # Esto daría como resultado un error.

print(l)

['a', 'Cambiado', 'c', 'd']


Como muchos lenguajes, Python tiene una declaración for-each. Esta declaración le permite recorrer cada elemento de una colección, como una lista o una tupla.

In [3]:
# Iterar sobre una colección.
for s in l:
    print(s)

a
Cambiado
c
d


La función **enumerate** es útil para enumerar sobre una colección y tener acceso al índice del elemento en el que nos encontramos actualmente.

In [4]:
# Itere sobre una colección y sepa dónde está su índice. (¡Python comienza en cero!)
for i,l in enumerate(l):
    print(f"{i}:{l}")

0:a
1:Cambiado
2:c
3:d


Una **list** puede tener varios objetos agregados, como cadenas. Se permiten valores duplicados. **Tuples** no permiten que el programa agregue objetos adicionales después de la definición.

In [5]:
# Agregue artículos manualmente, las listas permiten duplicados
c = []
c.append('a')
c.append('b')
c.append('c')
c.append('c')
print(c)

['a', 'b', 'c', 'c']


Las colecciones ordenadas, como listas y tuplas, le permiten acceder a un elemento por su número de índice, como se hace en el siguiente código. Las colecciones desordenadas, como diccionarios y conjuntos, no permiten que el programa acceda a ellas de esta manera.

In [6]:
print(c[1])

b


Una **list** puede tener varios objetos agregados, como cadenas. Se permiten valores duplicados. Las tuplas no permiten que el programa agregue objetos adicionales después de la definición. Para la función de inserción, un índice, el programador debe especificar un índice. Estas operaciones no están permitidas para tuplas porque darían como resultado un cambio.

In [7]:
# Insertar
c = ['a', 'b', 'c']
c.insert(0, 'a0')
print(c)
# Remover
c.remove('b')
print(c)
# Remover por el index
del c[0]
print(c)

['a0', 'a', 'b', 'c']
['a0', 'a', 'c']
['a', 'c']


### Sets
Un **set** de Python contiene una colección desordenada de objetos, pero los conjuntos **no** permiten duplicados. Si un programa agrega un elemento duplicado a un conjunto, solo queda una copia de cada elemento en la colección. Agregar un elemento duplicado a un conjunto no genera un error.

In [8]:
s = set()
s = { 'a', 'b', 'c'}
s = set(['a', 'b', 'c'])
print(s)

{'b', 'a', 'c'}


Una **list** siempre se encierra entre llaves [], una **tuple** entre paréntesis () y, de manera similar, un **ser** se encierra entre llaves. Los programas pueden agregar elementos a un **set** a medida que se ejecutan. Los programas pueden agregar dinámicamente elementos a un **set** con la función **add**. Es importante tener en cuenta que la función **append** agrega elementos a las listas, mientras que la función **add** agrega elementos a un **set**.

In [9]:
# Agregue artículos manualmente, los conjuntos no permiten duplicados.
# Sets add, lists append.
c = set()
c.add('a')
c.add('b')
c.add('c')
c.add('c')
print(c)

{'b', 'a', 'c'}


### Diccionairo

Python proporciona un diccionario, que es esencialmente una colección de pares de nombre y valor. Los programas definen diccionarios usando llaves.

In [10]:
d = {'nombre': "Juan", 'direccion':"Recoletos 15"}
print(d)
print(d['nombre'])

if 'nombre' in d:
    print("Nombre es definido")

if 'edad' in d:
    print("Edad definida")
else:
    print("Edad no definida")

{'nombre': 'Juan', 'direccion': 'Recoletos 15'}
Juan
Nombre es definido
Edad no definida


Tenga cuidado de no intentar acceder a una clave no definida, ya que esto resultará en un error. Puede verificar si una clave está definida, como se demostró anteriormente. También puede acceder al directorio y proporcionar un valor predeterminado.

In [11]:
d.get('clave_desconocida', 'por defecto')

'por defecto'

También puede acceder a las claves y valores individuales de un diccionario.

In [12]:
d = {'name': "Juan", 'address':"Recoletos 15"}
# Todos las claves de diccionario
print(f"Clave: {d.keys()}")

# All of the values
print(f"Valores: {d.values()}")

Clave: dict_keys(['name', 'address'])
Valores: dict_values(['Juan', 'Recoletos 15'])


El siguiente código muestra un uso híbrido de diccionarios y listas.

In [14]:
clientes = [
    {"nombre": "Juan", "mascotas": ["Lius", "Draco", 
        "Kira"]},
    {"nombre": "Carlos Lopez", "mascotas": ["Pepe"]},
    {"nombre": "Vanessa"}
]

print(clientes)
print('------------------------------------')

for customer in clientes:
    print(f"{customer['nombre']}:{customer.get('mascotas', 'no mascotas')}")

[{'nombre': 'Juan', 'mascotas': ['Lius', 'Draco', 'Kira']}, {'nombre': 'Carlos Lopez', 'mascotas': ['Pepe']}, {'nombre': 'Vanessa'}]
------------------------------------
Juan:['Lius', 'Draco', 'Kira']
Carlos Lopez:['Pepe']
Vanessa:no mascotas


La variable **clientes** es una lista que contiene tres diccionarios que representan a los clientes. Puede pensar en estos diccionarios como registros en una tabla. Los campos de estos registros individuales son las claves del diccionario. Aquí las claves **nombre** y **mascotas** son campos. Sin embargo, el campo **mascotas** contiene una lista de nombres de mascotas. No hay límite en la profundidad que puede elegir para anidar listas y mapas.

## Listas Avanzadas

Varias funciones avanzadas están disponibles para las listas que se presentan en esta sección. Una de esas funciones es **zip**. Se pueden combinar dos listas en una sola lista con el comando **zip**.

In [15]:
a = [1,2,3,4,5]
b = [5,4,3,2,1]

print(zip(a,b))

<zip object at 0x00000288D35D01C8>


Para ver los resultados de la función **zip**, convertimos el objeto zip devuelto en una lista. Como puede ver, la función **zip** devuelve una lista de tuplas. Cada tupla representa un par de elementos que la función comprimió.

In [16]:
a = [1,2,3,4,5]
b = [5,4,3,2,1]

print(list(zip(a,b)))

[(1, 5), (2, 4), (3, 3), (4, 2), (5, 1)]


El método habitual para usar el comando zip está dentro de un bucle for. El siguiente código muestra cómo un bucle for puede asignar una variable a cada colección que el programa está iterando.

In [17]:
a = [1,2,3,4,5]
b = [5,4,3,2,1]

for x,y in zip(a,b):
    print(f'{x} - {y}')

1 - 5
2 - 4
3 - 3
4 - 2
5 - 1



Por lo general, ambas colecciones tendrán la misma longitud cuando se pasen al comando zip. No es un error tener colecciones de diferentes longitudes. Como ilustra el siguiente código, el comando zip solo procesará elementos hasta la longitud de la colección más pequeña.

In [18]:
a = [1,2,3,4,5]
b = [5,4,3]

print(list(zip(a,b)))

[(1, 5), (2, 4), (3, 3)]


Tambien se puede aplicar una función a todos los elementos de una lista

In [19]:
lst=[0,1,2,3,4,5,6,7,8,9]
lst = [x*10 for x in range(10)]
print(lst)

[0, 10, 20, 30, 40, 50, 60, 70, 80, 90]


Un diccionario también puede ser una comprensión. El formato general para esto es: 

```
dict_variable = {clave:valor para (clave,valor) en diccionario.items()}
```

Un uso común para esto es construir un índice para nombres de columnas simbólicas.

In [20]:
texto = ['col-cero','col-uno', 'col-dos', 'col-tres']
buscar = {clave:valor for (valor,clave) in enumerate(texto)}
print(buscar)

{'col-cero': 0, 'col-uno': 1, 'col-dos': 2, 'col-tres': 3}


Esto se puede usar para encontrar fácilmente el índice de una columna por nombre.

In [21]:
print(f'El índece de "col-dos" es {buscar["col-dos"]}')

El índece de "col-dos" es 2


### JSON

Los datos almacenados en un archivo CSV deben ser planos; es decir, debe caber en filas y columnas. La mayoría de las personas se refieren a este tipo de datos como estructurados o tabulares. Estos datos son tabulares porque el número de columnas es el mismo para cada fila. Puede que a las filas individuales les falte un valor para una columna; sin embargo, estas filas todavía tienen las mismas columnas.  

Este tipo de datos es conveniente para el aprendizaje automático porque la mayoría de los modelos, como las redes neuronales, también esperan que los datos entrantes tengan dimensiones fijas. La información del mundo real no siempre es tan tabular. Considere si las filas representan clientes. Estas personas pueden tener varios números de teléfono y direcciones. ¿Cómo describiría esos datos utilizando un número fijo de columnas? Sería útil tener una lista de estos cursos en cada fila que puede ser de una duración variable para cada fila o estudiante.

La notación de objetos de JavaScript (JSON) es un formato de archivo estándar que almacena datos en un formato jerárquico similar al lenguaje de marcado extensible (XML). JSON no es más que una jerarquía de listas y diccionarios. Los programadores se refieren a este tipo de datos como datos semiestructurados o datos jerárquicos. El siguiente es un archivo JSON de muestra.

```
{
  "Nombre": "Juan",
  "Apellido": "Maniglia",
  "Vivo": verdadero,
  "Edad": 32,
  "Direccion": {
    "Calle": "Recoletos 15",
    "Ciudad": "Madrid",
    "Comunidad": "Madrid",
    "CodigoPostal": "28004"
  },
  "Telefono": [
    {
      "tipo": "casa",
      "número": "910 555-1234"
    },
    {
      "tipo": "oficina",
      "número": "910 555-4567"
    },
    {
      "tipo": "móvil",
      "número": "665 469-521"
    }
  ],
  "hijos": [],
  "Esposa": "Vanessa"
}
```

El archivo anterior puede parecerse al código de Python. Puede ver llaves que definen diccionarios y corchetes que definen listas. JSON requiere que haya un solo elemento raíz. Una lista o diccionario puede cumplir este papel. JSON requiere comillas dobles para encerrar cadenas y nombres. Las comillas simples no están permitidas en JSON.

Los archivos JSON son siempre una sintaxis legal de JavaScript. JSON también es generalmente válido como código de Python, como se demuestra a continuación.

In [23]:
jsonHardCoded = {
  "Nombre": "Juan",
  "Apellido": "Maniglia",
  "Vivo": True,
  "Edad": 32,
  "Direccion": {
    "Calle": "Recoletos 15",
    "Ciudad": "Madrid",
    "Comunidad": "Madrid",
    "CodigoPostal": "28004"
  },
  "Telefono": [
    {
      "tipo": "casa",
      "número": "910 555-1234"
    },
    {
      "tipo": "oficina",
      "número": "910 555-4567"
    },
    {
      "tipo": "móvil",
      "número": "665 469-521"
    }
  ],
  "hijos": [],
  "Esposa": "Vanessa"
}

En general, es mejor leer JSON desde archivos, cadenas o Internet que codificar, como se demuestra aquí. Sin embargo, para estructuras de datos internas, a veces puede resultar útil dicha codificación.


Python tiene soporte para JSON. Cuando un programa de Python carga un JSON, se devuelve la lista raíz o el diccionario, como se demuestra en el siguiente código.

In [22]:
import json

json_string = '{"nombre":"Juan","apellido":"Maniglia"}'
obj = json.loads(json_string)
print(f"Nombre: {obj['nombre']}")
print(f"Apellido: {obj['apellido']}")

Nombre: Juan
Apellido: Maniglia
