## Data Structures and Sequences : dict

#### 字典（Dictionary）
Dictionary 有時被稱為 "關聯記憶體" (associative memories) 或 "關聯矩陣" (associative arrays) 。不像序列是由一個範圍內的數字當作索引， dictionary 是由 key （鍵）來當索引， key 可以是任何不可變的型態；字串和數字都可以當作 key 。 Tuple 也可以當作 key 如果他們只含有字串、數字或 tuple；若一個 tuple 直接或間接地含有任何可變的物件，它就不能當作 key 。我們無法使用 list 當作 key ，因為 list 可以經由索引操作、切片操作或是方法像是 append() 和 extend() 來修改。

思考 dict 最好的方式是把它想成是一組鍵值對 (key: value pair) 的集合，其中 key 在同一個 dictionary（字典）裡必須是獨一無二的。使用一對大括號可創建一個空的字典 ：{}。將一串由逗號分隔的鍵值對置於大括號則可初始化字典。這同樣也是字典輸出時的格式。

Dict 主要的操作為藉由鍵來儲存一個值並且可藉由該鍵來取出該值。也可以使用 del 來刪除鍵值對。如果我們使用用過的鍵來儲存，該鍵所對應的較舊的值會被覆蓋。使用不存在的鍵來取出值會造成錯誤。

對字典使用 list(d) 會得到一個包含該字典所有鍵（key）的 list，其排列順序為插入時的順序。（若想要排序，則使用 sorted(d) 代替即可）。如果想確認一個鍵是否已存在於字典中，可使用關鍵字 in 。

In [99]:
empty = {}
type(empty) # => dict

a = {"one": 1, "two": 2, "three": 3} 
b = dict(one=1, two=2, three=3) 
c = dict([('one', 1), ('two', 2), ('three', 3)])
a == b == c # => True

True

In [32]:
d={num:num*num for num in range(1,10)}
print(d)

{1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81}


In [33]:
tel = {'jack': 4098, 'david': 4139}
tel['mark'] = 4127
tel

{'jack': 4098, 'david': 4139, 'mark': 4127}

In [34]:
del tel['david']
tel

{'jack': 4098, 'mark': 4127}

In [35]:
'mark' in tel

True

In [36]:
# 函式 dict() 可直接透過一串鍵值對序列來創建 dict
dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])

{'sape': 4139, 'guido': 4127, 'jack': 4098}

In [37]:
# 此外， dict comprehensions 也可以透過鍵與值的陳述式來創建 dict 
{x: x**2 for x in (2, 4, 6)}

{2: 4, 4: 16, 6: 36}

In [38]:
# 當鍵是簡單的字串時，使用關鍵字引數 (keyword arguments) 有時會較為簡潔
dict(sape=4139, guido=4127, jack=4098)

{'sape': 4139, 'guido': 4127, 'jack': 4098}

In [39]:
# 當對 dict 作迴圈時，鍵以及其對應的值可以藉由使用 items() 方法來同時取得
tel = dict(sape=4139, guido=4127, jack=4098)
for key, value in tel.items():
    print(f'{key}\'s tel number is {value}')

sape's tel number is 4139
guido's tel number is 4127
jack's tel number is 4098


In [40]:
# 當對序列作迴圈時，位置索引及其對應的值可以藉由使用 enumerate() 函式來同時取得
for i, v in enumerate(['A0', 'B1', 'C2']):
    print(i, v)

0 A0
1 B1
2 C2


In [41]:
# 要同時對兩個以上的序列作迴圈，可以將其以成對的方式放入 zip() 函式：
x = ['A','B','C']
y = ['D','E','F']
for i, j in zip(x, y):
    print(i,j)

A D
B E
C F


In [42]:
# 當 list 長度不一樣時
x = ['A','B','C']
y = ['D','E','F','G']
for i, j in zip(x, y):
    print(i,j)

A D
B E
C F


In [43]:
# 要對序列作反向的迴圈，首先先寫出正向的序列，在對其使用 reversed() 函式
for i in reversed(range(1, 10, 2)):
    print(i)

9
7
5
3
1


In [44]:
# 要以迴圈對序列作排序，使用 sorted() 函式會得到一個新的經排序過的 list ，但不會改變原本的序列
basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
for i in sorted(basket):
    print(i)    

apple
apple
banana
orange
orange
pear


In [45]:
# 對一個序列使用set()將去除重複的元素。對一個序列使用sorted()加set()則是按排序後順序循環遍歷序列中唯一元素的一種慣用方式。
basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
for f in sorted(set(basket)):
    print(f)

apple
banana
orange
pear


In [46]:
# Profundizando listas
# Listas son mutables
nombres1 = ['Juan', 'Karla', 'Pedro']
nombres2 = 'Laura María Gonzalo Ernesto'.split()
# Sumar listas
print(f'Sumar listas {nombres1 + nombres2}')
# Extender una lista con otra lista
nombres1.extend(nombres2)
print(f'Extender la lista1: {nombres1}')

# Lista de números
numeros1 = [10, 40, 15, 4, 20, 90, 4]
print(f'Lista original: {numeros1}')
# obtener el índice del primer elemento encontrado en una lista
# help(list.index)
print(f'Índice 4: {numeros1.index(4)}')

# Invertir el orden de los elementos de una lista
numeros1.reverse()
print(f'Lista invertida: {numeros1}')

# Ordenar los elementos de una lista
numeros1.sort()
print(f'Lista ordenada (ascendente): {numeros1}')
# Ordenar de manera descendente una lista
numeros1.sort(reverse=True)
print(f'Lista ordenada (descendente): {numeros1}')

# Obtener el valor min y max de una lista
print(f'Valor mínimo: {min(numeros1)}')
print(f'Valor máximo: {max(numeros1)}')

# Copiar los elementos de una lista
numeros2 = numeros1.copy()
# help(list.copy)
print(f'Misma referencia? {numeros1 is numeros2}')
print(f'Mismo contenido? {numeros1 == numeros2}')

# Podemos usar el constructor de la lista
numeros2 = list(numeros1)
print(f'Misma referencia? {numeros1 is numeros2}')
print(f'Mismo contenido? {numeros1 == numeros2}')

# slicing
numeros2 = numeros1[:]
print(f'Misma referencia? {numeros1 is numeros2}')
print(f'Mismo contenido? {numeros1 == numeros2}')

# Multiplicación listas
lista_multiplicacion = 5*[[2, 5]]
print(lista_multiplicacion)
print(f'Misma referencia: {lista_multiplicacion[0] is lista_multiplicacion[1]}')
print(f'Mismo contenido: {lista_multiplicacion[0] == lista_multiplicacion[1]}')
lista_multiplicacion[2].append(10)
print(lista_multiplicacion)

# Matrices en Python
matriz = [[10, 20], [30, 40, 50], [60, 70, 80, 90]]
print(f'Matriz original: {matriz}')
print(f'Renglón 0, Columna 0: {matriz[0][0]}')
print(f'Renglón 2, Columna 3: {matriz[2][3]}')
matriz[2][0] = 65
print(f'Matriz modificada: {matriz}')

Sumar listas ['Juan', 'Karla', 'Pedro', 'Laura', 'María', 'Gonzalo', 'Ernesto']
Extender la lista1: ['Juan', 'Karla', 'Pedro', 'Laura', 'María', 'Gonzalo', 'Ernesto']
Lista original: [10, 40, 15, 4, 20, 90, 4]
Índice 4: 3
Lista invertida: [4, 90, 20, 4, 15, 40, 10]
Lista ordenada (ascendente): [4, 4, 10, 15, 20, 40, 90]
Lista ordenada (descendente): [90, 40, 20, 15, 10, 4, 4]
Valor mínimo: 4
Valor máximo: 90
Misma referencia? False
Mismo contenido? True
Misma referencia? False
Mismo contenido? True
Misma referencia? False
Mismo contenido? True
[[2, 5], [2, 5], [2, 5], [2, 5], [2, 5]]
Misma referencia: True
Mismo contenido: True
[[2, 5, 10], [2, 5, 10], [2, 5, 10], [2, 5, 10], [2, 5, 10]]
Matriz original: [[10, 20], [30, 40, 50], [60, 70, 80, 90]]
Renglón 0, Columna 0: 10
Renglón 2, Columna 3: 90
Matriz modificada: [[10, 20], [30, 40, 50], [65, 70, 80, 90]]


In [47]:
# dict (key, value)
diccionario = {
    'IDE':'Integrated Development Environment',
    'OOP':'Object Oriented Programming',
    'DBMS':'Database Management System'
}
print(diccionario)
#largo
print(len(diccionario))
# acceder a un elemento (key)
print( diccionario['IDE'])
# otra forma de recuperar un elemento
print(diccionario.get('OOP'))
# modificando elementos
diccionario['IDE'] = 'integrated development environment'
print(diccionario)


{'IDE': 'Integrated Development Environment', 'OOP': 'Object Oriented Programming', 'DBMS': 'Database Management System'}
3
Integrated Development Environment
Object Oriented Programming
{'IDE': 'integrated development environment', 'OOP': 'Object Oriented Programming', 'DBMS': 'Database Management System'}


In [48]:
# Produndizando en diccionarios

# Los dic guardan un orden (a diferencia de un set)
diccionario = {'Nombre':'Juan','Apellido':'Perez','Edad':28}
print(diccionario)

# Los dic son mutables, pero las llaves deben ser inmutables
# diccionario = {[1,2]:'Valor1'}
# diccionario = {(1,2):'Valor1'}
print(diccionario)

# Se agrega una llave si no se encuentra
diccionario['Departamento'] = 'Sistemas'
print(diccionario)

# No hay valores duplicados en las llaves de un diccionario (si ya existe se reemplaza)
diccionario['Nombre'] = 'Juan Carlos'
print(diccionario)

# Recuperar un valor indicando una llave
print(diccionario['Nombre'])
# Si no encuentra la llave lanza una excepcion
# print(diccionario['nombre'])

# Método get recupera una llave, y si no existe NO lanza excepción
# además podemos regresar un valor en caso de que no exista la llave
print(diccionario.get('Nombres','No se encontró la llave'))
print(diccionario)

# setdefault sí modifica el diccionario, además se agregar un valor por default
nombre = diccionario.setdefault('Nombres','Valor por default')
print(nombre)
print(diccionario)

# Imprimir con pprint
from pprint import pprint as pp
# help(pp)
pp(diccionario, sort_dicts=False)

{'Nombre': 'Juan', 'Apellido': 'Perez', 'Edad': 28}
{'Nombre': 'Juan', 'Apellido': 'Perez', 'Edad': 28}
{'Nombre': 'Juan', 'Apellido': 'Perez', 'Edad': 28, 'Departamento': 'Sistemas'}
{'Nombre': 'Juan Carlos', 'Apellido': 'Perez', 'Edad': 28, 'Departamento': 'Sistemas'}
Juan Carlos
No se encontró la llave
{'Nombre': 'Juan Carlos', 'Apellido': 'Perez', 'Edad': 28, 'Departamento': 'Sistemas'}
Valor por default
{'Nombre': 'Juan Carlos', 'Apellido': 'Perez', 'Edad': 28, 'Departamento': 'Sistemas', 'Nombres': 'Valor por default'}
{'Nombre': 'Juan Carlos',
 'Apellido': 'Perez',
 'Edad': 28,
 'Departamento': 'Sistemas',
 'Nombres': 'Valor por default'}


In [49]:
numbers = [100, 200, 300, 400, 500]
students = ['Joe', 'Ronald', 'Ahmed', 'Marcelo', 'Alves']

In [50]:
new_dict = {x: y for (x, y) in zip(students, numbers)}
print(new_dict)

{'Joe': 100, 'Ronald': 200, 'Ahmed': 300, 'Marcelo': 400, 'Alves': 500}


In [51]:
numbers = [1, 5, 10, 15, 20, 25]
my_dictionary = {x: x ** 2 for x in numbers if x ** 2 % 4 == 0}
print(my_dictionary)

{10: 100, 20: 400}


dict

In [38]:
empty_dict = {}
d1 = {'a' : 'some value', 'b' : [1, 2, 3, 4]}

In [39]:
d1['b']

[1, 2, 3, 4]

In [40]:
d1[5] = 'some value'
d1['dummy'] = 'another value'
d1

{'a': 'some value',
 'b': [1, 2, 3, 4],
 5: 'some value',
 'dummy': 'another value'}

In [41]:
del d1[5]
ret = d1.pop('dummy')
ret

'another value'

In [42]:
list(d1.keys())
list(d1.values())

['some value', [1, 2, 3, 4]]

In [43]:
d1.update({'b' : 'foo', 'c' : 12})
d1

{'a': 'some value', 'b': 'foo', 'c': 12}

#### Creating dicts from sequences

mapping = {}
for key, value in zip(key_list, value_list):
    mapping[key] = value

In [44]:
mapping = dict(zip(range(5), reversed(range(5))))
mapping

{0: 4, 1: 3, 2: 2, 3: 1, 4: 0}

#### Default values

if key in some_dict:
    value = some_dict[key]
else:
    value = default_value

value = some_dict.get(key, default_value)

In [45]:
words = ['apple', 'bat', 'bar', 'atom', 'book']
by_letter = {}
for word in words:
    letter = word[0]
    if letter not in by_letter:
        by_letter[letter] = [word]
    else:
        by_letter[letter].append(word)
by_letter

{'a': ['apple', 'atom'], 'b': ['bat', 'bar', 'book']}

for word in words:
    letter = word[0]
    by_letter.setdefault(letter, []).append(word)

from collections import defaultdict
by_letter = defaultdict(list)
for word in words:
    by_letter[word[0]].append(word)

#### Valid dict key types

In [46]:
hash('string')
hash((1, 2, (2, 3)))
#hash((1, 2, [2, 3])) # fails because lists are mutable

-9209053662355515447

In [47]:
d = {}
d[tuple([1, 2, 3])] = 5
d

{(1, 2, 3): 5}

In [1]:
eggs = {'name':'Zophie', 'species':'cat','age':8}
ham = {'species':'cat', 'name':'Zophie','age':8}
eggs == ham

list(eggs.keys())
for k in eggs.keys():
    print(k)
print('-------------------')

list(eggs.values())
for k in eggs.values():
    print(k)
print('-------------------')

list(eggs.items())
for k in eggs.items():
    print(k)

name
species
age
-------------------
Zophie
cat
8
-------------------
('name', 'Zophie')
('species', 'cat')
('age', 8)


In [2]:
def printPicnic(itemsDict, leftWidth, rightWidth):
    print('PICNIC ITEMS'.center(leftWidth + rightWidth, '-'))
    for k, v in itemsDict.items():
        print(k.ljust(leftWidth, '.') + str(v).rjust(rightWidth))

picnicItems = {'sandwiches': 4, 'apples': 12, 'cups': 4, 'cookies': 8000}
printPicnic(picnicItems, 12, 5)
printPicnic(picnicItems, 20, 6)

---PICNIC ITEMS--
sandwiches..    4
apples......   12
cups........    4
cookies..... 8000
-------PICNIC ITEMS-------
sandwiches..........     4
apples..............    12
cups................     4
cookies.............  8000


In [3]:
#! python3
# pw.py - An insecure password locker program.

PASSWORDS = {'email': 'F7minlBDDuvMJuxESSKHFhTxFtjVB6',
             'blog': 'VmALvQyKAxiVH5G8v01if1MLZF3sdt',
             'luggage': '12345'}

import sys, pyperclip
if len(sys.argv) < 2:
    print('Usage: py pw.py [account] - copy account password')
    sys.exit()

account = sys.argv[1] # first command line arg is the account name

if account in PASSWORDS:
    pyperclip.copy(PASSWORDS[account])
    print('Password for ' + account + ' copied to clipboard.')
else:
    print('There is no account named ' + account)


There is no account named -f


- Star

In [4]:
import pprint

message = 'It was a bright cold day in April, and the clocks were striking thirteen.'
count = {}

for character in message:
    count.setdefault(character, 0)
    count[character] = count[character] + 1

pprint.pprint(count)

{' ': 13,
 ',': 1,
 '.': 1,
 'A': 1,
 'I': 1,
 'a': 4,
 'b': 1,
 'c': 3,
 'd': 3,
 'e': 5,
 'g': 2,
 'h': 3,
 'i': 6,
 'k': 2,
 'l': 3,
 'n': 4,
 'o': 2,
 'p': 1,
 'r': 5,
 's': 3,
 't': 6,
 'w': 2,
 'y': 1}
