# Diccionarios

Los diccionarios son similares a las listas, una de las diferencias es que para indexar una lista solo es posible usar enteros, en cambio para indexar un diccionario podemos usar otros tipos, por ejemplo cadenas (_strings_). 

Un diccionario es una forma de _mapear_ un conjuntos de índices llamados _claves_ (_keys_) y un conjunto de valores (values). A cada par clave-valor (key-value) se le suele llamar _item_.

Podemos crear un diccionario vacio de la siguiente forma:

In [24]:
diccionario = {}  # o también diccionario = dict()
type(diccionario)

dict

Y luego podemos agregar elementos especificando la clave entre `[]` y asignando un valor  mediante el signo `=`

In [25]:
diccionario['Santiago'] = 'Maldonado'

diccionario

{'Santiago': 'Maldonado'}

Al igual que con las listas, no es necesario crear un diccionario vacío y luego agregar valores, podríamos haber creado el diccionario de forma directa. En el siguiente ejemplo tenemos los nombres de 5 ciudades y sus poblaciones.

In [29]:
pob = {'BSAS': 15594428,
       'Córdoba': 3304825,
       'Santa Fe': 3300736,
       'CABA': 2891082,
       'Mendoza': 1741610}

Si ahora quisiramos saber la población de Córdoba, bastaría con escribir:

In [30]:
pob['Córdoba']

3304825

Una operación que suele ser útil es preguntar si una `clave` existe en un diccionario, esto se logra con el operador `in`:

In [31]:
'San Luis' in pob

False

El operador `in` funciona tanto con listas como con diccionarios, aunque internamente no funciona de igual forma para ambas estructuras de datos. En el caso de las listas el tiempo de demora de esta operación  es proporcional a la longitud de la lista, mientras más elementos estén contenidos en la lista más tardaremos en obtener una respuesta. Por el contrario el tiempo de demora es casi constante para los diccionarios. Quienes tengan mayor curiosidad sobre como se logra esta característica pueden leer sobre [Hash table](https://en.wikipedia.org/wiki/Hash_table).

Si quisieramos saber si un `valor` está contenido en un diccionario deberíamos hacer:

In [32]:
3304825 in pob.values()

True

Así como podemos iterar sobre los valores contenidos en un lista es posible iterar sobre los valores contenidos en un diccionario:

In [33]:
for clave, valor in pob.items():
    print(clave, valor)

BSAS 15594428
Córdoba 3304825
Santa Fe 3300736
CABA 2891082
Mendoza 1741610


Si prestan atención verán que el orden en que iteramos los elementos del diccionario es exactamente el mismo orden en el que creamos el diccionario. Este es el mismo comportamiento que para una lista, por lo cual puede ser exactamente lo que estaban esperando. Pero cabe aclarar que en versiones anteriores a Python 3.7 este comportamiento NO estaba garantizado y el orden dependía de varios factores.

Si la ejecución correcta del código que están escribiendo depende del orden de un diccionario asegurense de estar usando Python >= 3.7. Y asegurensé de aclarlo en caso que un tercero vaya a correr el código. Una alternativa que funciona con versiones previas de Python (a partir de 3.1) es usar [OrderedDict](https://docs.python.org/3.7/library/collections.html#collections.OrderedDict).

# Leer información desde archivos

Es posible usar Python para leer archivos de texto. La función `open` toma como argumento el nombre de un archivo y devuelve un _objeto-archivo_. Más adelante discutiremos en detalle que es un objeto en Python, pero por ahora nos basta con saber que es una representación de algo, en este caso de un archivo. Es posible iterar un _objeto-archivo_ de forma similar a como es posible iterar listas.

In [16]:
archivo = open('datos/nombres-permitidos.csv')

for linea in archivo:
    print(linea)

NOMBRE;SEXO;ORIGEN;SIGNIFICADO

AARON;M;S/O;S/S

AARONIT;M;S/O;S/S

ABA;F;S/O;S/S

ABACO;M;S/O;S/S

ABALEN;M;S/O;S/S

ABBAS;M;S/O;S/S

ABBIE;F;S/O;S/S

ABBOTT;M;S/O;S/S

ABBY;F;S/O;S/S

ABDALA;M;S/O;S/S

ABDAS;M;S/O;S/S

ABDECALAS;M;S/O;S/S

ABDEL;M;S/O;S/S

ABDERICO;M;S/O;S/S

ABDIAS;M;S/O;S/S

ABDIEL;M;S/O;S/S

ABDIESO;M;S/O;S/S

ABDO;M;S/O;S/S

ABDON;M;HEBREO;SIERVO DE DIOS, HIJO DE HILLE I,  Y ORIUNDO DE PIRATON

ABDUL;M;ARABE;SIERVO DE DIOS.

ABDULLAH;M;S/O;S/S

ABE;M;S/O;S/S

ABEL;M;S/O;S/S

ABELARDO;M;FRANCES;SEMEJANTE A LA ABEJA, RELACION HECHA PORLA LABORIOSIDAD DEL ANIMALITO, EL GRAN TRABAJADOR, VARIACION DE EBERARDO

ABENAMAR;M;S/O;S/S

ABENCIO;M;S/O;S/S

ABENI;F;S/O;S/S

ABERARDO;M;S/O;S/S

ABERCIO;M;GRIEGO;EL PRIMER HIJO

ABEY;M;S/O;S/S

ABHAY;M;S/O;S/S

ABI;A;S/O;S/S

ABIA;F;S/O;S/S

ABIBO;M;S/O;S/S

ABIBON;M;S/O;S/S

ABIE;M;S/O;S/S

ABIEL;M;S/O;S/S

ABIGAIL;F;S/O;S/S

ABIJAH;M;S/O;S/S

ABIJAIL;F;S/O;S/S

ABILIO;M;S/O;S/S

ABIMAEL;M;S/O;S/S

ABIRA;F;S/O;S/S

ABISAI;M;S/O;

DULCIDIO;M;LATINO;"BAJO LATIN ""DULCIDIO"", DE DULCISDULCE, SAN DULCIDIO, OBISPO DE AGEN EN FRANCIA (SIGLO VII)"

DULCINEA;F;LATINO;"DEL LATIN ""DULCIS""DULCE, QUE TIENE DULZU-RA"

DULIO;M;S/O;S/S

DUMAN;M;S/O;S/S

DUNCAN;M;S/O;S/S

DUNIA;F;S/O;S/S

DUNLOP;M;S/O;S/S

DUNN;M;S/O;S/S

DUNSTAN;M;S/O;S/S

DUNSTANO;M;ANGLOSAJON;"DUNSTAN DE ""DUN""COLINA Y ""STAN""PIEDRA, PIEDRA DE LA COLINA.-SAN DUNSTANO ARZOBISPO DE CANTORBERY (SIGLOMUY VENERADO EN INGLATERRA DURANTE LA EDAD MEDIA"

DURAND;M;S/O;S/S

DUSAN;M;S/O;S/S

DUSCHA;M;S/O;S/S

DUSTIN;M;S/O;S/S

DUSTINE;F;S/O;S/S

DUSTY;M;S/O;S/S

DUTCH;M;S/O;S/S

DWAYNE;M;S/O;S/S

DWIGHT;M;S/O;S/S

DYAN;F;S/O;S/S

DYANI;F;S/O;S/S

DYLAN;M;S/O;S/S

DYLLIS;F;S/O;S/S

DYMAS;M;S/O;S/S

DYMPHNA;F;S/O;S/S

EADBERTO;M;TEUTON;DESTACADO POR SU RIQUEZA

EADMUNDO;M;S/O;S/S

EADOIN;M;S/O;S/S

EALSA;F;S/O;S/S

EAMON;M;S/O;S/S

EANWINDA;F;S/O;S/S

EARL;M;S/O;S/S

EARTHA;F;S/O;S/S

EASTER;F;S/O;S/S

EATON;M;S/O;S/S

EAVAN;A;S/O;S/S

EBAL;M;S/O;S/S

EBELE;F;S/O;S/


KALENA;F;S/O;S/S

KALEY;F;S/O;S/S

KALI;F;S/O;S/S

KALIKA;F;S/O;S/S

KALIL;M;S/O;S/S

KALILA;F;S/O;S/S

KALINDA;F;S/O;S/S

KALISKA;F;S/O;S/S

KALKIN;M;S/O;S/S

KALLI;F;S/O;S/S

KALMAN;M;S/O;S/S

KALONICE;F;S/O;S/S

KALYA;F;S/O;S/S

KALYCA;F;S/O;S/S

KAMA;F;S/O;S/S

KAMAL;M;S/O;S/S

KAMALA;F;S/O;S/S

KAMEKO;F;S/O;S/S

KAMENA;F;S/O;S/S

KAMIL;M;S/O;S/S

KAMILA;F;S/O;S/S

KAMILAH;F;S/O;S/S

KAMILIA;F;S/O;S/S

KANDACE;F;S/O;S/S

KANDE;F;S/O;S/S

KANDICE;F;S/O;S/S

KANE;M;S/O;S/S

KANENE;F;S/O;S/S

KANIEL;M;S/O;S/S

KANIKA;F;S/O;S/S

KANTI;A;S/O;S/S

KANYA;F;S/O;S/S

KAORI;A;S/O;S/S

KAORU;A;S/O;S/S

KAPONO;M;S/O;S/S

KAPRIEL;A;S/O;S/S

KARA;F;S/O;S/S

KARAN;M;S/O;S/S

KAREEM;M;S/O;S/S

KAREL;F;S/O;S/S

KAREN;F;S/O;FORMA DANESA DE CATALINA

KARENA;F;S/O;S/S

KARENINA;F;S/O;S/S

KARIBE;A;S/O;S/S

KARIDA;F;S/O;S/S

KARIF;M;S/O;S/S

KARIM;M;S/O;S/S

KARIMA;F;S/O;S/S

KARIMAH;F;S/O;S/S

KARIN;F;S/O;S/S

KARINA;F;S/O;S/S

KARINE;F;S/O;S/S

KARIS;F;S/O;S/S

KARL;M;S/O;S/S

KARLA;F;S/O;S/S

KARLI

RORI;F;S/O;S/S

RORY;A;S/O;S/S

ROSA;F;S/O;S/S

ROSA DE LIMA;F;S/O;S/S

ROSABEL;F;S/O;S/S

ROSALBA;F;S/O;S/S

ROSALI;F;S/O;S/S

ROSALIA;F;S/O;S/S

ROSALINA;F;S/O;S/S

ROSALIND;F;S/O;S/S

ROSALINDA;F;S/O;S/S

ROSAMUNDA;F;S/O;S/S

ROSANA;F;S/O;S/S

ROSANGELA;F;S/O;S/S

ROSANNE;F;S/O;S/S

ROSARIO;A;S/O;S/S

ROSAURA;F;S/O;S/S

ROSCOE;M;S/O;S/S

ROSE;F;S/O;S/S

ROSEANNE;F;S/O;S/S

ROSELLA;F;S/O;S/S

ROSEMARY;F;S/O;S/S

ROSENDO;M;S/O;S/S

ROSETTA;F;S/O;S/S

ROSI;F;S/O;S/S

ROSIBERICA;F;S/O;S/S

ROSICLER;F;S/O;S/S

ROSINA;F;S/O;S/S

ROSINE;F;S/O;S/S

ROSIO;M;S/O;S/S

ROSMARI;F;S/O;S/S

ROSS;M;S/O;S/S

ROSULA;M;S/O;S/S

ROTH;M;S/O;S/S

ROWENA;F;S/O;S/S

ROXANA;F;S/O;S/S

ROXANNE;F;S/O;S/S

ROXINA;F;S/O;S/S

ROXY;F;S/O;S/S

ROY;M;S/O;S/S

ROYCE;M;S/O;S/S

RUBEN;M;S/O;S/S

RUBI;F;S/O;S/S

RUBINA;F;S/O;S/S

RUBRIA;F;S/O;S/S

RUBY;F;S/O;S/S

RUDD;M;S/O;S/S

RUDESINDO;M;S/O;S/S

RUDI;M;S/O;S/S

RUDOLF;M;S/O;S/S

RUDOLFO;M;S/O;S/S

RUDOLPH;M;S/O;S/S

RUDRA;F;S/O;S/S

RUDY;M;S/O;S/S

RUE;F;S/O;S/S

R

Podemos ver que el archivo "nombres-permitidos.csv" es un listado de nombres juntos con información asociado a esos nombres:
* sexo (M o F)
* origen 
* significado

Supongamos que solo nos interesa extraer la primer columna, la que contiene los nombres, omitiendo además el encabezado del archivo esto lo podemos hacer de la siguiente manera.

In [18]:
archivo = open('datos/nombres-permitidos.csv')

for linea in archivo.readlines()[1:]:
    nombre = linea.split(';')[0]
    print(nombre)

AARON
AARONIT
ABA
ABACO
ABALEN
ABBAS
ABBIE
ABBOTT
ABBY
ABDALA
ABDAS
ABDECALAS
ABDEL
ABDERICO
ABDIAS
ABDIEL
ABDIESO
ABDO
ABDON
ABDUL
ABDULLAH
ABE
ABEL
ABELARDO
ABENAMAR
ABENCIO
ABENI
ABERARDO
ABERCIO
ABEY
ABHAY
ABI
ABIA
ABIBO
ABIBON
ABIE
ABIEL
ABIGAIL
ABIJAH
ABIJAIL
ABILIO
ABIMAEL
ABIRA
ABISAI
ABNER
ABRA
ABRAHAM
ABRAHAMITAS
ABRAHAN
ABRAM
ABRAN
ABRIL
ABRYL
ABSALON
ABU
ABUDEMIO
ABUNDANCIO
ABUNDIO
ACABI
ACACIA
ACACIO
ACAÑIR
ACANTHA
ACAROPITA
ACATO
ACCALIA
ACCAS
ACCIO
ACDEL
ACE
ACELIN
ACEPIMAS
ACILINO
ACINDINO
ACIRA
ACISCLO
ACKERLEY
ACNIN
ACUCIO
ACURSIO
ADA
ADABELLA
ADAH
ADAIR
ADALA
ADALBERTO
ADALGISA
ADALIA
ADALID
ADALINO
ADALIS
ADAM
ADAMINA
ADAMNAN
ADAMO
ADAN
ADAOBI
ADARA
ADAUCO
ADAUCTO
ADBEEL
ADBI
ADDIE
ADDIS
ADDISON
ADE
ADEL
ADELA
ADELAIDA
ADELAIDE
ADELARDO
ADELBERTO
ADELBURGA
ADELE
ADELFA
ADELFO
ADELGIRO
ADELIA
ADELINA
ADELINE
ADELINO
ADELIO
ADELLE
ADELMA
ADELMAR
ADELMO
ADELQUI
ADEM
ADEMAR
ADEMARO
ADEMIA
ADENA
ADERES
ADERITO
ADHELMA
ADHEMAR
ADI
ADIB
ADIEL
ADIL
ADILA
ADILSON
ADINA
ADIRA

DUDLEY
DUENA
DUFF
DUGAN
DUGLAS
DUHAM
DUILIO
DUKA
DUKE
DULA
DULAS
DULCE
DULCE JESUS
DULCE MARIA
DULCEA
DULCIDIO
DULCINEA
DULIO
DUMAN
DUNCAN
DUNIA
DUNLOP
DUNN
DUNSTAN
DUNSTANO
DURAND
DUSAN
DUSCHA
DUSTIN
DUSTINE
DUSTY
DUTCH
DWAYNE
DWIGHT
DYAN
DYANI
DYLAN
DYLLIS
DYMAS
DYMPHNA
EADBERTO
EADMUNDO
EADOIN
EALSA
EAMON
EANWINDA
EARL
EARTHA
EASTER
EATON
EAVAN
EBAL
EBELE
EBER
EBERARDO
EBICIARO
EBON
EBONY
EBRULFO
ECE
ECHO
ECIAR
EDA
EDAN
EDANA
EDBERTO
EDBURGA
EDDA
EDDIE
EDDINE
EDELBA
EDELBURGA
EDELIA
EDELINA
EDELINE
EDELIRA
EDELMA
EDELMAR
EDELMIRA
EDELMIRO
EDELTRUDA
EDELVAIS
EDELWEISS
EDEN
EDENA
EDESIO
EDESO
EDGAR
EDGARDA
EDGARDO
EDIE
EDILBERTO
EDILBURGA
EDILIA
EDILIO
EDILMA
EDILTRUDIS
EDIPO
EDISON
EDISTIO
EDIT
EDITA
EDITH
EDLYN
EDMEE
EDMUNDO
EDNA
EDOUARD
EDRIA
EDSEL
EDSON
EDUARDA
EDUARDO
EDURNE
EDUVIGES
EDUVIGIS
EDUVINA
EDWARD
EDWARDO
EDWIN
EDWINA
EDYTHE
EFEBO
EFFIE
EFIGENIA
EFISIO
EFRAIM
EFRAIN
EFRAT
EFRATH
EFREM
EFREN
EGAN
EGBERTO
EGDUNO
EGEO
EGIDIO
EGIPCIACA
EGISTO
EGLE
EGMIDIO
EGON
EIAL
EIBE
EII

LUISANA
LUISE
LUISELLA
LUISINA
LUIZ
LUIZA
LUJAN
LUKA
LUKAS
LUKE
LUKEN
LUKENE
LUKINA
LULU
LUMILA
LUMUMBA
LUNA
LUNT
LUPE
LUPERCIO
LUPERO
LUPICINO
LUPITA
LUPO
LURDES
LURENTINO
LUSIN
LUSORIO
LUTARDO
LUTERO
LUTFI
LUTGARDA
LUTHER
LUVENCIO
LUVINA
LUXMI
LUZ
LUZ MARINA
LUZMILA
LYDIA
LYLA
LYLE
LYLON
LYMAN
LYNCH
LYNDA
LYNDON
LYNETTE
LYNN
LYNNE
LYRIS
LYSANDER
LYSANDRA
MAAIAN
MAARTEN
MAARTJE
MAAYAN
MABEL
MAC
MACABEO
MACABEOS
MACADAM
MACALLISTER
MACARENA
MACARIA
MACARIO
MACAULAY
MACE
MACEDONIO
MACHIKO
MACIEL
MACKENZIE
MACLEAN
MACLOVIO
MACRA
MACRINA
MACRINO
MACROBIO
MADA
MADDIE
MADDOCK
MADDOX
MADELAINE
MADELEINE
MADELINE
MADGE
MADISON
MADLEN
MADONNA
MADOX
MADRA
MADRONA
MADY
MAE
MAEKO
MAEL
MAELA
MAELIA
MAELLE
MAEVE
MAFALDA
MAGA
MAGALI
MAGAN
MAGDA
MAGDALEN
MAGDALENA
MAGDALENE
MAGDIEL
MAGELA
MAGENA
MAGGIE
MAGIA
MAGIN
MAGINO
MAGLORIO
MAGNERICO
MAGNO
MAGNOLIA
MAGNUS
MAGUMI
MAHA
MAHALA
MAHALIA
MAHDIS
MAHEERA
MAHESA
MAHIR
MAHMOUD
MAHOMA
MAHON
MAI
MAIA
MAIALEN
MAIAN
MAIARA
MAIATZA
MAICA
MAICO
MAIDA
MAIK
MAIK

SERVULO
SERWA
SET
SETH
SETHAN
SEVERA
SEVERIANO
SEVERIN
SEVERINA
SEVERINO
SEVERO
SEVILIANO
SEVILIN
SEWOLDO
SEYITHAN
SEYMOUR
SEYOUNG
SHADI
SHADIA
SHADWELL
SHAI
SHAIEL
SHAIMING
SHAINE
SHAIR
SHAJAR
SHAKE
SHAKIRA
SHALOM
SHALYA
SHAMI
SHAMIR
SHAMIRA
SHAMUS
SHANA
SHANAHAN
SHANATA
SHANDY
SHANE
SHANELLE
SHANI
SHANIA
SHANLEY
SHANNON
SHANTAL
SHANTAY
SHANTI
SHAQUEEL
SHAQUILE
SHARBAT
SHARI
SHARIF
SHARMAN
SHARON
SHATTUCK
SHAUL
SHAUN
SHAVER
SHAVONNE
SHAW
SHAWN
SHAWNA
SHAYEN
SHAYNA
SHAYNDEL
SHEA
SHEBA
SHEEHAN
SHEENA
SHEFFIELD
SHEILA
SHEINA
SHEKEL
SHELA
SHELBY
SHELDON
SHELI
SHELLEY
SHELLY
SHELOMO
SHELTON
SHEM
SHEN
SHERIDON
SHERLOCK
SHERROD
SHERRY
SHERWOOD
SHIFRA
SHIKA
SHIMON
SHIN
SHINA
SHINBOKU
SHING
SHINICHI
SHINJI
SHINO
SHINYA
SHIRA
SHIREL
SHIRI
SHIRLEY
SHIRLY
SHIRO
SHIVA
SHIVANI
SHLOMO
SHMUEL
SHNEUR
SHOAM
SHOLEM
SHOSHANA
SHOSHANAH
SHTERNA
SHULAMIT
SHULINEN
SHUNNAR
SIAGRIA
SIAGRIO
SIAMARA
SIBILA
SIBILINA
SIBLEY
SIBYL
SIBYLA
SICIO
SICO
SID
SIDNEY
SIDONIA
SIDONIO
SIDRONIO
SIENA
SIENNA
SIERVO
SIGAL
SIGAL

En la tercer linea usamos el método `readlines`, este método devuelve una lista de lineas. Noten el uso de `[:-1]`, de esta forma iteramos a partir del elemento 1, es decir omitimos la primer linea, la cual contiene el encabezado.

`linea` es un _string_ (cadena), en la cuarta linea usamos el método `split` para _separar_ la cadena usando el caracter ';'  y `[0]` para seleccionar el primer item (el nombre).

Escribir una función que tome los nombres en "nombres-permitidos.csv" y los almacene como claves (_key_) en un diccionario. Cómo valores usen el valor en la columna sezo.


```python
archivo = open('datos/nombres-permitidos.csv')

nombres = {}
for linea in archivo.readlines()[1:]:
    nombre, sexo, *_ = linea.split(';')
    nombres[nombre] = sexo
```

 ejercicios http://greenteapress.com/thinkpython/html/thinkpython010.html#toc99

### Frecuencias

Es común usar _estadísticos_ como la media y la _desviación estándar_ para resumir (o comprimir) un conjunto de datos. Esto proceso de compresión de información puede conducir a la pérdida de información útil, por lo que suele ser buena idea usar otras formas de representar datos, una muy común es mediante histogramas.

Un histograma es una representación visual que muestra el número de veces que aparece un número es un conjunto de datos (frecuencia). En el próximo capítulo veremos como hacer este tipo de gráficos. Pero antes de llegar a graficar veamos como podemos usar un diccionario para calcular estas frecuencias. Supongamos que tenemos una lista de valores como la siguiente

In [34]:
lista = [3, 5, 5, 2, 2, 4, 1]

Y queremos saber cuantas veces aparece cada número en esa lista, el 1 una vez, el 2 dos veces el 3 una vez, etc. Usando un diccionario podemos realizar esta tarea de forma eficiente y relativamente sencilla.

In [35]:
def frecuencias(datos):
    """
    """
    frec = {}
    for c in datos:
        if c not in frec:
            frec[c] = 1
        else:
            frec[c] += 1
    return frec

In [39]:
lista = [1, 2, 2, 3, 4, 5]
frecuencias(lista)

{1: 1, 2: 2, 3: 1, 4: 1, 5: 1}

La función frecuencia no solo funciona para números, también podemos usarla para calcular la frecuencia de letras usada en los nombres. El siquiente ejemplo muestra como hacer esto:

In [114]:
archivo = open('datos/nombres-permitidos.csv')

nombres = ''
for linea in archivo.readlines()[1:]:
    nombres += linea.split(';')[0]
frecuencias(nombres)

{'A': 9807,
 'R': 4403,
 'O': 4550,
 'N': 5052,
 'I': 6318,
 'T': 2429,
 'B': 1084,
 'C': 1875,
 'L': 4188,
 'E': 5985,
 'S': 2688,
 'Y': 971,
 'D': 2241,
 'U': 1605,
 'H': 1244,
 'M': 2096,
 'G': 976,
 'J': 404,
 'Ñ': 10,
 'P': 784,
 'K': 771,
 'F': 621,
 'Q': 134,
 'V': 675,
 'W': 230,
 'X': 130,
 'Z': 347,
 'É': 2,
 ' ': 209,
 '.': 13,
 '\x81': 1,
 'Ó': 1,
 'Ü': 5,
 'Ú': 1,
 '¤': 4,
 'Ë': 1}

Una ventaja de usar un diccionario como usamos en la función frecuencia es que no necesitamos saber _a priori_ los caracteres que nos interesa. 

http://greenteapress.com/thinkpython/html/thinkpython012.html