# Actividad intermedia: Construye un programa real

En esta actividad vamos a construir un programa que nos permita consultar una biblioteca de referencias bibliográficas. El programa debe permitirnos consultar la bibliografía por título, autor, año de publicación y palabras claves.


## Sobre el conjunto de datos

Para realizar este ejercicio, les brindamos un [conjunto de referencias bibliográficas](https://www.zotero.org/groups/197065/humanidades_digitales/library) exportadas desde el programa [Zotero](https://www.zotero.org/) las cuales pueden visualizar en el [repositorio del curso](https://github.com/Taller-Abierto-de-Humanidades-Digitales/curso_python_2023B/blob/main/data/bibliografia.json).

Antes de iniciar la actividad, es necesario importar los datos a nuestro programa. Para ello, vamos a utilizar la librería `json` de Python. 

**Ejecuta la siguiente celda para obtener el conjunto de datos**

In [None]:
%pip install requests

import requests
import json


def biblioteca() -> list:
	"""
	Esta función retorna una bibliografía en formato CSL-JSON
	"""
	r = requests.get("https://raw.githubusercontent.com/Taller-Abierto-de-Humanidades-Digitales/curso_python_extenso/main/data/bibliografia.json")

	return json.loads(r.text)


Exploremos un poco los datos que vamos a utilizar:

In [None]:
# contar el número de elementos en la biblioteca
biblioteca  = biblioteca()
print(f'Número de elementos en la biblioteca: {len(biblioteca)}\n')

# imprimir las claves de todos los elementos:

claves = []

for elemento in biblioteca:
    for clave in elemento:
        if clave not in claves:
            claves.append(clave)

tipos_bibliograficos = []

for elemento in biblioteca:
    if elemento['type'] not in tipos_bibliograficos:
        tipos_bibliograficos.append(elemento['type'])

tipos_bibliograficos.sort()
claves.sort()

print(f'Tipos de elementos: {tipos_bibliograficos}\n')
print(f'Claves de los elementos: {claves}\n')


```{admonition} Importante
Es sumamente recomendable (por no decir *obligatorio*) que realicen una revisión de la estructura y contenido del conjunto de datos antes de iniciar la escritura del programa. Por ejemplo, cuántos elementos hay por cada tipo, qué claves tiene cada tipo de elemento, cuáles de estas claves son obligatorias, etc.
```

### Acceder al conjunto de datos

El archivo contiene una biblioteca de citas bibliográficas en formato CSL-JSON. La biblioteca está construida a partir de una exportación de elementos de Zotero en el formato [CSL-JSON](https://citeproc-js.readthedocs.io/en/latest/csl-json/markup.html). En esta estructura, cada elemento un diccionario dentro de una lista. Cada diccionario contiene una serie de pares clave-valor.


### Acceder a los elementos de la biblioteca

Debido a que la biblioteca es una lista de diccionarios, podemos acceder a cada elemento de la biblioteca usando la sintaxis de listas.

Por ejemplo, para acceder al primer elemento de la biblioteca, podemos usar la siguiente sintaxis:

In [None]:
print(biblioteca[0])

Y en este ejemplo, si queremos acceder al valor de la clave `title`, podemos usar la siguiente sintaxis:

In [None]:
print(biblioteca[0]['title'])

En este sentido, un buscador deberá iterar sobre todo el diccionario y comparar el valor de cada clave con el valor de búsqueda. Por ejemplo, si queremos buscar un elemento por título, podemos usar la siguiente sintaxis para encontrar una coincidencia exacta:

In [None]:
titulo = '¿Qué son las Humanidades Digitales?'

for elemento in biblioteca:
    if elemento['title'].lower() == titulo.lower():
        print(elemento)

## Instrucciones

### 1. Construir el módulo de búsquedas

El primer paso consiste en construir las funciones búsqueda que logren cumplir con los siguientes requisitos:

* Debe buscar por título, autor, año de publicación y palabras claves.
* Debe tener la opción de buscar por libro, artículo, tesis o cualquier otro tipo de elemento.
* Debe tener la opción de buscar por coincidencia exacta o por coincidencia parcial.
* Debe tener la capacidad de formatear el resultado para hacerlo legible al usuario.
* Debe poder lidiar con el tipo de dato de los autores (`list`) y de las fechas (`dict`).


De preferencia, deberás construir dos funciones:

* Una función que permita buscar por título, autor, año de publicación y palabras claves.
* Una función que permita formatear el resultado de la búsqueda.


Las funciones deben estar en la capacidad de replicar un resultado como el siguiente:

In [None]:
from busqueda import busqueda_simple, formar_result # <- Solo como ejemplo, no es necesario importar esto

# Buscar la palabra "Data" en el título de los libros
resultado = busqueda_simple('Data', 'title', 'book')
print(formar_result(resultado))

### 2. Construir el módulo de interfaz

El segundo paso consiste en construir una interfaz que permita al usuario interactuar con el programa. Para ello, deberás construir una función que permita al usuario ingresar los parámetros de búsqueda y que muestre el resultado de la búsqueda.

Esta función debe tener un menú que permita al usuario elegir entre las siguientes opciones:

* Ingresar la palabra clave de búsqueda.
* Seleccionar si se desea buscar por título, autor, fecha o palabra clave.
* Seleccionar si se desea filtrar por libro, artículo, tesis o cualquier otro tipo de elemento.

La función debe estar en la capacidad de replicar un resultado como el siguiente:

```shell

Ingrese los datos de la búsqueda
Palabra a buscar: Data
Tipos de búsqueda: [1] Título, [2] Autor, [3] Fecha, [4] Palabra clave
Tipo de búsqueda (1, 2, 3, 4): 1
Tipos de documento: [1] Libro, [2] Artículo, [3] Tesis, [4] Cualquiera
Tipo de documento (1, 2, 3, 4): 1
Buscando 'Data' en 'title' de tipo 'book'


[1]------------

id: AdrianCaballeroRoldan2019Bid
type: book
abstract: rare book
ISBN: 978-84-948972-0-7
language: Spanish
note: 00000
publisher: RC Libros
source: Amazon
title: Bid data con Python. Recolección, almacenamiento y proceso
author: Adrián Caballero Roldán, Rafael Caballero / Martín Martín
issued: 2019
-----------------

[2]------------

id: Hamidovic.etal2019Ancient
type: book
abstract: Ancient Manuscripts in Digital Culture presents an overview of the digital turn in Ancient Jewish and Christian manuscripts visualisation, data mining and communication. Edited by David Hamidović, Claire Clivaz and Sarah Bowen Savant, it gathers together the contributions of seventeen scholars involved in Biblical, Early Jewish and Christian studies. The volume attests to the spreading of digital humanities in these fields and presents fundamental analysis of the rise of visual culture as well as specific test-cases concerning ancient manuscripts. Sophisticated visualisation tools, stylometric analysis, teaching and visual data, epigraphy and visualisation belong notably to the varied overview presented in the volume.
collection-number: 3
collection-title: Digital Biblical Studies
edition: 1ª
event-place: Leiden - Boston
ISBN: 978-90-04-39929-7
language: English
note: ZSCC: 0000001
number-of-pages: xvi, 284
number-of-volumes: 1
publisher: Brill
publisher-place: Leiden - Boston
title: Ancient Manuscripts in Digital Culture. Visualisation, Data Mining, Communication
source: Library of Congress ISBN
title: The shape of data in the digital humanities: modeling texts and text-based resources
title-short: The shape of data in the digital humanities
editor: Flanders, Julia; Jannidis, Fotis
issued: 2019
-----------------

Se encontraron 4 resultados

```
