<a href="https://colab.research.google.com/github/decolector/coleccion-bga/blob/main/get_all_items.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# API Catálogo razonado de Beatriz González

Este script hace peticiones al API del Catálogo razonado de Beatríz González y crea un archivo CSV con los datos


In [1]:
#Importación de librerías
import datetime
import requests
import csv
import json

# El nombre de la tabla de salida, usando una marca de tiempo como identificador
d = datetime.datetime.now()
timestamp = d.strftime("%Y-%m-%dT%H%M%S")

#URL base del API
base_url = "https://bga.uniandes.edu.co/exp/catalogo/api"

#Dirección del recurso
items_endpoint = base_url + "/items/"

#Nombre del archivo de salida
csv_out = "bga-items_" + timestamp + ".csv"

#Primera petición al API para obtener los primeros 100 items
items = requests.get(items_endpoint).json()

#un contador simple
count = 0

print(items)
    

[{'id': 1, 'url': 'https://bga.uniandes.edu.co/exp/catalogo/api/items/1', 'public': True, 'featured': False, 'added': '2017-10-31T13:34:19+00:00', 'modified': '2018-01-17T20:58:48+00:00', 'item_type': {'id': 6, 'url': 'https://bga.uniandes.edu.co/exp/catalogo/api/item_types/6', 'name': 'Still Image', 'resource': 'item_types'}, 'collection': {'id': 1, 'url': 'https://bga.uniandes.edu.co/exp/catalogo/api/collections/1', 'resource': 'collections'}, 'owner': {'id': 1, 'url': 'https://bga.uniandes.edu.co/exp/catalogo/api/users/1', 'resource': 'users'}, 'files': {'count': 1, 'url': 'https://bga.uniandes.edu.co/exp/catalogo/api/files?item=1', 'resource': 'files'}, 'tags': [], 'element_texts': [{'text': 'Retrato de la niña Mallarino Dávila. ', 'element_set': {'id': 1, 'url': 'https://bga.uniandes.edu.co/exp/catalogo/api/element_sets/1', 'name': 'Dublin Core', 'resource': 'element_sets'}, 'element': {'id': 50, 'url': 'https://bga.uniandes.edu.co/exp/catalogo/api/elements/50', 'name': 'Title', '

A continuación se itera sobre los items, construyendo una URL que apunta a la representación de cada item en el API.


In [4]:
# Se inicia el archivo en modo de escritura
with open(csv_out, 'w') as csvfile:
    #Instanciación del objeto writer de la librería CSV
    tablewriter = csv.writer(csvfile, delimiter='|', quotechar='"')
    
    #Lista de headers de la tabla
    headers = ["item_id",
               "item_url",
               "item_title",
               "item_date",
               "item_medium",
               "item_format",
               "item_publisher",
               "item_type"]
    
    # Se escriben los encabezados en la tabla
    tablewriter.writerow(headers)
    
    #Iteración por los items
    for item in items:
        #print(items)
        
        ## Obtener los metadatos de la obra
        item_id = item["id"]

        #construir la url del endpoint para cada item
        item_url = base_url + "/items/%s"% item_id
        print(item_url)
        
        #hacemos la petición a la url del item
        item = requests.get(item_url).json()
        #print(obra_item)
        
        # campos a buscar en los metadatos
        item_title = ""
        item_date = ""
        item_format = ""
        item_medium = ""
        item_publisher = ""
        item_type = ""
        
        #Obtener el tipo de elemento, basándonos en la colección a la que pertenence
        if item["collection"]["id"] == "9":
            item_type = "referente"
        else:
            item_type = "obra"
            
        #iteracion por los textos de elemento, o valores de los metadatos
        for element_text in item["element_texts"]:
            if "Title" == element_text["element"]["name"]:
                item_title = element_text["text"]
                
            if "Date" == element_text["element"]["name"]:
                item_date = element_text["text"]
                
            if "Format" == element_text["element"]["name"]:
                item_format = element_text["text"]
                
            if "Medium" == element_text["element"]["name"]:
                item_medium = element_text["text"]
                
            if "Publisher" == element_text["element"]["name"]:
                item_publisher = element_text["text"]
                        
            
        #Crear una nueva fila con los metadatos
        
        new_row = [item_id,
                   item_url,
                   item_title,
                   item_date,
                   item_format,
                   item_medium,
                   item_publisher,
                   item_type]

        #escribimos la fila en la tabla
        tablewriter.writerow(new_row) 
        #agregamos
        count = count + 1
        
print(count)

https://bga.uniandes.edu.co/exp/catalogo/api/items/1
https://bga.uniandes.edu.co/exp/catalogo/api/items/2
https://bga.uniandes.edu.co/exp/catalogo/api/items/3
https://bga.uniandes.edu.co/exp/catalogo/api/items/4
https://bga.uniandes.edu.co/exp/catalogo/api/items/5
https://bga.uniandes.edu.co/exp/catalogo/api/items/6
https://bga.uniandes.edu.co/exp/catalogo/api/items/7
https://bga.uniandes.edu.co/exp/catalogo/api/items/8
https://bga.uniandes.edu.co/exp/catalogo/api/items/9
https://bga.uniandes.edu.co/exp/catalogo/api/items/10
https://bga.uniandes.edu.co/exp/catalogo/api/items/11
https://bga.uniandes.edu.co/exp/catalogo/api/items/12
https://bga.uniandes.edu.co/exp/catalogo/api/items/13
https://bga.uniandes.edu.co/exp/catalogo/api/items/14
https://bga.uniandes.edu.co/exp/catalogo/api/items/15
https://bga.uniandes.edu.co/exp/catalogo/api/items/16
https://bga.uniandes.edu.co/exp/catalogo/api/items/17
https://bga.uniandes.edu.co/exp/catalogo/api/items/18
https://bga.uniandes.edu.co/exp/catal

# Sección nueva