### Data from TUD Library

__From Manuel:__

- The metadata I got from their OAI site
http://oai.tudelft.nl/ir/

- Sickle Documentation - http://sickle.readthedocs.io/en/latest/

 ### Theory OAI‐PMH (Open Archives Initiative Protocol for Metadata Harvesting)

Currently, the basis of most interoperability efforts in the learning object repositories field, OAI‐PMH is a protocol for transferring over the web metadata about any material stored in electronic form. Compared with similar initiatives such as Z39.50 (which addresses issues such as session management, management of result sets and specification of predicates to filter out results), OAI was intentionally designed simple to reduce implementation complexity and therefore costs, facilitating its adoption. Nonetheless, this new protocol was designed for transferring large amounts of metadata, and thus provides a reasonable solution for clients that need to aggregate or index metadata

Paper **Interlinking educational resources and the web of data : A survey of challenges and approaches**

Alternatives
- https://gist.github.com/lawlesst/1323535
- https://pypi.org/project/oaiharvest/
- https://github.com/infrae/pyoai

Set the IOPub data rate limit: https://github.com/jupyter/notebook/issues/2287

run `jupyter notebook --NotebookApp.iopub_data_rate_limit=10000000000`

To change this limit, set the config variable
`--NotebookApp.iopub_data_rate_limit`.

Current values:

NotebookApp.iopub_data_rate_limit=1000000.0 (bytes/sec)

NotebookApp.rate_limit_window=3.0 (secs)

In [2]:
from sickle import Sickle

In [4]:
sickle = Sickle('http://oai.tudelft.nl/ir')
records = sickle.ListRecords( **{'metadataPrefix': 'oai_dc', 'ignore_deleted': 'True'})

oFilePath = r"C:\Users\a.dimitrova\Desktop\Course data Thesis\TUDelftLibMetadataPART.xml"

with open(oFilePath, 'w', encoding = "utf-8") as oFile:
    for i,rec in enumerate(records):
        #print(rec.header)
        # extract only 1/3rd of the data as the file is too big otherwise (150 mb)
        if i % 3 == 0:
            oFile.write(str(rec))

In [None]:
items = {}

sickle = Sickle('http://oai.tudelft.nl/ir')
records = sickle.ListRecords( **{'metadataPrefix': 'oai_dc', 'ignore_deleted': 'True'})

print('Processing metadata')

for r in records:
    uuid = ''
    uuid = r.metadata['identifier'][0][32:]
    items[uuid] = r.metadata

print(len(items))
print(items)

Processing metadata


In [None]:
from oaipmh.client import Client
from oaipmh.metadata import MetadataRegistry, oai_dc_reader

URL = 'http://oai.tudelft.nl/ir'

registry = MetadataRegistry()
registry.registerReader('oai_dc', oai_dc_reader)
client = Client(URL, registry)

for record in client.listRecords(metadataPrefix='oai_dc'):
   print(record)

## TU Delft Library Metadata 1 Record

` <record xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
	<header>
	<identifier>oai:tudelft.nl:uuid:00036dbe-54d3-432a-a78f-83cd66211b5e</identifier>
	<datestamp>2017-10-18T22:57:59Z</datestamp>
	<setSpec>A-set</setSpec>
	</header>

	<metadata>
		<oai_dc:dc xmlns:oai_dc="http://www.openarchives.org/OAI/2.0/oai_dc/" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/oai_dc/ http://www.openarchives.org/OAI/2.0/oai_dc.xsd">
		<dc:title>Een exploratief onderzoek naar arbeidsmigranten en veiligheid in drie Europese landen</dc:title><dc:creator>Guldenmund, F.W. (author)
		</dc:creator><dc:creator>Cleal, B. (author)</dc:creator>
		<dc:creator>Mearns, K. (author)</dc:creator>
		<dc:description>Het aantal ongevallen met verzuim van arbeidsmigranten of ‘nieuwkomers’ stijgt de laatste jaren. Onder andere naar aanleiding hiervan is er in opdracht van het Ministerie van Sociale Zaken en Werkgelegenheid een studie uitgevoerd naar de arbeidsveiligheid van deze groep. Drie Europese landen (Denemarken, Verenigd Koninkrijk, Nederland) namen deel aan de studie. Speciale aandacht ging uit naar de relatie tussen veiligheid en de nationaliteit van de migranten. Met behulp van vierenveertig interviews, een vragenlijstonderzoek in elf landen en Deense ongevalsdata wordt een beeld geschetst van de situatie van arbeidsmigranten in de drie landen. Hoewel nog veel materiaal anekdotisch is, kan geconcludeerd worden dat het om een kwetsbare groep gaat. Zo lang veel migranten ongeregistreerd aan het werk gaan in het buitenland, en de nationale ongevallen databases niet uitgebreider en systematischer gecodeerd worden, blijft echter de omvang van het probleem vooralsnog onduidelijk.</dc:description>
		<dc:description>Values and Technology</dc:description>
		<dc:description>Technology, Policy and Management</dc:description>
		<dc:publisher>Nederlandse Vereniging voor Arbeidshygiene</dc:publisher>
		<dc:date>2012-06-01</dc:date>
		<dc:type>journal article</dc:type>
		<dc:type>Text</dc:type>
		<dc:identifier>http://resolver.tudelft.nl/uuid:00036dbe-54d3-432a-a78f-83cd66211b5e</dc:identifier>
		<dc:language>nl</dc:language>
		<dc:relation>Tijdschrift voor Toegepaste Arbowetenschappen, 26 (3/4), 2012--0923-618X</dc:relation>
		<dc:rights>(c) 2012 Auteurs</dc:rights></oai_dc:dc>
	</metadata>
</record> `

## DC Elements

- title
- location
- creator
- description
- publisher
- date
- type
- identifier
- language
- relation
- rights