Skip to content
master
Go to file
Code

Latest commit

 

Git stats

Files

Permalink
Failed to load latest commit information.
Type
Name
Latest commit message
Commit time
 
 
 
 
 
 

README.md

BannedBookUtils

BannedBookUtils ist ein Beitrag zum Projekt insight - 19xx: Liste des schädlichen und unerwünschten Schrifttums, bei dem im Rahmen des Kultur-Hackathons Coding da Vinci die "Liste der schädlichen und unerwünschten Schrifttums" angereichert werden soll.

In BannedBookUtils werden die in der Verbotsliste aufgeführten Bücher mit den [Titeldaten der DNB] (http://datendienst.dnb.de/cgi-bin/mabit.pl?userID=opendata&pass=opendata&cmd=login) (Stand: Februar 2014) abgeglichen, um anhand der der Buchtitel den Autor einem Eintrag in der GND zuordnen zu können. Dazu wird aus den Titeldaten der DNB in [SOLR] (http://lucene.apache.org/solr/) ein Suchindex erstellt (IndexBuilder). Der Abgleich (BannedBooksFinder) erfolgt über die Kriterien Titel, Erscheinungsort und Erscheinungsjahr, nicht über den Autorennamen (da die GND-Referenzen in den Titeldaten beim Aufbau des SOLR-Index nicht aufgelöst werden.)

Der Abgleich lieferte (Titel-Dump Stand Februar 2014) folgendes Ergebnis:

  • Sämtliche Werke (übersprungen): 1026
  • Suchanfragen durchgeführt: 4859
  • Listeneinträge mit Ergebnissen: 3333
  • Anzahl gefundener DNB-Titel: 4700

Die erzeugte Liste (siehe bannedBooks.xlsx) ist Basis für weitere Bereinigungen und Ergänzungen, die finale Version ist unter https://github.com/jlewis91/codingdavinci/blob/master/ergaenzte_liste.csv verfügbar.

Weiters wurden über den erstellten Index die in der DNB verfügbaren Werke derjenigen Autoren abgerufen (siehe CompleteWorksFinder), deren sämtliche Werke verboten waren, und die einem Eintrag in der GND zugeordnet werden konnten. (Nach 1945 publizierte Werke wurden ausgenommen.)

Der Abgleich lieferte (Titel-Dump Stand Februar 2014) folgendes Ergebnis:

  • Anzahl Autoren: 809
  • Autoren mit Ergebnissen: 720
  • Anzahl gefundener DNB-Titel: 20839

Die erzeugte Liste (siehe sw_titles.xlsx) wurde als "Zugehörige Publikationen" im Projekt "insight - 19xx" aufgenommen.

License

Copyright (c) 2014 Michael Hintersonnleitner. See the LICENSE.txt file for license rights and limitations (MIT).

SOLR-Configuration: The original SOLR configuration files are licensed to Apache Software Foundation, licensed under the Apache License, Version 2.0

About

Utilities zur Ergänzung der Liste verbotener Bücher

Resources

License

Releases

No releases published

Languages

You can’t perform that action at this time.