Utilities zur Ergänzung der Liste verbotener Bücher
Java
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
bannedBookUtils
solrConfig/dnbTitles
.gitattributes
.gitignore
LICENSE.txt
README.md
bannedBooks.xlsx
sw_titles.xlsx

README.md

BannedBookUtils

BannedBookUtils ist ein Beitrag zum Projekt insight - 19xx: Liste des schädlichen und unerwünschten Schrifttums, bei dem im Rahmen des Kultur-Hackathons Coding da Vinci die "Liste der schädlichen und unerwünschten Schrifttums" angereichert werden soll.

In BannedBookUtils werden die in der Verbotsliste aufgeführten Bücher mit den [Titeldaten der DNB] (http://datendienst.dnb.de/cgi-bin/mabit.pl?userID=opendata&pass=opendata&cmd=login) (Stand: Februar 2014) abgeglichen, um anhand der der Buchtitel den Autor einem Eintrag in der GND zuordnen zu können. Dazu wird aus den Titeldaten der DNB in [SOLR] (http://lucene.apache.org/solr/) ein Suchindex erstellt (IndexBuilder). Der Abgleich (BannedBooksFinder) erfolgt über die Kriterien Titel, Erscheinungsort und Erscheinungsjahr, nicht über den Autorennamen (da die GND-Referenzen in den Titeldaten beim Aufbau des SOLR-Index nicht aufgelöst werden.)

Der Abgleich lieferte (Titel-Dump Stand Februar 2014) folgendes Ergebnis:

  • Sämtliche Werke (übersprungen): 1026
  • Suchanfragen durchgeführt: 4859
  • Listeneinträge mit Ergebnissen: 3333
  • Anzahl gefundener DNB-Titel: 4700

Die erzeugte Liste (siehe bannedBooks.xlsx) ist Basis für weitere Bereinigungen und Ergänzungen, die finale Version ist unter https://github.com/jlewis91/codingdavinci/blob/master/ergaenzte_liste.csv verfügbar.

Weiters wurden über den erstellten Index die in der DNB verfügbaren Werke derjenigen Autoren abgerufen (siehe CompleteWorksFinder), deren sämtliche Werke verboten waren, und die einem Eintrag in der GND zugeordnet werden konnten. (Nach 1945 publizierte Werke wurden ausgenommen.)

Der Abgleich lieferte (Titel-Dump Stand Februar 2014) folgendes Ergebnis:

  • Anzahl Autoren: 809
  • Autoren mit Ergebnissen: 720
  • Anzahl gefundener DNB-Titel: 20839

Die erzeugte Liste (siehe sw_titles.xlsx) wurde als "Zugehörige Publikationen" im Projekt "insight - 19xx" aufgenommen.

License

Copyright (c) 2014 Michael Hintersonnleitner. See the LICENSE.txt file for license rights and limitations (MIT).

SOLR-Configuration: The original SOLR configuration files are licensed to Apache Software Foundation, licensed under the Apache License, Version 2.0