Skip to content

a-wendler/gnd-dashboard

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

GND Dashboard

Das Python Meetup der DNB erstellt anlässlich der GNDcon II ein interaktives Dashboard.

Abhängigkeiten

Erzeugung der Daten

Um die statistischen Auswertungen zu erstellen, wird ein aktueller Abzug der Katalogdaten (in PICA+) benötigt. Diese Datei ist im Projektverzeichnis unter DNBGNDtitel.dat.gz abzulegen.

Die Auswertungen werden wie folgt erzeugt:

Die Option -j4 am Befehl make gibt die Anzahl der zu verwendenden Prozessorkerne an. Wenn Ihr Rechner mehr als 4 Kerne hat, ändern Sie die Zahl entsprechend.

$ make -j4 all
$ tree -L 1 stats/
stats/
├── gnd_entity_count.csv
├── gnd_entity_types.csv
├── gnd_relation_count.csv
├── gnd_systematik.csv
├── title_gnd_links.csv
├── title_gnd_links_unique.csv
├── title_gnd_mean.csv
├── title_gnd_mean_Tb.csv
├── title_gnd_mean_Tf.csv
├── title_gnd_mean_Tg.csv
├── title_gnd_mean_Tp.csv
├── title_gnd_mean_Ts.csv
├── title_gnd_mean_Tu.csv
├── title_gnd_top10.csv
├── title_gnd_top10_Tb.csv
├── title_gnd_top10_Tf.csv
├── title_gnd_top10_Tg.csv
├── title_gnd_top10_Tp.csv
├── title_gnd_top10_Ts.csv
└── title_gnd_top10_Tu.csv

0 directories, 20 files

Alle erzeugten Artefakte können mit make clean gelöscht werden.

Auswertungen

Die Auswertung der Verlinkungen der GND zu den DNB-Titeldaten basiert auf den PICA+-Fledern: 022A.9, 028A.9, 028C.9, 029A.9, 029F.9, 032X.9, 033A.9, 033E.9, 033D.9, 033H.9, 039B.9, 039C.9, 039D.9, 039E.9, 039S.9, 039V.9, 039W.9, 039X.9, 039Z.9, 039H.9, 039I.9, 039T.9, 039U.9, 039Y.9, 041A.9, 044G.9 sowie 044P.9. Verknüpfungen aus den Feldern 044H.9 (automatisch vergeben) und 044K.9 gehen nicht mit in die Gesamtmenge ein.

Allgemein

Nach Entitätstyp