Skip to content

Handreichung Dateneingabe

Christoph Broschinski edited this page May 14, 2018 · 48 revisions

Mindestanforderung

  • Die Daten beinhalten die Ausgaben je Artikel einer akademischen Einrichtung für die Veröffentlichung in kostenpflichtigen Open-Access-Zeitschriften.
  • Die Daten sollen mittels csv in einem maschinenlesbaren, plattformübergreifenden Format zur Verfügung gestellt werden.
  • Es ist sichergestellt, dass die Daten unter einer Open-Data-Commons-Lizenz öffentlich verfügbar und nachnutzbar sind.
  • Eine Ansprechpartnerin oder ein Ansprechpartner an der beisteuernden Einrichtung ist benannt.

Datensatz

Der Datensatz baut auf bereits etablierte Melderoutinen an den einzelnen Einrichtungen im Rahmen der Publikationsfonds auf. Dies gilt insbesondere für Universitäten, die zusätzliche Förderungen durch die DFG im Rahmen des Programms Open Access Publizieren erhalten.

Der Datensatz wird aus den verteilten Tabellen der beitragenden Einrichtungen zusammengestellt. Um die Ausgaben vergleichbar zu machen, werden die Verlags- und Zeitschriftentitelansetzungen mittels automatischer Anreicherungsverfahren durchgeführt (CrossRef). Durch weitere Anreicherung der Nachweise mit Informationen z.B. aus dem disziplinären Repository Europe PubMed Central oder dem DOAJ werden weitere Felder automatisch ausgefüllt.

OpenAPC erfasst aus Gründen der Einheitlichkeit ausschließlich APC-Gebühren, die für Zeitschriftenartikel entrichtet wurden. Andere Publikationstypen wie Konferenzbeiträge oder Buchkapitel werden nicht aufgenommen.

Im Sinne der Sichtbarkeit und Nachnutzung wird der Datensatz über GitHub verfügbar gemacht.

Datenschema

Jede Variable (Pflichtfelder und optionale Felder) bildet eine Spalte, und pro Artikel wird eine Zeile verwendet.

Eine Übersicht des Open-APC-Datenschemas ist hier zu finden. Dieser Beitrag der Universität Leipzig ist ein gutes Beispiel für eine Schema-konforme Einreichung.

Pflichtfelder

Folgende Variablen sind obligatorisch:

institution — Name der Universität oder außeruniversitären Forschungseinrichtung

period — Jahr der Rechnungsbezahlung

euro — Rechnungsbetrag, der den Haushalt der bezahlenden Einrichtung belastet.

doi — Digital Object Identifier

is_hybrid — Wurde der Artikel in einer subskriptionspflichtigen Zeitschrift veröffentlicht? Angabe FALSE oder TRUE.

Optionale Felder

Bei Veröffentlichungen, die über keine keine DOI verfügen, sind die folgenden optionalen Felder ebenfalls anzugeben.

publisher — Verlag

journal_full_title — Titel der Zeitschrift

issn — International Standard Serial Numbers

url — URL zum Artikel

Zusammensetzung der gemeldeten Kosten

Um Vergleichbarkeit zu gewährleisten, sollte sich der im Feld euro gemeldete Betrag gemäß folgender Regeln zusammensetzen:

  • Alle gemeldeten APC-Kosten sind grundsätzlich als Bruttowerte aufzufassen, modifizierende Faktoren wie Steuern oder Rabatte sollten in den Betrag inkludiert sein (Oder anders ausgedrückt: Es ist der APC-Betrag maßgeblich, der letztlich den Haushalt einer Institution belastet hat). Diese Einflüsse werden im Datensatz nicht gesondert erfasst, können aber in der Selbstdarstellung der Institution in Form einer README als Teil der Datenbereitstellung näher erläutert werden (Beispiel).
  • Das Bruttoprinzip bezieht sich auschließlich auf die APC-Kosten selbst. Zusätzliche Kostenpunkte wie submission fees oder page/colour charges sollten nicht im gemeldeten Betrag enthalten sein.
  • Es werden nur solche Artikel aufgenommen, die dem "klassischen" APC-Modell entsprechen, d.h. OA-Publikation gegen direkte Zahlung eines Geldbetrags. Artikel aus alternativen Abrechnungsmodellen (z.B. RSC Vouchers/Offsetting-Verträge), bei denen ein Kostenbetrag lediglich a posteriori kalkuliert wurde, sollten keine Berücksichtigung finden.
  • Es sollten nur Artikel mit einem positiven APC-Betrag gemeldet werden, also keine "Freiartikel" mit einem Betrag von 0€, die beispielsweise im Rahmen von Rabatten, für Reviewtätigkeiten oder als Kompensation gewährt werden.

Einreichung

Ihre CSV-Dateien können sie dem OpenAPC-Projekt auf 2 Arten zur Verfügung stellen:

  1. Per Mail an openapc at uni-bielefeld.de
  2. Per Pull Request direkt auf GitHub. Dieser Vorgang wird im Folgenden genauer erläutert.

GitHub-Workflow: Hinzufügen einer neuen Institution

Um Daten erstmalig für eine Institution hinzuzufügen, sind die folgenden Schritte nötig:

  1. Registrierung auf GitHub (kostenfrei) - der Nutzername sei im Folgenden als YOURUsername bezeichnet
  2. Einen Fork des Original-OpenAPC-Repositorys unter ihrem Benutzerkonto erstellen
  3. Lokale Kopie (clone) des Forks auf ihrem Rechner anlegen
  4. Neuen Ordner für die Institution im Verzeichnis data anlegen
  5. Dateien in diesem Ordner ablegen
  6. Kopie des lokal veränderten Repository auf GitHub veröffentlichen
  7. per Pull Request die Aufnahme in die Datensammlung der Open APC Initiative beantragen

Nach der Registrierung und dem Fork führen sie die Schritte 3-6 auf ihrem lokalen Rechner folgendermaßen durch:

Erstellen einer lokale Kopie:

$ git clone https://github.com/YOURUsername/openapc-de.git

Neuen Ordner für ihre Institution hinzufügen:

$ cd openapc-de/data
$ mkdir YOURfolder

Die csv-Tabelle(n) in den Ordner YOURfolder kopieren:

$ cp YOURdata.csv openapc-de/data/YOURfolder

Add/Commit durchführen und in GitHub hochladen:

$ git add openapc-de/data/YOURfolder/
$ git commit -m "APC fees paid at my Institution from 2012 until 2014"
$ git push origin master

Um die Dateien im letzten Schritt 7 in das OpenAPC-Ausgangsrepository hinzuzufügen, muss ein Pull Request gestellt werden.

GitHub-Workflow: Aktualisieren Ihrer Daten

Um bereits existierende Daten einer Institution zu aktualisieren bzw. zu ergänzen, sind die folgenden Schritte nötig:

  1. Lokales Repository auf den aktuellen Stand des Open-APC-Repository bringen (Details dazu hier)
  2. Daten im Ordner der eigenen Institution verändern
  3. Kopie des lokal veränderten Repository auf GitHub veröffentlichen
  4. per Pull Request die Aufnahme in die Datensammlung der Open APC Initiative beantragen

Anreicherung

Nach dem Pull Request (bzw. der Einreichung per Mail) werden die Daten vom OpenAPC-Projekt zunächst normalisiert und angereichert. Üblicherweise wird dazu zu jeder hochgeladenen CSV-Datei eine angereicherte Variante in ihrem Verzeichnis abgelegt, gekennzeichnet durch das Suffix _enriched im Dateinamen. Nach der Anreicherung werden die Daten in den OpenAPC-Datensatz aufgenommen, der anschließend eine neue Versionsnummer erhält.

Die Anreicherungsschritte umfassen:

  • Verlags- und Zeitschriftentitelansetzung, Hinzufügen von ISSN- und Lizenzinformationen (CrossRef)
  • Bestimmung von PMID und PMCID (Europe PubMed Central)
  • Abgleich mit dem Web of Science und Speicherung der Datenbankidentnummer ut
  • Abfrage, ob die Zeitschrift im DOAJ verzeichnet ist
  • Hinzufügen einer möglichen Linking-ISSN

Lizenz

Derzeit findet folgende Lizenz Anwendung:

Datasets are made available under the Open Database License: http://opendatacommons.org/licenses/odbl/1.0/. Any rights in individual contents of the database are licensed under the Database Contents License: http://opendatacommons.org/licenses/dbcl/1.0/

Contributor

Alle Beiträgerinnen und Beiträger werden namentlich genannt.

Nachnutzung

Neben der dynamisch aktualisierten Startseite des GitHub-Repositorys (basierend auf R Markdown) betreibt OpenAPC außerdem einen OLAP-Server zur zielgerichteten Datenabfrage sowie darauf aufbauend eine Website mit Treemap-Visualisierungen der gesammelten APC-Daten.

Mögliche weitere Anwendungsfälle:

You can’t perform that action at this time.