Indexace obsahu K5 pomocí systému VuFind

Pokud chcete data ze systému Kramerius 5 importovat a indexovat v systému VuFind, použijte propojení přes protokol OAI-PMH.

  • V systému Kramerius 5 nakonfigurujte OAI provider podle těchto instrukcí
  • V systému VuFind nakonfigurujte dávkový import pomocí protokolu OAI-PMH a dat ve formátu XML. Konfigurace importu je závislá na celkové konfiguraci vaší instalace VuFind, postupuje podle dokumentace systému VuFind, např. na této adrese: Pro import je možné použít kterýkoli z profilů oaiprovideru v K5, tedy oai_dc, ese nebo drkramerius. V závislosti na použitém profilu a na indexačním schématu použitém v systému VuFind je třeba podle uvedené dokumentace nastavit konfigurační properties a zejména XSLT šablonu pro transformaci dat z exportního formátu OAI do konkrétního importního formátu SOLR VuFind. Jako výchozí bod je možno použít ukázku šablon a nastavení na této adrese:

Příklady konfiguračních souborů VuFind


url =
metadataPrefix = oai_dc
;idSearch[] = "/^"
;idReplace[] = "ojs-"
idSearch[] = "/\//"
idReplace[] = "-"
injectId = "identifier"
injectDate = "datestamp"
verbose = true

xslt = kramerius.xsl
custom_class[] = VuFind

institution = "Library"
collection = "Kramerius"


<!-- available fields are defined in solr/biblio/conf/schema.xml -->
<xsl:stylesheet version="1.0"
    <xsl:output method="xml" indent="yes" encoding="utf-8"/>
    <xsl:param name="institution">MZK</xsl:param>
    <xsl:param name="collection">Kramerius</xsl:param>
    <xsl:template match="oai_dc:dc">
                <!-- ID -->
                <field name="id">
                    <xsl:value-of select="//identifier"/>

                <!-- RECORDTYPE -->
                <field name="recordtype">kramerius</field>

                <!-- INSTITUTION -->
                <field name="institution">
                    <xsl:value-of select="$institution" />

                <!-- COLLECTION -->
                <field name="collection">
                    <xsl:value-of select="$collection" />

                <!-- LANGUAGE -->
                <xsl:if test="//dc:language">
                    <xsl:for-each select="//dc:language">
                        <xsl:if test="string-length() > 0">
                            <field name="language">
                                <xsl:value-of select="php:function('VuFind::mapString', normalize-space(string(.)), '')"/>

                <!-- SUBJECT -->
                <xsl:if test="//dc:subject">
                    <xsl:for-each select="//dc:subject">
                        <xsl:if test="string-length() > 0">
                            <field name="topic">
                                <xsl:value-of select="normalize-space()"/>

                <!-- DESCRIPTION -->
                <xsl:if test="//dc:description">
                    <field name="description">
                        <xsl:value-of select="//dc:description" />

                <!-- ADVISOR / CONTRIBUTOR -->
                <xsl:if test="//dc:contributor[normalize-space()]">
                    <field name="author_additional">
                        <xsl:value-of select="//dc:contributor[normalize-space()]" />

		<field name="format">Electronic</field>

                <!-- AUTHOR -->
                <xsl:if test="//dc:creator">
                    <xsl:for-each select="//dc:creator">
                        <xsl:if test="normalize-space()">
                            <!-- author is not a multi-valued field, so we'll put
                                 first value there and subsequent values in author2.
                            <xsl:if test="position()=1">
                                <field name="author">
                                    <xsl:value-of select="normalize-space()"/>
                                <field name="author-letter">
                                    <xsl:value-of select="normalize-space()"/>
                            <xsl:if test="position()>1">
                                <field name="author2">
                                    <xsl:value-of select="normalize-space()"/>

                <!-- TITLE -->
                <xsl:if test="//dc:title[normalize-space()]">
                    <field name="title">
                        <xsl:value-of select="//dc:title[normalize-space()]"/>
                    <field name="title_short">
                        <xsl:value-of select="//dc:title[normalize-space()]"/>
                    <field name="title_full">
                        <xsl:value-of select="//dc:title[normalize-space()]"/>
                    <field name="title_sort">
                        <xsl:value-of select="php:function('VuFind::stripArticles', string(//dc:title[normalize-space()]))"/>

                <!-- PUBLISHER -->
                <xsl:if test="//dc:publisher[normalize-space()]">
                    <field name="publisher">
                        <xsl:value-of select="//dc:publisher[normalize-space()]"/>

                <!-- PUBLISHDATE -->
                <xsl:if test="//dc:date">
			<!-- only take the last element as the actual date -->
		        <field name="publishDate">
				<xsl:value-of select="//dc:date[last()]"/>
		        <field name="publishDateSort">
				<xsl:value-of select="//dc:date[last()]"/>

