# attribut_a

In [None]:
### Mit Commentaren

In [1]:
from lxml import etree

def parse_xsd(file_path):
    # XSD-Datei parsen
    parser = etree.XMLParser(remove_comments=False)
    tree = etree.parse(file_path, parser)
    root = tree.getroot()

    # Werte des Attributs 'value' und zugehörige Kommentare extrahieren
    values_with_comments = []
    ns = {'xs': 'http://www.w3.org/2001/XMLSchema'}
    
    for elem in root.findall('.//xs:enumeration', namespaces=ns):
        value = elem.get('value')
        comment = None
        
        # Prüfen, ob es einen Kommentar direkt nach dem Element gibt
        next_elem = elem.getnext()
        if isinstance(next_elem, etree._Comment):
            comment = next_elem.text.strip()

        values_with_comments.append((value, comment))
    
    return values_with_comments

def filter_values(values_with_comments):
    # Werte filtern, um Zeilen zu eliminieren, die Teil anderer Zeilen sind
    filtered_values_with_comments = []
    for value, comment in values_with_comments:
        if not any(value in other_value for other_value, _ in values_with_comments if value != other_value):
            filtered_values_with_comments.append((value, comment))
    return filtered_values_with_comments

def save_to_xhtml(values_with_comments, output_path):
    # XHTML-Datei erstellen und Werte speichern
    xhtml_content = '''<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
    <title>Indizies</title>
    <style>
        span.comment { color: red; font-style: italic; }
        body{
        .font-family: Arial, sans-serif; font-size: 16px;

        .floating-btn {
            width: 60px;
            height: 60px;
            background-color: None;
            border-radius: 50%;
            box-shadow: 0px 4px 8px rgba(0, 0, 0, 0);
            display: flex;
            justify-content: center;
            align-items: center;
            color: white;
            font-size: 16px;
            text-align: center;
            text-decoration: none;
            position: fixed;
            bottom: 20px;
            right: 20px;
            transition: box-shadow 0.3s ease;
        }

       h{
           font-size: 16px;
           font-weight: bold;
        }
}
    </style>

</head>
<body>
<div>
<ul><h>Attribut a</h></ul>
<ul><h>Vereinigtes Register internationaler Märchenindices</h></ul>

<p>
Das Register umfasst die Indices, die bisher in der Praxis zur Katalogisierung von Märchen eingesetzt wurden. 
Dabei wird folgende Regel beachtet:</p>

<p>Die Indizierung erfolgt zunächst nach dem Typenkatalog der internationalen Märchen (ATU = The Types of International 
Folktales: A Classification and Bibliography. Based on the System of Antti Aarne and Stith Thompson. By Hans-Jörg Uther.
FF Communication Nr. 284. Helsinki 2004). Bei der Erfassung der Texte gemäß diesem Katalog wird nur die Typnummer 
verwendet; das Zeichen „a“ vor der Typnummer kennzeichnet das entsprechende Attribut. Z. B. a301 = ATU 301 
Die drei geraubten Prinzessinnen.</p>

<p>Sollte eine passende Nummer in diesem Katalog fehlen, wird versucht, den betreffenden Text oder einen Teil davon mit 
Hilfe eines der folgenden Kataloge zu erschließen: </p>
<ul>
<li>Motivkatalog von Stith Thompson (MIT=Stith Thompson: Motif-Index of Folk-Literature: A Classification of Narrative 
Elements in Folktales, Ballads, Myths, Fables, Medieval Romances, Exempla, Fabliaux, Jest-books and Local Legends. 
6 Bände. Bloomington u.a., 1955-1958. Texte, die nach diesem Katalog erschlossen wurden, werden durch die 
Abkürzung „aMIT“ gefolgt von der Motivnummer gekennzeichnet.</li>

<li>Liste von Epos-Werken der Weltliteratur: Evidente Parallelen mit populären Werken der mittelalterlichen Literatur 
werden nach einem einfachen Register dieser Werke erfasst. Die Indizierung erfolgt durch die Abkürzung „aE“, 
gefolgt von der Nummer des Werkes.</li>

<li>Register humoristischer Geschichten von Mulla Nasreddin: Dieses Register basiert auf den Textnummern der 
russischsprachigen Sammlung Двадцать три Насреддина, M. 1978. Falls der in diesem Band erfasste Text eine ATU- oder 
MIT-Nummer besitzt, wird diese bevorzugt verwendet. Andernfalls wird die Abkürzung „anh“ genutzt, was 
für „Attribut a - Nasreddin Hodja“ steht, gefolgt von der Textnummer in der Sammlung.</li>
</ul>
<p>Neben den einfachen Bezeichnungen der inhaltlichen Einheiten finden sich im vorliegenden Register auch Kommentare 
zu diesen Einheiten. Diese sind als rot markierte Textabschnitte leicht zu erkennen. Sie beschreiben in der Regel 
die identitätsstiftenden Merkmale des Typs und helfen dabei, den Katalog so einheitlich wie möglich anzuwenden.
</p> 
</div>
<ul>
'''
    for value, comment in values_with_comments:
        xhtml_content += f'  <li>{value}'
        if comment:
            xhtml_content += f' <span class="comment">({comment})</span>'
        xhtml_content += '</li>\n'

    xhtml_content += '''</ul>
 <a href="https://www.folklore.uni-jena.de" class="floating-btn" target="_parent">
    <img src="home-icon.png" style="width: 40px; height: 40px;" />
</a>


</body>
</html>'''

    with open(output_path, 'w', encoding='utf-8') as file:
        file.write(xhtml_content)

# Dateipfade
xsd_file_path = 'kf/vmf_a.xsd'  # Pfad zur XSD-Datei
xhtml_output_path = 'attribut_a.xhtml'  # Pfad zur Ausgabedatei

# Schritte ausführen
values_with_comments = parse_xsd(xsd_file_path)
filtered_values_with_comments = filter_values(values_with_comments)
save_to_xhtml(filtered_values_with_comments, xhtml_output_path)

print(f'Gefilterte Werte und Kommentare wurden in {xhtml_output_path} gespeichert.')

Gefilterte Werte und Kommentare wurden in attribut_a.xhtml gespeichert.


In [None]:
### Mit Annotation

In [2]:
from lxml import etree

def parse_xsd(file_path):
    # XSD-Datei parsen
    parser = etree.XMLParser(remove_comments=False)
    tree = etree.parse(file_path, parser)
    root = tree.getroot()

    # Werte des Attributs 'value' und zugehörige Dokumentationen extrahieren
    values_with_documentation = []
    ns = {'xs': 'http://www.w3.org/2001/XMLSchema'}

    for elem in root.findall('.//xs:enumeration', namespaces=ns):
        value = elem.get('value')
        documentation = None

        # Suche nach dem <xs:documentation>-Tag innerhalb von <xs:annotation>
        annotation = elem.find('.//xs:annotation', namespaces=ns)
        if annotation is not None:
            documentation_elem = annotation.find('.//xs:documentation', namespaces=ns)
            if documentation_elem is not None:
                documentation = documentation_elem.text.strip()

        values_with_documentation.append((value, documentation))

    return values_with_documentation

def filter_values(values_with_documentation):
    # Werte filtern, um Zeilen zu eliminieren, die Teil anderer Zeilen sind
    filtered_values_with_documentation = []
    for value, documentation in values_with_documentation:
        if not any(value in other_value for other_value, _ in values_with_documentation if value != other_value):
            filtered_values_with_documentation.append((value, documentation))
    return filtered_values_with_documentation

def save_to_xhtml(values_with_documentation, output_path):
    # XHTML-Datei erstellen und Werte speichern
    xhtml_content = '''<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
    <title>Indizies</title>
    <style>
        span.comment { color: red; font-style: italic; }
        body {
            font-family: Arial, sans-serif; font-size: 16px;
        }
        .floating-btn {
            width: 60px;
            height: 60px;
            background-color: None;
            border-radius: 50%;
            box-shadow: 0px 4px 8px rgba(0, 0, 0, 0);
            display: flex;
            justify-content: center;
            align-items: center;
            color: white;
            font-size: 16px;
            text-align: center;
            text-decoration: none;
            position: fixed;
            bottom: 20px;
            right: 20px;
            transition: box-shadow 0.3s ease;
        }
        h {
            font-size: 16px;
            font-weight: bold;
        }
    </style>
</head>
<body>
<div>
<ul><h>Attribut a</h></ul>
<ul><h>Vereinigtes Register internationaler Märchenindices</h></ul>

<p>Das Register umfasst die Indices, die bisher in der Praxis zur Katalogisierung von Märchen eingesetzt wurden. 
Dabei wird folgende Regel beachtet:</p>

<p>Die Indizierung erfolgt zunächst nach dem Typenkatalog der internationalen Märchen (ATU = The Types of International 
Folktales: A Classification and Bibliography. Based on the System of Antti Aarne and Stith Thompson. By Hans-Jörg Uther.
FF Communication Nr. 284. Helsinki 2004). Bei der Erfassung der Texte gemäß diesem Katalog wird nur die Typnummer 
verwendet; das Zeichen „a“ vor der Typnummer kennzeichnet das entsprechende Attribut. Z. B. a301 = ATU 301 
Die drei geraubten Prinzessinnen.</p>

<p>Sollte eine passende Nummer in diesem Katalog fehlen, wird versucht, den betreffenden Text oder einen Teil davon mit 
Hilfe eines der folgenden Kataloge zu erschließen: </p>
<ul>
<li>Motivkatalog von Stith Thompson (MIT=Stith Thompson: Motif-Index of Folk-Literature). Texte, die nach diesem 
Katalog erschlossen wurden, werden durch die Abkürzung „aMIT“ gekennzeichnet.</li>

<li>Liste von Epos-Werken der Weltliteratur: Die Indizierung erfolgt durch die Abkürzung „aE“, gefolgt von der Nummer 
des Werkes.</li>

<li>Register humoristischer Geschichten von Mulla Nasreddin. Falls der in diesem Band erfasste Text eine ATU- oder 
MIT-Nummer besitzt, wird diese bevorzugt verwendet. Andernfalls wird die Abkürzung „anh“ genutzt, gefolgt von der 
Textnummer in der Sammlung.</li>
</ul>
<p>Neben den einfachen Bezeichnungen der inhaltlichen Einheiten finden sich im vorliegenden Register auch Kommentare 
zu diesen Einheiten. Diese sind als rot markierte Textabschnitte leicht zu erkennen.</p>
</div>
<ul>
'''
    for value, documentation in values_with_documentation:
        xhtml_content += f'  <li>{value}'
        if documentation:
            xhtml_content += f' <span class="comment">({documentation})</span>'
        xhtml_content += '</li>\n'

    xhtml_content += '''</ul>
 <a href="https://www.folklore.uni-jena.de" class="floating-btn" target="_parent">
    <img src="home-icon.png" style="width: 40px; height: 40px;" />
</a>
</body>
</html>'''

    with open(output_path, 'w', encoding='utf-8') as file:
        file.write(xhtml_content)

# Dateipfade
xsd_file_path = 'kf/vmf_a.xsd'  # Pfad zur XSD-Datei
xhtml_output_path = 'attribut_a.xhtml'  # Pfad zur Ausgabedatei

# Schritte ausführen
values_with_documentation = parse_xsd(xsd_file_path)
filtered_values_with_documentation = filter_values(values_with_documentation)
save_to_xhtml(filtered_values_with_documentation, xhtml_output_path)

print(f'Gefilterte Werte und Dokumentationen wurden in {xhtml_output_path} gespeichert.')

Gefilterte Werte und Dokumentationen wurden in attribut_a.xhtml gespeichert.
