# Suchoptionen Metadaten

In [25]:
import pandas as pd

"""Einlesen der Metadaten-Tabelle als Dataframe"""
df_metadata = pd.read_csv("files\metadata_letters.csv")

def list_content(column_name):
    """Auflisten der unique-Werte einer Spalte des Dataframe in alphabetischer Reihenfolge"""
    names = (df_metadata[column_name].unique())
    for i in sorted(names):
        print(i)

def print_result(column_name, name):
    """Ausgabe der Zeilen des Dataframe, die ein Suchwort (= name) enthalten"""
    result = df_metadata.loc[df_metadata[column_name] == name, "Dateiname"].to_list()
    for i in result:
        print(i)

## Suche nach Absendern

### Ausgeben einer Liste von Absendern

In [26]:
list_content("Absender*in")

Aapeli Saarisalo
Benno Landsberger
Cyril John Gadd
François Thureau-Dangin
Friedrich Stummer
Giorgio Castellino
Harri Holma
Jakob J. Finkelstein
Joh. F. Kunstmann
Johannes Pedersen
Karl Budde
Karl Friedrich Müller
Reginald Campbell Thompson
Richard Hartmann
Walter Andrae
Walter G. Kunstmann


### Auswahl eines Namens und Ausgabe der zugehörigen Briefe

In [27]:
#Einfügen des gesuchten Namens
name = "Benno Landsberger"

print_result("Absender*in", name)

1929-06-06_Landsberger_ThureauDangin
1935-09-17_Landsberger_Mueller
1936-05-05_Landsberger_Mueller
1936-07-10_Landsberger_Mueller
1936-11-07_Landsberger_Mueller
1936-12-13_Landsberger_Mueller
1936-12-17_Landsberger_Mueller
1936-12-28_Landsberger_Mueller
1937-02-09_Landsberger_Mueller
1937-03-01_Landsberger_Mueller
1937-03-29_Landsberger_Mueller
1937-04-01_Landsberger_Mueller
1937-04-06_Landsberger_Mueller
1937-04-13_Landsberger_Mueller
1937-05-03_Landsberger_Mueller
1937-05-08_Landsberger_Mueller
1937-05-14_Landsberger_Mueller
1937-06-01_Landsberger_Mueller
1937-06-19_Landsberger_Mueller
1937-07-19_Landsberger_Mueller
1937-10-08_Landsberger_Mueller
1937-12-12_Landsberger_Mueller
1938-01-29_Landsberger_Mueller
1938-08-04_Landsberger_Mueller
1938-08-15_Landsberger_Mueller
1938-08-24_Landsberger_Mueller
1956-02-15_Landsberger_Segerstedt
1960-09-27_Landsberger_Aro


## Suche nach Empfängern

### Ausgeben einer Liste von Empfängern

In [28]:
list_content("Empfänger*in")

Benno Landsberger
François Thureau-Dangin
Jussi Aro
Karl Friedrich Müller
Torgny Segerstedt


### Auswahl eines Namens und Ausgabe der zugehörigen Briefe

In [29]:
#Einfügen des gesuchten Namens
name = "Jussi Aro"

print_result("Empfänger*in", name)

1960-09-27_Landsberger_Aro


## Suche nach Aufenthaltsorten der Absender

### Ausgeben einer Liste von Aufenthaltsorten

In [30]:
list_content("Aufenthaltsort Absender*in")

Ankara
Berkeley
Berlin
Chicago
Frydek
Heidelberg
Helsinki 
Kopenhagen
Leipzig
London
Marburg
Oxford
Paris
Porto Alegre
Rom
Wiederitzsch 
Würzburg


### Auswahl eines Ortes und Ausgabe der zugehörigen Briefe

In [31]:
#Einfügen des gesuchten Ortes
name = "Leipzig"

print_result("Aufenthaltsort Absender*in", name)

1929-07-10_Mueller_Landsberger


## Suche nach einem Datumszeitraum

In [32]:
#Einfügen eines Datumszeitraums
start_date = "1929-01-01"
end_date = "1931-01-01"

"""Umwandeln des Datums in ein Datetime-Format; Definieren des Datumszeitraums"""
df_metadata["Datum (ISO 8601)"] = pd.to_datetime(df_metadata["Datum (ISO 8601)"], format="ISO8601")
mask = (df_metadata["Datum (ISO 8601)"] > start_date) & (df_metadata["Datum (ISO 8601)"] <= end_date)

result_date = df_metadata.loc[mask, "Dateiname"].to_list()
for i in result_date:
    print(i)

1929-06-06_Landsberger_ThureauDangin
1929-07-10_Mueller_Landsberger
1929-12-09_Hartmann_Landsberger
1930-01-03_Budde_Landsberger


## Suche nach der Briefsprache

### Ausgeben einer Liste von Sprachen

In [33]:
list_content("Sprache")

deutsch
englisch
französisch


### Auswahl einer Sprache und der zugehörigen Briefe

In [34]:
#Einfügen der gesuchten Sprache
name = "englisch"

print_result("Sprache", name)

1933-03-08_Gadd_Landsberger
1943-10-01_Thompson_Landsberger
1956-02-15_Landsberger_Segerstedt
1960-09-27_Landsberger_Aro
1962-02-19_Finkelstein_Landsberger


# Suchoptionen Briefinhalte

In [35]:
import glob
import re
from bs4 import BeautifulSoup
from os.path import join

def content_search(tag, attribute):
    """Einlesen der in TEI kodierten Textinhalte;
    Auffinden von ausgesuchten Tags und Attributen;
    Ausgabe des Ergebnis im Format 'Gesuchtes Tag: Briefname'
    """
    for file in glob.glob(join(f"files", "letters", "tei", "*.xml")):
        with open(file, "r", encoding="utf-8") as infile:
            text = infile.read()
            filename = file.split("\\")[-1].split(".")[0]
            soup = BeautifulSoup(text, "xml")
            tag_list = soup.find_all(tag, attribute)
            tag_tuple_list = []
            for i in tag_list:
                i = i.text
                i = re.sub("\n", "", i)
                i = re.sub("  ", "", i)
                i = (i, filename)
                tag_tuple_list.append(i)
            tag_tuple_list = list(set(tag_tuple_list))
            tag_tuple_list.sort(key=lambda t : tuple(t[0].lower()))
            for x,y in tag_tuple_list:
                print(x + ": " + y)

### Erwähnungen von modernen Personen

In [36]:
content_search("persName", {"type" : "modern"})

Dr. Schott: 1929-12-09_Hartmann_Landsberger
G.: 1929-12-09_Hartmann_Landsberger
Götze: 1929-12-09_Hartmann_Landsberger
Langdon: 1931-03-11_ThureauDangin_Landsberger
Professeur Zimmern: 1931-03-11_ThureauDangin_Landsberger


### Erwähnungen von altorientalischen Personen

In [37]:
content_search("persName", {"type" : "ANE"})


### Erwähnungen von modernen Orten

In [38]:
content_search("placeName", {"type" : "modern"})

Leipzig: 1929-12-09_Hartmann_Landsberger
Marburg: 1929-12-09_Hartmann_Landsberger
Leipzig: 1931-03-11_ThureauDangin_Landsberger


### Erwähnungen von altorientalischen Orten

In [39]:
content_search("placeName", {"type" : "ANE"})

Assur: 1929-07-10_Mueller_Landsberger
assyrischen Reiches: 1929-07-10_Mueller_Landsberger


### Erwähnungen von altorientalischen Göttern

In [40]:
content_search("name", {"type" : "deity"})

Assur: 1929-07-10_Mueller_Landsberger
Assurs: 1929-07-10_Mueller_Landsberger
Enlil: 1929-07-10_Mueller_Landsberger
Marduk: 1929-07-10_Mueller_Landsberger
Mārat-nāri: 1929-07-10_Mueller_Landsberger
Ninlil: 1929-07-10_Mueller_Landsberger
Serua: 1929-07-10_Mueller_Landsberger


### Erwähnungen von Forschungspublikationen

In [41]:
content_search("title", {"type" : "journal"})

MDOG 60: 1929-07-10_Mueller_Landsberger
RA XIV pp. 1 et suiv: 1931-03-11_ThureauDangin_Landsberger


In [42]:
content_search("title", {"type" : "monograph"})

1er volumede la Neue Folge des Leipziger Semi-tische Studien: 1931-03-11_ThureauDangin_Landsberger
étude sur la série ana ittišu: 1931-03-11_ThureauDangin_Landsberger


### Erwähnungen von Keilschrifttexten

In [43]:
content_search("title", {"type" : "cuneiformtext"})

8. Feldzug Sargons: 1929-07-10_Mueller_Landsberger
KAR 139: 1929-07-10_Mueller_Landsberger
Krönungsritual: 1929-07-10_Mueller_Landsberger


### Erwähnungen von altorientalischen Textpassagen oder Lemmata

### Akkadisch

In [44]:
content_search("foreign", {"xml:lang" : "akk"})

ab-ba-sa: 1929-07-10_Mueller_Landsberger
abnu: 1929-07-10_Mueller_Landsberger
ip-pal: 1929-07-10_Mueller_Landsberger
kararu: 1929-07-10_Mueller_Landsberger
Pû-lišānu: 1929-07-10_Mueller_Landsberger


### Erwähnungen von altorientalischen Sprachen

In [45]:
content_search("lang", "")

Aramäischen: 1929-07-10_Mueller_Landsberger
Akkadisch: 1929-12-09_Hartmann_Landsberger
