Inhalte Notebook
- Suche nach Stichwort, z.B. Wysung -> ev. Hinweis, dass Suche eine gewisse Zeit dauern kann.
	- Bsp. machen, z.B. Berufsbezeichnungen, Organisationen
- Filtere Suche nach Zeitraum
- Resultate aufgelistet
- Stelle Resultat im Raum dar (Dossier)

TODO
- Create Readme
- Update Requirements

Offene Fragen
- Soll das Notebook, d.h. Kommentare innerhalb Zellen sowie Textzellen auf Deutsch oder Englisch sein?
- Kann die Jahreszahl im xml einen Integer sein (nicht Float)?
- Ist es möglich, die UUID von project_entry zu ergänzen? Ebenfalls URL zu Digitalisat und Koordinaten.
- Welcher Suchbegriff wäre ideal als Beispiel zusätzlich zur Freitextsuche? Suche nach einer bestimmten Berufsbezeichnung/Organisation, welche annotiert ist.
- Sollen die Resultate standardmässig als Exceltabelle exportiert werden können?

# Importiere Packages
Importiere für dieses Skript notwendige Funktionen.

In [1]:
import xml.etree.ElementTree as ET
import pandas as pd
from IPython.display import display

# Freitextsuche
Beispiel: Suche nach dem Begriff "Wysung" in Paragraphen von Dokumenten im Zeitraum 1550 – 1600.

## Definiere Suchparameter
Festlegen der gewünschten Parameter für die Suche.

In [2]:
# Set search word.
SEARCH_KEYWORD = 'Wysung'

# Define search period.
YEAR_MIN = 1550
YEAR_MAX = 1600

# Datasource for the search.
# TODO Has to be updated.
FILEPATH_DATASOURCE = './data/hgb_corpus_inline.xml'

## Suche ausführen


In [3]:
# Load xml file.
tree = ET.parse(FILEPATH_DATASOURCE)

# Get root element.
root = tree.getroot()

# Create an empty dataframe to store the search results.
results = pd.DataFrame(
    columns=['dossier', 'pages', 'year', 'text']
    )

# Iterate over each document.
for document in root.findall('Document'):

    # Get the header element.
    header = document.find('Header')

    # Determine the year of the document.
    year = float(header.get('year'))

    # Skip the document if not in desired search period.
    if year < YEAR_MIN or year > YEAR_MAX:
        continue

    # Get the text element.
    text = header.get('text')

    # Search for keyword in text.
    if SEARCH_KEYWORD in text:
    
        # Store selected elements in dataframe.
        results.loc[len(results)] = [
            header.get('dossier'),
            header.get('pages'),
            year,
            text
            ]

# Print the number of search results.
print(f'The keyword "{SEARCH_KEYWORD}" was found in {results.shape[0]} documents '
      f'in the period {YEAR_MIN} - {YEAR_MAX}.'
      )

# Print the dataframe.
display(results.style)

The keyword "Wysung" was found in 15 documents in the period 1550 – 1600.


Unnamed: 0,dossier,pages,year,text
0,HGB_1_018_024,34,1570.0,"Balthasar Mygel. Schaffner der Presentz uff Burg, hat Urban Steinmüllers des Schlossers Hus und Hofstatt, an der Freyenstrass, oben bim Leümlin, an den Schwellen, zwüschen den Hüsern zum Helden und Herman von Thalhein glegen und zum guldinen Ortlin gnannt ist, versessener Zins. en wegen, als der Presentz jährl. von Eigenschaft wegen 3 ℔ und 4 rings Brott, sodann 1 ℔ und 2 ring brott zur Wysung zinst wird, gefrönt."
1,HGB_1_024_074,29,1552.0,"Privat Urkunde. Ambrosi Dorn der Fischmacher, Burger zu Basel und Margreth sin eelich Wyb verkaufen dem Closter zu sant Lienhart zu Basel 10 sh. Gelts jerlichs Zinses von uff und abe irem Sashuse und Hofstatt sambt dem Höffli darhinder, als das in der Statt Basel, oben an der Gär¬ wer Gassen, zwischen dem Huss Grüneckh und Risen Hus gelegen und Herrnberg genant ist, zinst jerlichs von wegen der Eigenschafft dem gemelten Kloster, vormols 2 ℔. Zinspfg, 2 Ring Brots zu Wysung und 3sh. zu Erschatz, sodann zinset das Höffli in das Hus Babenberg 13 sh. und 4 Sabler Zinspfg. dem Closter Clingen, tal 1 ℔. Gelts, um 10℔. Stäbler."
2,HGB_1_024_119,37,1577.0,"Hanns Lux Hagenbach, Schaffner und jnnamen der Presen, S. Peter Stift, hat Michel Böglins, Meigers zu Buschwyler, Hus und Hofstatt by der Barfüssern, gegen Barfüssericht über zu einer dem Hus Hudan, genannt Heinrich Betzen Hus, andersyts neben dem Hus Pflatterin gelegen, versessener Zinsen wegen, als der Presentz jährl. darab 10 sh. ein ring brots zur Wysung und 2 ½ sh. zu Erschatz zinst wird, gefrönt."
3,HGB_1_056_045,41,1570.0,"Georg Bierman Schaffner des Closters st. Claren im mindern Basel, hat Balt¬ hasar Langen, des Seylers, Haus und Hofstatt, under dem Salgasten vor und hinden zwischen Lorentz Rychart dem Scherrer und Mr. Batt Huen dem Vischkeüffer glegen, versessener zinsen wegen, als dem Closter jährl. darab 7 ℔. 2 ℔ Pfeffer 4 Ring zur Wysung und 2 ℔ zu Erschatz zinst wird, gefrönt."
4,HGB_1_058_041,"15, 16",1575.0,"Rathsurkunde. Der Rath bewilligt dem Burger Ambrosien Darmosen, wirt zu dem Wildenman in Basel in dara Köwin, siner ehelichen Husfrowen, das solliche Herberg, doch it leger, dan ir beder Reben lang und so lang sie bede Wegemacht dieselb ir Herberg ze dem Wildenmann eigener Person besitzen, hewonen, ein Herren Herberg sein, die wie andere Herren Würt bruchen und das sy desshalb nach Wysung unser erkhantin und gesetzten Ordnung ein zwey, oder dreyerleg wyn haben, denselben Jren Gesten zutrinckhen, das Mal u. mit mehr das Pfenwert. geben, u. dieselben Wyn, so sie inlegendt, noch der Ordmung sag, besigen lassen, und davon das Ambgelt bezalen, die Gest frenndtlichen u. bescheidenlichen hallten, allen utzen Gesindem liederlicher Lüden, alls hemifegern, Schaffhonte Trägern u. derglychen nachtbarer noch gülltigen Personen sich entschlachen, die Im beherbergen mit uffneinen, sonders sachs fürweysen u. alls die [sep] obgemelte Her Herberg, u. Würtshafft sober, u. seg, wie Herren Würten geburt u. intodt, Kallten sollen. falls die obgemelte bede Ehgemelt die Herberg verlychen des verkaufen, so hat der Uebenchmar eine nam Bewilligung einzuhaler, was ihm von der den Glog, dentlich zu erklarmist."
5,HGB_1_058_070,34,1573.0,"Privat Urkunde. Christen Murer der Schuchmacher des Rhatz zu Basel und Barbel Scholtmann syn Ehfrouw verkaufen Lien¬ harten Schotmans 6 ℔. 5 sh. jerlichs Zinses von uff und ab irem Hus und Hofstat an der freigen Strass gelegen und Sandt Jacobs Hus genant, einseit neben Herren Tantha leon Wurstysen, anderseit neben Samuel Wurstysen gelegen stost hinden an den Liechtenfelser Hoff, zinst dem Spittal 10 sh. ein Ring Brot ze Wysung, der Presentz uff Burg 10sh. sonst ledig eigen, umb 125 ℔."
6,HGB_1_063_113,56,1550.0,"Das Spital hat Hannsen Merrot des Küblers Huss und Hofstatt, jnn der Gerwergassen, zwüschen den Hüsern Oberburg und Ho¬ chenstein glegen, und Niderburg gnannt ist, versessener zinsen halp als solich Hus jährl. dem Spittal von Eigenschaft 2 ℔. 1/2 ℔ Pfeffer. zur Wysung und 5sh. zu Erschatz zinst, gefrönt."
7,HGB_1_064_037,13,1563.0,"Privat- Urk. Peter von Mechell der Buchfürer und Barbara For Steri sin Eefrow übertragen einen Zins von 3 ℔, 2 heiner zu Wysung, und 2ß Erschatz, den das Petersstift von Eig Schaft wegen gehept hat uff dem Othus im hinderg Gerbergessli am obern Byrsich als man zu S. Lienhart den Berg uffgodt, gegen S. Oswalts Cappell über, zu einer Sesten an Ulrichen Bratteler und zur andern sesten neben Jacoben Keller gelegen, welches hans die erkauft haben, auf ir haus genant Crützberg an dem obern Gerberg Gerwergesslin uff dem obern Birsich mit den Garten darhinder, sampt dem andern Garten so zu dem vorbemelten Orthus gedienet hat, ouch dem Ussgang so vormalen beyden hüseren gunderen gewesen, hinden uff S. Lienhartsberg, so ledig eigen."
8,HGB_1_064_037,"16, 17",1564.0,"oder zu Pfingsten samethaft zu bezalen und 2 Hüner Wysung auch 2ß erschatz, alles von wegen der eygenschaft zu bezalen. Disen Zins haben etwan geben Peter von Mechel der Buch¬ fürer und Barbara Forsteri sein chefrow von uf und ab irem Haus und Hofstatt, genannt. Creutzberg, gelegen in der Statt Basel, en dem obern Gerber geslin uf dem oberen Birsich, mit dem garten darhinder sampt dem anderen Gar¬ ten, so zu dem vorbemelten Orthaus gedient hat, auch dem ausgang so vormalen bey den Heüsern gemein gewesen, hinden uf sanct Lienhardsberg darzu gehörend ist, sonst frey, ledig eygen. Datum: Anno 1564 Es ist auch zuwissen, das diser Zins von langen [sep] zeten har uf dem Orthus under den gerwern an sanct Lienhardtsberg, als man das geslin ufgadt, darinnen etwan gewohnet hat und den Zins ge¬ ben Mathis Stürtzel der permenter, zu einer sei¬ ten an Meister Ulrich Brattenler, und zur anderen seiten neben Jacoben Keller gelegen, gestanden ist. als dan das der alt brief uszug und obgemelter brief meldend und in sich halten, aber uf Datum des briefs ist daselbig Orthus frey gesagt. das gemelt Haus zum Creutz¬ berg zu eygenthümblichen underpfandt an statt des Thenigen angenomen, durch frund. licher pitt willen der obgesagten Personen. Und sint die 2 ℔ und 2 Hüner und 2ß erschatz erkauft mit 50 gld. von Plorentz, das ander fund des gemeldten zinses mit 21 ℔ 5ß."
9,HGB_1_064_039,12,1571.0,"Hanns Lus Yselin, Schaffner der Cartus im mindern Basel, hat Jacob Kellers des Metzgers Hus, genannt Stauffenberg, zwüschen dem Hus genannt Küngs felden und Gip des Gerbers Hus, versessener zinsen wegen, als der Kartus¬ jährl. darab 6 sh. 8 dn. von Eigenschaft wegen, sodann 2 ring Protts zur Wysung, 34/682 und 5 sh. zu Erschatz zinst wird, gefrönt."


# Suche nach einer Annotation
TODO: Suche nach was wäre ein ideales Beispiel?

# Visualisiere Ergebnisse im Raum

TODO
- Dossier der Ergebnisse im Raum darstellen (wenn Standorte verfügbar)

In [4]:
from ipyleaflet import Map, WMSLayer

wms = WMSLayer(
    url='https://wms.geo.bs.ch/',
    layers='HP_Uebersichtsplaene_Basel_Situationsplan1862',
    attribution='Geodaten Kanton Basel-Stadt'
)
m = Map(basemap=wms, center=(47.557, 7.595), zoom=15)
# m.add()
m

Map(center=[47.557, 7.595], controls=(ZoomControl(options=['position', 'zoom_in_text', 'zoom_in_title', 'zoom_…

# Exportiere Suchresultate?
- Dataframe als Exceltabelle exportieren?