# Scraping the website of the "Kammerspiele"

[kammerspiele website](https://www.muenchner-kammerspiele.de/de/programm/stuecke/33832-premieren-24-25)

In [98]:
import requests

In [99]:
from lxml import etree
from lxml import html

In [100]:
url = "https://www.muenchner-kammerspiele.de/de/programm/stuecke/33832-premieren-24-25"

In [101]:
resp = requests.get(url)

In [102]:
tree = etree.HTML(resp.text)

In [103]:
elements = tree.findall('.//a[@class="teaser__headline"]')
len(elements)

16

In [104]:
data = []
for elm in elements:
    link = elm.get('href')
    link = f"https://www.muenchner-kammerspiele.de{link}"
    title = elm.text
    
    row = {'link' : link, 'title': title}
    data.append(row)

In [105]:
data

[{'link': 'https://www.muenchner-kammerspiele.de/de/programm/32912-mia-san-mia',
  'title': '\n       \t\t\t\t\tMia san Mia\n\t\t\t\t\t       \t\t\t\t'},
 {'link': 'https://www.muenchner-kammerspiele.de/de/programm/32913-sie-kam-aus-mariupol',
  'title': '\n       \t\t\t\t\tSie kam aus Mariupol\n\t\t\t\t\t       \t\t\t\t'},
 {'link': 'https://www.muenchner-kammerspiele.de/de/programm/32914-amerika-der-verschollene',
  'title': '\n       \t\t\t\t\tAmerika / Der Verschollene\n\t\t\t\t\t       \t\t\t\t'},
 {'link': 'https://www.muenchner-kammerspiele.de/de/programm/33792-fremd',
  'title': '\n       \t\t\t\t\tFremd\n\t\t\t\t\t       \t\t\t\t'},
 {'link': 'https://www.muenchner-kammerspiele.de/de/programm/32915-balau',
  'title': '\n       \t\t\t\t\tBalau\n\t\t\t\t\t       \t\t\t\t'},
 {'link': 'https://www.muenchner-kammerspiele.de/de/programm/33379-drinnen',
  'title': '\n       \t\t\t\t\tDrinnen\n\t\t\t\t\t       \t\t\t\t'},
 {'link': 'https://www.muenchner-kammerspiele.de/de/programm/3

In [106]:
for entry in data:
    entry['title'] = entry['title'].strip()

In [107]:
import pandas as pd

In [108]:
kammer_24 = pd.DataFrame(data)
kammer_24

Unnamed: 0,link,title
0,https://www.muenchner-kammerspiele.de/de/progr...,Mia san Mia
1,https://www.muenchner-kammerspiele.de/de/progr...,Sie kam aus Mariupol
2,https://www.muenchner-kammerspiele.de/de/progr...,Amerika / Der Verschollene
3,https://www.muenchner-kammerspiele.de/de/progr...,Fremd
4,https://www.muenchner-kammerspiele.de/de/progr...,Balau
5,https://www.muenchner-kammerspiele.de/de/progr...,Drinnen
6,https://www.muenchner-kammerspiele.de/de/progr...,Baumeister Solness
7,https://www.muenchner-kammerspiele.de/de/progr...,proteus 2481
8,https://www.muenchner-kammerspiele.de/de/progr...,Oh Schreck!
9,https://www.muenchner-kammerspiele.de/de/progr...,Mephisto


In [109]:
list_links = [entry["link"] for entry in data] 

In [110]:
list_links

['https://www.muenchner-kammerspiele.de/de/programm/32912-mia-san-mia',
 'https://www.muenchner-kammerspiele.de/de/programm/32913-sie-kam-aus-mariupol',
 'https://www.muenchner-kammerspiele.de/de/programm/32914-amerika-der-verschollene',
 'https://www.muenchner-kammerspiele.de/de/programm/33792-fremd',
 'https://www.muenchner-kammerspiele.de/de/programm/32915-balau',
 'https://www.muenchner-kammerspiele.de/de/programm/33379-drinnen',
 'https://www.muenchner-kammerspiele.de/de/programm/32916-baumeister-solness',
 'https://www.muenchner-kammerspiele.de/de/programm/32917-proteus-2481',
 'https://www.muenchner-kammerspiele.de/de/programm/32918-oh-schreck',
 'https://www.muenchner-kammerspiele.de/de/programm/32919-mephisto',
 'https://www.muenchner-kammerspiele.de/de/programm/32920-rce-remotecodeexecution',
 'https://www.muenchner-kammerspiele.de/de/programm/32921-katzelmacher',
 'https://www.muenchner-kammerspiele.de/de/programm/32922-tristan-und-isolde',
 'https://www.muenchner-kammerspie

In [111]:
def get_description(url):
        response = requests.get(url)
        response.raise_for_status() 

        parser = etree.HTMLParser()
        tree = etree.fromstring(response.content, parser)
    
        elements = tree.findall('.//div[@class="text text--format text--format-normal"]')

        description = " ".join([elem.xpath('string()').strip() for elem in elements])

        return description.strip()

In [112]:

def get_date (url):
    response = requests.get(url)
    response.raise_for_status() 

    parser = etree.HTMLParser()
    tree = etree.fromstring(response.content, parser)

    elements = tree.findall('.//div[@class="scroller-detail"]')

    for el in elements:
        print(el.text.strip())

    dates = []
    for el in elements:
        if el.text.lower().strip().startswith('premiere:'):
            premiere_date = el.text.strip().split('Premiere:')[1].strip()
            dates.append(premiere_date)

    return dates

In [113]:
def get_premiere_date(url):
    """
    Fetches the premiere date from the given URL.
    """
    response = requests.get(url)
    response.raise_for_status()  # Check if the request was successful

    tree = html.fromstring(response.content)

    scroller_details = tree.xpath('//div[@class="scroller-detail"]')

    date_candidates = []

    for detail in scroller_details:
        text = detail.text_content().strip()
        if 'Premiere:' in text:
    
            date_candidates.append(text.replace('Premiere: ', ''))
        else:

            if len(text.split('.')) == 3 and text.split('.')[2].isdigit():
                date_candidates.append(text)

    return date_candidates[0] if date_candidates else None


In [114]:
descriptions = []
for link in list_links:
    description = get_description(link)
    print("Description:", description)
    descriptions.append(description)
    print("----")

Description: Auf einem unwirtlichen Wanderplaneten befindet sich die letzte bayerische Siedlung. Vor Jahrzehnten waren ein paar Mutige aufgebrochen, um ihr Brauchtum weiterhin ausleben zu können. Mittlerweile lebt die Siedlung vom Tourismus: Waghalsige, die eine lange Reise von der Erde auf sich nehmen, um auf dem fremden Planeten althergebrachte, fast verschwundene kulturelle Ausdrucksformen hautnah zu erleben. Doch allzu schnell wird aus dem Abenteuer ein Horrortrip.

Den chilenischen Regisseur Marco Layera verbindet eine regelmäßige Arbeitsbeziehung mit den Münchner Kammerspielen. Die gemeinsame Produktion „Oasis de la impunidad“ wurde 2022 als Teil der Weltauswahl der „New York Times“ ausgezeichnet. Nun arbeitet Layera zur Spielzeiteröffnung der Kammerspiele erstmals mit dem Ensemble eines europäischen Theaters zusammen.

 

„Obwohl ich am anderen Ende der Welt lebe, erscheint mir der Ausspruch ‚Mia san Mia‘ vertraut und erinnert mich an Aussagen, die ich von klein auf in meinem La

In [115]:
len(list_links)

16

In [116]:
len (descriptions)

16

In [117]:
premiere_date = []
count = 0
for link in list_links:
    count = count + 1  
    if get_premiere_date(link) is None:
        print(f"link {count} no premiere date")
    date = get_premiere_date(link)
    print(date)
    premiere_date.append(date)
    print("----")

 19.9.2024
----
 20.9.2024
----
 11.10.2024
----
 3.10.2024
----
 12.10.2024
----
 21.11.2024
----
 22.11.2024
----
 13.12.2024
----
 24.1.2025
----
 21.2.2025
----
 8.3.2025
----
 10.4.2025
----
 26.4.2025
----
 30.4.2025
----
 5.6.2025
----
 26.6.2025
----


In [118]:
premiere_date_clean = []
for date in premiere_date:
    date = date.strip("\ue024 ")
    premiere_date_clean.append(date)

In [119]:
premiere_date_clean


['19.9.2024',
 '20.9.2024',
 '11.10.2024',
 '3.10.2024',
 '12.10.2024',
 '21.11.2024',
 '22.11.2024',
 '13.12.2024',
 '24.1.2025',
 '21.2.2025',
 '8.3.2025',
 '10.4.2025',
 '26.4.2025',
 '30.4.2025',
 '5.6.2025',
 '26.6.2025']

In [120]:
def get_regie(url):

    response = requests.get(url)
    response.raise_for_status()  # Check if the request was successful

    tree = html.fromstring(response.content)

  
    artists = tree.xpath('//ul[@class="artists-list"]')

   
    regie_candidates = []

  
    for artist in artists:
        for item in artist.xpath('.//li'):
            text = item.text_content().strip()
            if 'Regie' in text:
                regie_candidates.append(text.replace('Regie', '').strip())

    return regie_candidates[0] if regie_candidates else None


In [121]:
get_regie(list_links[2])

'Charlotte Sprenger'

In [122]:
director = []
count = 0
for link in list_links:
    count = count + 1  
    regie = get_regie(link)
    if regie is None:
        print(f"link {count} no regie")
    print(regie)
    director.append(regie)
    print("----")

Marco Layera
----
Stas Zhyrkov
----
Charlotte Sprenger
----
link 4 no regie
None
----
Serge Aimé  Coulibaly
----
Marion Hélène Weber
----
Felicitas Brucker
----
Thomas Köck
----
Jan-Christoph Gockel
----
Jette Steckel
----
Dennis Duszczak
----
Emre Akal
----
Nele Jahnke
----
Lies Pauwels
----
Florian Fischer
----
link 16 no regie
None
----


In [123]:
director

['Marco Layera',
 'Stas Zhyrkov',
 'Charlotte Sprenger',
 None,
 'Serge Aimé  Coulibaly',
 'Marion Hélène Weber',
 'Felicitas Brucker',
 'Thomas Köck',
 'Jan-Christoph Gockel',
 'Jette Steckel',
 'Dennis Duszczak',
 'Emre Akal',
 'Nele Jahnke',
 'Lies Pauwels',
 'Florian Fischer',
 None]

In [134]:
kammer_24 ["director"] = director
kammer_24["premiere_date"] = premiere_date_clean
kammer_24["description"] = descriptions
kammer_24["theater"] = "Kammerspiele"


In [135]:
kammer_24

Unnamed: 0,link,title,director,premiere_date,description,theater
0,https://www.muenchner-kammerspiele.de/de/progr...,Mia san Mia,Marco Layera,19.9.2024,Auf einem unwirtlichen Wanderplaneten befindet...,Kammerspiele
1,https://www.muenchner-kammerspiele.de/de/progr...,Sie kam aus Mariupol,Stas Zhyrkov,20.9.2024,„Die längste Zeit meines Lebens hatte ich gar ...,Kammerspiele
2,https://www.muenchner-kammerspiele.de/de/progr...,Amerika / Der Verschollene,Charlotte Sprenger,11.10.2024,Wie kein anderer Text Kafkas beschreibt „Der V...,Kammerspiele
3,https://www.muenchner-kammerspiele.de/de/progr...,Fremd,,3.10.2024,Schauspielerin Katharina Bach stellt sich dem ...,Kammerspiele
4,https://www.muenchner-kammerspiele.de/de/progr...,Balau,Serge Aimé Coulibaly,12.10.2024,Serge Aimé Coulibaly ist bekannt für seine aus...,Kammerspiele
5,https://www.muenchner-kammerspiele.de/de/progr...,Drinnen,Marion Hélène Weber,21.11.2024,Das Gewinnerstück des Münchner Förderpreises f...,Kammerspiele
6,https://www.muenchner-kammerspiele.de/de/progr...,Baumeister Solness,Felicitas Brucker,22.11.2024,Halvard Solness ist ein skrupelloser Bauuntern...,Kammerspiele
7,https://www.muenchner-kammerspiele.de/de/progr...,proteus 2481,Thomas Köck,13.12.2024,Die Kammerspiele zeigen die sensationelle Urau...,Kammerspiele
8,https://www.muenchner-kammerspiele.de/de/progr...,Oh Schreck!,Jan-Christoph Gockel,24.1.2025,Als Vampir in F. W. Murnaus Film „Nosferatu“ w...,Kammerspiele
9,https://www.muenchner-kammerspiele.de/de/progr...,Mephisto,Jette Steckel,21.2.2025,Für den Schauspieler Hendrik Höfgen beginnt mi...,Kammerspiele


In [127]:
print(kammer_24.columns)


Index(['link', 'title', 'director', 'premiere_date', 'description'], dtype='object')


In [138]:

kammer_24["premiere_date"] = kammer_24["premiere_date"].str.replace(".", "/")

kammer_24

Unnamed: 0,link,title,director,premiere_date,description,theater
0,https://www.muenchner-kammerspiele.de/de/progr...,Mia san Mia,Marco Layera,19/9/2024,Auf einem unwirtlichen Wanderplaneten befindet...,Kammerspiele
1,https://www.muenchner-kammerspiele.de/de/progr...,Sie kam aus Mariupol,Stas Zhyrkov,20/9/2024,„Die längste Zeit meines Lebens hatte ich gar ...,Kammerspiele
2,https://www.muenchner-kammerspiele.de/de/progr...,Amerika / Der Verschollene,Charlotte Sprenger,11/10/2024,Wie kein anderer Text Kafkas beschreibt „Der V...,Kammerspiele
3,https://www.muenchner-kammerspiele.de/de/progr...,Fremd,,3/10/2024,Schauspielerin Katharina Bach stellt sich dem ...,Kammerspiele
4,https://www.muenchner-kammerspiele.de/de/progr...,Balau,Serge Aimé Coulibaly,12/10/2024,Serge Aimé Coulibaly ist bekannt für seine aus...,Kammerspiele
5,https://www.muenchner-kammerspiele.de/de/progr...,Drinnen,Marion Hélène Weber,21/11/2024,Das Gewinnerstück des Münchner Förderpreises f...,Kammerspiele
6,https://www.muenchner-kammerspiele.de/de/progr...,Baumeister Solness,Felicitas Brucker,22/11/2024,Halvard Solness ist ein skrupelloser Bauuntern...,Kammerspiele
7,https://www.muenchner-kammerspiele.de/de/progr...,proteus 2481,Thomas Köck,13/12/2024,Die Kammerspiele zeigen die sensationelle Urau...,Kammerspiele
8,https://www.muenchner-kammerspiele.de/de/progr...,Oh Schreck!,Jan-Christoph Gockel,24/1/2025,Als Vampir in F. W. Murnaus Film „Nosferatu“ w...,Kammerspiele
9,https://www.muenchner-kammerspiele.de/de/progr...,Mephisto,Jette Steckel,21/2/2025,Für den Schauspieler Hendrik Höfgen beginnt mi...,Kammerspiele


In [139]:
kammer_24.to_csv("kammer_24.csv")    