In [2]:
datapath = "../crawler/database/semester_20251"

# get a list of all json files in the directory  
import os
import json

def get_course_objects(datapath):
    json_files = []
    for file in os.listdir(datapath):
        if file.endswith(".json"):
            course = {}
            with open(os.path.join(datapath, file), 'r') as f:
                course = json.load(f)
                course["html"] = file.replace(".json", ".html")
            json_files.append(course)
    return json_files

# get the course objects
courses = get_course_objects(datapath)
total_courses = len(courses)
# filter for courses with SWS defined
courses = [course for course in courses if "Grunddaten zur Veranstaltung" in course and course["Grunddaten zur Veranstaltung"]["SWS"] != "missing" and "Veranstaltungstitel" in course]

print(f"Found {len(courses)} courses with SWS defined out of {total_courses} total courses.")

Found 632 courses with SWS defined out of 1317 total courses.


In [3]:
def print_courses(courses):
    for course in courses:

        print(f"Course: {course['Veranstaltungstitel']}")
        print(f"  Link: {course['Bisonlink'].replace('bison-connector.bauhaus', 'bison')}")
        print()

In [4]:
from pprint import pprint
import csv


for course in courses:
    analysis = {
        "Course": course["Veranstaltungstitel"],
        "Link": course["Bisonlink"].replace("bison-connector.bauhaus", "bison"),
        "Veranstaltungsart": course["Grunddaten zur Veranstaltung"]["Veranstaltungsart"],
        "Fakultät": course["Fakultät"],
        "SWS": course["Grunddaten zur Veranstaltung"]["SWS"],
        "Sprache": "Fehlt",
        "Beschreibung vorhanden": False,
        "Beschreibung": "fehlt",
        "Leistungsnachweis": False,
        "Literatur": False,
        "Voraussetzungen": False,
        "Zielgruppe": False,
    }
    if "Sprache" in course["Grunddaten zur Veranstaltung"]:
        analysis["Sprache"] = course["Grunddaten zur Veranstaltung"]["Sprache"]
    if "Weitere Angaben zur Veranstaltung" in course:
        if "Beschreibung" in course["Weitere Angaben zur Veranstaltung"]:
            if len(course["Weitere Angaben zur Veranstaltung"]["Beschreibung"]) > 30:
                analysis["Beschreibung vorhanden"] = True
                analysis["Beschreibung"] = course["Weitere Angaben zur Veranstaltung"]["Beschreibung"]
            if "Leistungsnachweis" in course["Weitere Angaben zur Veranstaltung"]:
                analysis["Leistungsnachweis"] = True
            if "Literatur" in course["Weitere Angaben zur Veranstaltung"]:
                analysis["Literatur"] = True

    course["analysis"] = analysis


# filter for courses without a description
outliers = [course for course in courses if not course["analysis"]["Beschreibung"]]
print(f"Found {len(outliers)} courses without a description out of {len(courses)} total courses.")

# export to csv with tab separator
header = ["Course", "Link", "Veranstaltungsart", "Fakultät", "SWS", "Sprache", "Beschreibung vorhanden", "Beschreibung", "Leistungsnachweis", "Literatur", "Voraussetzungen", "Zielgruppe"]
with open("bison_analysis.csv", "w", newline="") as f:
    writer = csv.writer(f, delimiter="\t")
    writer.writerow(header)
    for course in courses:
        writer.writerow([course["analysis"]["Course"], course["analysis"]["Link"], course["analysis"]["Veranstaltungsart"], course["analysis"]["Fakultät"], course["analysis"]["SWS"], course["analysis"]["Sprache"], course["analysis"]["Beschreibung vorhanden"], course["analysis"]["Beschreibung"], course["analysis"]["Leistungsnachweis"], course["analysis"]["Literatur"], course["analysis"]["Voraussetzungen"], course["analysis"]["Zielgruppe"]])

Found 0 courses without a description out of 632 total courses.


In [10]:
inliers = [course for course in courses if course["analysis"]["Beschreibung"]]

for i in range(2,10):
    print("---")
    print(str(i) + "\n")
    print(inliers[i]["Weitere Angaben zur Veranstaltung"]["Beschreibung"])

---
2

Beleg: Softwarebasierte Simulation von Verkehr und Emissionen•    Einen vorfahrtsgeregelten Knotenpunkt von Grund auf modellieren•    Einen vorfahrtsgeregelten Knotenpunkt simulieren und bewerten•    Einen signalisierten Knotenpunkt modellieren, simulieren und bewerten•    Ein bestehendes Modell anpassen und simulieren•    Ein bestehendes Modell kalibrieren und validieren•    Eine Verkehrsmanagementmaßnahme bewerten
---
3

Ziel des Seminars ist die Auseinandersetzung mit Genese und Trends von Diskursen der Stadt- und Regionalplanung sowie mit dem Berufsfeld der Urbanistik. Vor dem Hintergrund aktueller fachlicher und wissenschaftlicher Diskurse bietet es im Sinne einer Berufsfelderkundung die Möglichkeit, sich kurz vor Abschluss des Studiums mit den eigenen beruflichen Wünschen und inhaltlichen Schwerpunkten auseinanderzusetzen und unterschiedliche Optionen urbanistischen Wirkens kennenzulernen. Neben der Aufbereitung fachspezifischer Themen reflektieren die Teilnehmer*innen zus