In [1]:
import mysql.connector
from datetime import date
from IPython.display import display, Markdown, HTML
import pandas as pd
from sqlalchemy import create_engine

pd.set_option("display.max_rows", None)


engine = create_engine("mysql+mysqlconnector://root:secret@localhost:3306/serlo")
db = engine.raw_connection()

display(
    Markdown(
        f"""
# Liste von deutschen Mathe-Aufgabenordnern
## außerhalb vom Prüfungsbereich
### Letztes Update: {date.today()}
"""
    )
)


# Liste von deutschen Mathe-Aufgabenordnern
## außerhalb vom Prüfungsbereich
### Letztes Update: 2024-07-11


In [2]:
def queryall(sql, parameters=[]):
    cursor = db.cursor()
    cursor.execute(sql, parameters)
    return cursor.fetchall()


def get_all_taxonomy_children(taxonomies, children=None):
    if children is None:
        children = []
    for taxonomy in taxonomies:
        queried_children = queryall(
            """
           SELECT taxonomy.id FROM taxonomy
           JOIN uuid ON uuid.id = taxonomy.id
           JOIN uuid parent ON parent.id = parent_id
           WHERE parent_id = %s
               AND uuid.trashed = 0
               AND parent.trashed = 0
            """,
            [taxonomy],
        )
        queried_children = [child_row[0] for child_row in queried_children]
        children += list(set(queried_children))
        if len(queried_children) > 0:
            children = get_all_taxonomy_children(queried_children, children)
    return children


def load_folders(taxonomy_ids):
    data_frame = pd.read_sql(
        f"""
        SELECT id, name 
            FROM  taxonomy 
            WHERE id IN {str(tuple(taxonomy_ids))}
            AND (type_id = 33 OR type_id = 12)
        """,
        engine,
    )
    data_frame["link"] = data_frame["id"].apply(
        lambda taxonomy_id: f'<a target="_blank" href="https://serlo.org/{taxonomy_id}">serlo.org/{taxonomy_id}</a>'
    )
    return data_frame

In [3]:
taxonomy_ids = get_all_taxonomy_children([5])
len(taxonomy_ids)

2830

In [4]:
top_taxonomies_abschlusspruefungen = [
    75678,
    247427,
    76750,
    75049,
    20852,
    91252,
    91253,
    305819,
    305843,
    302433,
    302434,
    297604,
    300778,
    297606,
    307335,
    307336,
    308610,
]

taxonomies_abschlusspruefungen = get_all_taxonomy_children(
    top_taxonomies_abschlusspruefungen
)
len(taxonomies_abschlusspruefungen)

513

In [5]:
all_taxonomies_abschlusspruefungen = list(
    set(top_taxonomies_abschlusspruefungen + taxonomies_abschlusspruefungen)
)
len(all_taxonomies_abschlusspruefungen)

530

In [6]:
taxonomies_without_abschlusspruefungen = [
    taxonomy_id
    for taxonomy_id in taxonomy_ids
    if taxonomy_id not in all_taxonomies_abschlusspruefungen
]

len(taxonomies_without_abschlusspruefungen)

2300

In [7]:
df = load_folders(taxonomies_without_abschlusspruefungen)

display(Markdown(f"### Alle Aufgabenordner außerhalb vom Prüfungsbereich"))
HTML(df.to_html(render_links=True, escape=False))

### Alle Aufgabenordner außerhalb vom Prüfungsbereich

Unnamed: 0,id,name,link
0,21804,Sachaufgaben,serlo.org/21804
1,22251,Aufgaben zu Addition und Subtraktion,serlo.org/22251
2,22257,Aufgaben zu Multiplikation und Division,serlo.org/22257
3,22258,Gemischte Aufgaben,serlo.org/22258
4,22274,Aufgaben zu Addition und Subtraktion,serlo.org/22274
5,23662,Aufgaben zu einfachen Potenzen,serlo.org/23662
6,23665,Aufgaben zu den Potenzgesetzen,serlo.org/23665
7,23767,Aufgaben zu Potenzen mit ganzzahligen Exponenten,serlo.org/23767
8,23768,Aufgaben zum Rechnen mit Logarithmen,serlo.org/23768
9,23769,Aufgaben zum Rechnen mit e und ln,serlo.org/23769
