In [1]:
import mysql.connector
import pandas as pd

from IPython.display import display, Markdown, HTML

db = mysql.connector.connect(
    host="localhost",
    user="root",
    password="secret",
    port="3306",
    database="serlo",
    charset="latin1"
)



In [22]:
def report(year=2021, delete_consecutive=False):
    display(Markdown(f"# Jahr {year} (delete_consecutive_events = {delete_consecutive})"))
    
    df = pd.read_sql(f"""
        SELECT
            event_log.id,
            event_log.actor_id,
            event_log.date,
            IF(event_log.event_id in (4,5), 1, 0) as edits,
            IF(event_log.event_id in (6,11), 1, 0) as reviews,
            IF(event_log.event_id in (8,9,14,16), 1, 0) as comments,
            IF(event_log.event_id in (1,2,12,15,17), 1, 0) as taxonomy
        FROM event_log
        WHERE event_log.event_id IN (4,5,6,11,8,9,14,16,1,2,12,15,17)
            and year(event_log.date) = {year}
    """, db)
    
    if delete_consecutive:
        df = delete_consecutive_events(df)
    
    for kind in ["edits", "reviews", "comments", "taxonomy"]:
        nr = df[kind].sum()
        display(Markdown(f"Anzahl {kind}: {nr}"))
        
    df = df.groupby("actor_id").sum()
    nr = len(df[df["edits"] > 10])
    
    display(Markdown(f"Anzahl Autor*innen mit mehr als 10 Edits: {nr}"))
    
    df["count"] = df["edits"] + df["comments"] + df["reviews"] + df["taxonomy"]
    nr = len(df[df["count"] > 10])
    
    display(Markdown(f"Anzahl Autor*innen mit mehr als 10 Events (comments, reviews, taxonomy, edits): {nr}"))
        
def delete_consecutive_events(df):
    df.sort_values(["actor_id", "date"], inplace=True)
    df["time_diff_seconds"] = df["date"].diff().map(lambda x: x.total_seconds())
    
    to_delete = (df["time_diff_seconds"] >= 0) & (df["time_diff_seconds"] < 3)
    df.drop(df[to_delete].index, inplace=True)
    
    return df

for c in [True, False]:
    for year in [2021, 2020, 2019]:
        report(year=year, delete_consecutive=c)

# Jahr 2021 (delete_consecutive_events = True)

Anzahl edits: 12674

Anzahl reviews: 9354

Anzahl comments: 941

Anzahl taxonomy: 4214

Anzahl Autor*innen mit mehr als 10 Edits: 86

Anzahl Autor*innen mit mehr als 10 Events (comments, reviews, taxonomy, edits): 97

# Jahr 2020 (delete_consecutive_events = True)

Anzahl edits: 14029

Anzahl reviews: 6584

Anzahl comments: 1995

Anzahl taxonomy: 6230

Anzahl Autor*innen mit mehr als 10 Edits: 103

Anzahl Autor*innen mit mehr als 10 Events (comments, reviews, taxonomy, edits): 121

# Jahr 2019 (delete_consecutive_events = True)

Anzahl edits: 13331

Anzahl reviews: 2010

Anzahl comments: 1322

Anzahl taxonomy: 2018

Anzahl Autor*innen mit mehr als 10 Edits: 92

Anzahl Autor*innen mit mehr als 10 Events (comments, reviews, taxonomy, edits): 106

# Jahr 2021 (delete_consecutive_events = False)

Anzahl edits: 31794

Anzahl reviews: 22114

Anzahl comments: 962

Anzahl taxonomy: 8635

Anzahl Autor*innen mit mehr als 10 Edits: 96

Anzahl Autor*innen mit mehr als 10 Events (comments, reviews, taxonomy, edits): 106

# Jahr 2020 (delete_consecutive_events = False)

Anzahl edits: 27392

Anzahl reviews: 22369

Anzahl comments: 2037

Anzahl taxonomy: 12181

Anzahl Autor*innen mit mehr als 10 Edits: 122

Anzahl Autor*innen mit mehr als 10 Events (comments, reviews, taxonomy, edits): 143

# Jahr 2019 (delete_consecutive_events = False)

Anzahl edits: 14982

Anzahl reviews: 11594

Anzahl comments: 1368

Anzahl taxonomy: 3349

Anzahl Autor*innen mit mehr als 10 Edits: 95

Anzahl Autor*innen mit mehr als 10 Events (comments, reviews, taxonomy, edits): 115