Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Inkonsistenzen der Rückgabe bei gleicher URL #2

Open
ulfgebhardt opened this issue Oct 8, 2019 · 2 comments
Open

Inkonsistenzen der Rückgabe bei gleicher URL #2

ulfgebhardt opened this issue Oct 8, 2019 · 2 comments
Labels
bug Something isn't working

Comments

@ulfgebhardt
Copy link
Member

ulfgebhardt commented Oct 8, 2019

Die Rückgabe der Inhalte auf den URLs des Bundestages unter https://www.bundestag.de/apps/plenar/plenar/conferenceweekDetail.form?year=${year}&week=${week} variiert.

So wird in diesem Beispiel unter der URL von KW 5/201 die Tagesordnung von KW 36/2014 zurückgegeben.

image

Da die Datensätze immer den nächsten referenzieren und es keine Übersicht über alle Kalenderwochen mit Bundestag-Sitzungen gibt, führt das zu einer unabschätzbaren Laufzeit, da es zu Schleifen im Abrufen der Daten kommt.
Zur Zeit liegt die durchschnittliche Laufzeit des Scrape-Prozesses bei ~5min, kann aber mindestens auf ~2min verkürzt werden, wenn dieses Problem behoben werden sollte. Auch die Anzahl der Abfragen kann dadurch deutlich reduziert werden.

image

Travis mit Loops: https://travis-ci.org/demokratie-live/scapacra-bt/jobs/595035531

Min. benötigte Abfragen: 118 (100%) ~85s
Getätigte Abfragen in diesem Scrape: 743 (630%) 532.54s

Eine Auffälligkeit in diesem Verhalten ist, dass die Loops in der Regel zwischen KW1 und 16 auftreten und auf die letzen Kalenderwochen des vorherigen Jahren verlinken (KW37 bis KW50).
Ein Loop hat dabei eine Länge zwischen 8 und 15 Abfragen.

Es ist zu vermuten das hier ein Fehler Seitens des Bundestages vorliegt.

@ulfgebhardt ulfgebhardt added the bug Something isn't working label Oct 8, 2019
@ulfgebhardt
Copy link
Member Author

Diesen Fehler scheint der Bundestag behoben zu haben <3

@ulfgebhardt
Copy link
Member Author

Dieser Fehler erscheint immer noch, nur in einem sehr viel geringeren Ausmaß

@ulfgebhardt ulfgebhardt reopened this Nov 15, 2019
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

No branches or pull requests

1 participant