-
Notifications
You must be signed in to change notification settings - Fork 572
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Parsing a part of a PDF requires a start and an end line #630
Parsing a part of a PDF requires a start and an end line #630
Conversation
Otherwise the parser cannot handle PDF files containing more than one transaction, e.g. OnVista
Improved regex for block recognition of SBroker Recognizing deposit transactions works now with multipart parsing Fixed SBroker unit test
Hi @akoch - vielen Dank für den Patch! Mir ist bewußt, dass der PDFParser#Section potentiell mehr Zeilen sehen kann (sprich: es könnte eine Überlauf in den nächsten Block geben). Genauso sieht jede PDFParser#Section nochmal alle Zeilen. Ich denke das kann man so ändern. Hast Du ein Beispiel wo sich das auswirkt? Wenn ich nämlich alle Deine Changes abzüglich der PDFParser Changes laufen lasse, dann sind alle Tests weiterhin grün. Die PDFParser Änderung scheint da auf den ersten Blick keinen Unterschied zu machen. Allerdings wieß ich nicht ob z.B. bei dem Matching des Wertpapiernamens im Onvista Exporter ein Problem auftreten könnte. Vielleicht gibt es ja dazu einen Testfall und ein assertThat Statement? Andreas. |
Hi @buchen , Zwei Dinge sind dazugekommen:
Die Anmerkung kann ich nicht genau zuordnen. Um welchen Export geht es? Gruß, |
Ich bezog mich damit auf die Änderung an dem + type.getCurrentContext().put("nameP4", v.get("nameP4"));
+ })
+
+ .section("combine")
+ .match("(?<combine>.*)")
+ .assign((t, v) -> { Ich wollte sagen, ich habe keine Testfall gefunden, bei dem es einen Unterschied macht ob man "nameP4" als separate (optionale) Section definiert. Ist aber eigentlich auch egal - die Änderung sieht logisch aus. Ich komme heute Abend nicht mehr dazu mir die Änderung im Detail anzuschauen und zu mergen. Werde ich im Laufe der Woche machen. Deine andere Änderung ist drin! 😄 |
Ohne die Änderung schlägt name.abuchen.portfolio.datatransfer.pdf.OnvistaPDFExtractorTest.testDepotauszug() fehl, weil er nicht mehr für jeden Depoteintrag in den Block mit "nameP4" läuft. Kann sein, dass man das eleganter lösen könnte, aber das erschien mir die naheliegendste Herangehensweise. Wenn du noch verbesserungswürdige Stellen findest, sag Bescheid. |
Otherwise the parser cannot handle PDF files containing more than one
transaction, e.g. OnVista