Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Problem converting DSL file (Papyros Greek) #265

Closed
Markismus opened this issue Nov 12, 2020 · 13 comments
Closed

Problem converting DSL file (Papyros Greek) #265

Markismus opened this issue Nov 12, 2020 · 13 comments
Labels

Comments

@Markismus
Copy link

Markismus commented Nov 12, 2020

The same dictionary is used as in #264. Both pyglossary 4.00 and 4.07 generate this error.

These images are based on the dictionary generated with pyglossary:
Screenshot from 2020-11-12 15-58-55
Screenshot from 2020-11-12 15-59-14

Looking at the offending article in the xml-format generated with stardict-editor:

<article>
<key>φλέως</key>

<definition type="h">
<![CDATA[<div style="margin-left:1em">-ω, ο, ΝΑ, και φλέο, το, Ν, και φλέος, και ιων. τ. φλοῡς, και φλοῡν, τὸ, Α</div>
<div style="margin-left:1em"><i class="p" style="color:green">νεοελλ.</i></div>
<div style="margin-left:1em"><i class="p" style="color:green">βοτ.</i> γένος αγγειόσπερμων μονοκότυλων αγρωστωδών φυτών</div>
<div style="margin-left:1em"><i class="p" style="color:green">αρχ.</i></div>
<div style="margin-left:1em">είδος υδροχαρούς καλάμου.</div>
<div style="margin-left:1em">[<span style="color:brown"><b>ΕΤΥΜΟΛ.</b></span> Ονομασία φυτού, αβέβαιης ετυμολ., η οποία απαντά με τις μορφές: <i>φλέως</i>, <i>φλοῦς</i>, <i>φλέος</i>, ενώ και μια μορφή θ. *<i>φλειFο</i>- μαρτυρείται στο τοπωνύμιο <i>Φλειοῦς</i> (<i class="p" style="color:green">πρβλ.</i> το επίρρ. <i>ΦλειFοντᾱθεν</i> <span style="color:red"><a href='/span&gt; *&lt;i&gt;ΦλειFο&lt;/i&gt;- &lt;i&gt;Fοντ&lt;/i&gt;-&lt;i&gt;ᾱθεν&lt;/i&gt; [&lt;i class="p" style="color:green"&gt;βλ.&lt;/i&gt; και -&lt;i&gt;όεις&lt;/i&gt; &lt;span style="color:red"&gt;&lt;&lt;/span&gt; -&lt;i&gt;εις&lt;/i&gt; &lt;span style="color:red"&gt;&lt;&lt;/span&gt; ρίζα -&lt;i&gt;Fεντ&lt;/i&gt;-], καθώς και το μυκηναϊκό τοπωνύμιο &lt;i&gt;perewote&lt;/i&gt;, που αντιστοιχεί σε τ. τοπικής &lt;i&gt;ΦλειFοντει&lt;/i&gt; ή &lt;i&gt;ΦληFοντει&lt;/i&gt;). Η λ. ανάγεται από πολλούς μελετητές στην ΙΕ ρίζα *&lt;i&gt;bhle&lt;/i&gt;-&lt;i&gt;u&lt;/i&gt;- &lt;span style="color:slategray"&gt;«φουσκώνω, πρήζομαι, ρέω»&lt;/span&gt; τού ρ. &lt;i&gt;φλέω&lt;/i&gt; &lt;span style="color:slategray"&gt;«είμαι γεμάτος χυμούς, είμαι ανθηρός»&lt;/span&gt; (&lt;i class="p" style="color:green"&gt;βλ. λ.&lt;/i&gt; &lt;i&gt;φλέω&lt;/i&gt;), άποψη η οποία μπορεί να αιτιολογηθεί, από σημασιολογική πλευρά, λόγω τής πλούσιας άνθησης τού φυτού (&lt;i class="p" style="color:green"&gt;πρβλ.&lt;/i&gt; το ζεύγος &lt;i&gt;βρύον&lt;/i&gt;: &lt;i&gt;βρύω&lt;/i&gt;), ενώ, και από μορφολογική πλευρά, διευκολύνει την ερμηνεία τών ποικίλων μορφών με την αναγωγή σε θ. *&lt;i&gt;φληF&lt;/i&gt;- τής εκτεταμένης βαθμίδας τής ρίζας *&lt;i&gt;φλεF&lt;/i&gt;-, το οποίο εναλλάσσεται με το θ. *&lt;i&gt;φλωF&lt;/i&gt;- τής εκτεταμένης-ετεροιωμένης βαθμίδας. Σύμφωνα με αυτά, ο τ. &lt;i&gt;φλέως&lt;/i&gt; έχει προέλθει από *&lt;i&gt;φληFος με&lt;/i&gt; σίγηση τού ενδοφωνηεντικού &lt;i&gt;F&lt;/i&gt; και αντιμεταχώρηση (&lt;i class="p" style="color:green"&gt;πρβλ.&lt;/i&gt; &lt;i&gt;λεώς&lt;/i&gt; &lt;span style="color:red"&gt;&lt;&lt;/span&gt; &lt;i&gt;ληός&lt;/i&gt; / &lt;i&gt;λᾱός&lt;/i&gt;), ο τ. &lt;i&gt;φλέος&lt;/i&gt; από *&lt;i&gt;φληFος&lt;/i&gt; με βράχυνση τού -&lt;i&gt;η&lt;/i&gt;- πριν από φωνήεν (&lt;i class="p" style="color:green"&gt;πρβλ.&lt;/i&gt; &lt;i&gt;ἕως&lt;/i&gt; &lt;span style="color:red"&gt;&lt;&lt;/span&gt; &lt;i&gt;ἠώς&lt;/i&gt;), &lt;i&gt;ο&lt;/i&gt; τ. &lt;i&gt;φλοῦς&lt;/i&gt;—μέσω αμάρτυρου *&lt;i&gt;φλόος&lt;/i&gt;— από *&lt;i&gt;φλωFος&lt;/i&gt; με βράχυνση τού -&lt;i&gt;ω&lt;/i&gt;-, ενώ, τέλος, το θ. *&lt;i&gt;φλειFο&lt;/i&gt;- προήλθε από τ. *&lt;i&gt;φληF&lt;/i&gt;-&lt;i&gt;yο&lt;/i&gt;- (&lt;i class="p" style="color:green"&gt;πρβλ.&lt;/i&gt; &lt;i&gt;ἱερηFιον&lt;/i&gt; &gt; &lt;i&gt;ἱερήιον&lt;/i'>/span&gt; *&lt;i&gt;ΦλειFο&lt;/i&gt;- &lt;i&gt;Fοντ&lt;/i&gt;-&lt;i&gt;ᾱθεν&lt;/i&gt; [&lt;i class="p" style="color:green"&gt;βλ.&lt;/i&gt; και -&lt;i&gt;όεις&lt;/i&gt; &lt;span style="color:red"&gt;&lt;&lt;/span&gt; -&lt;i&gt;εις&lt;/i&gt; &lt;span style="color:red"&gt;&lt;&lt;/span&gt; ρίζα -&lt;i&gt;Fεντ&lt;/i&gt;-], καθώς και το μυκηναϊκό τοπωνύμιο &lt;i&gt;perewote&lt;/i&gt;, που αντιστοιχεί σε τ. τοπικής &lt;i&gt;ΦλειFοντει&lt;/i&gt; ή &lt;i&gt;ΦληFοντει&lt;/i&gt;). Η λ. ανάγεται από πολλούς μελετητές στην ΙΕ ρίζα *&lt;i&gt;bhle&lt;/i&gt;-&lt;i&gt;u&lt;/i&gt;- &lt;span style="color:slategray"&gt;«φουσκώνω, πρήζομαι, ρέω»&lt;/span&gt; τού ρ. &lt;i&gt;φλέω&lt;/i&gt; &lt;span style="color:slategray"&gt;«είμαι γεμάτος χυμούς, είμαι ανθηρός»&lt;/span&gt; (&lt;i class="p" style="color:green"&gt;βλ. λ.&lt;/i&gt; &lt;i&gt;φλέω&lt;/i&gt;), άποψη η οποία μπορεί να αιτιολογηθεί, από σημασιολογική πλευρά, λόγω τής πλούσιας άνθησης τού φυτού (&lt;i class="p" style="color:green"&gt;πρβλ.&lt;/i&gt; το ζεύγος &lt;i&gt;βρύον&lt;/i&gt;: &lt;i&gt;βρύω&lt;/i&gt;), ενώ, και από μορφολογική πλευρά, διευκολύνει την ερμηνεία τών ποικίλων μορφών με την αναγωγή σε θ. *&lt;i&gt;φληF&lt;/i&gt;- τής εκτεταμένης βαθμίδας τής ρίζας *&lt;i&gt;φλεF&lt;/i&gt;-, το οποίο εναλλάσσεται με το θ. *&lt;i&gt;φλωF&lt;/i&gt;- τής εκτεταμένης-ετεροιωμένης βαθμίδας. Σύμφωνα με αυτά, ο τ. &lt;i&gt;φλέως&lt;/i&gt; έχει προέλθει από *&lt;i&gt;φληFος με&lt;/i&gt; σίγηση τού ενδοφωνηεντικού &lt;i&gt;F&lt;/i&gt; και αντιμεταχώρηση (&lt;i class="p" style="color:green"&gt;πρβλ.&lt;/i&gt; &lt;i&gt;λεώς&lt;/i&gt; &lt;span style="color:red"&gt;&lt;&lt;/span&gt; &lt;i&gt;ληός&lt;/i&gt; / &lt;i&gt;λᾱός&lt;/i&gt;), ο τ. &lt;i&gt;φλέος&lt;/i&gt; από *&lt;i&gt;φληFος&lt;/i&gt; με βράχυνση τού -&lt;i&gt;η&lt;/i&gt;- πριν από φωνήεν (&lt;i class="p" style="color:green"&gt;πρβλ.&lt;/i&gt; &lt;i&gt;ἕως&lt;/i&gt; &lt;span style="color:red"&gt;&lt;&lt;/span&gt; &lt;i&gt;ἠώς&lt;/i&gt;), &lt;i&gt;ο&lt;/i&gt; τ. &lt;i&gt;φλοῦς&lt;/i&gt;—μέσω αμάρτυρου *&lt;i&gt;φλόος&lt;/i&gt;— από *&lt;i&gt;φλωFος&lt;/i&gt; με βράχυνση τού -&lt;i&gt;ω&lt;/i&gt;-, ενώ, τέλος, το θ. *&lt;i&gt;φλειFο&lt;/i&gt;- προήλθε από τ. *&lt;i&gt;φληF&lt;/i&gt;-&lt;i&gt;yο&lt;/i&gt;- (&lt;i class="p" style="color:green"&gt;πρβλ.&lt;/i&gt; &lt;i&gt;ἱερηFιον&lt;/i&gt; &gt; &lt;i&gt;ἱερήιον&lt;/i</a> <i>ἱερεῖον</i>). Η άποψη αυτή, ωστόσο, παραμένει υποθετική, ενώ δεν μπορεί να αποκλειστεί και η περίπτωση να πρόκειται για δάνεια λ.].</div>]]>
</definition>
</article>

Looking at the csv-output of pyglossary:

"φλέως","<div style=""margin-left:1em"">-ω, ο, ΝΑ, και φλέο, το, Ν, και φλέος, και ιων. τ. φλοῡς, και φλοῡν, τὸ, Α</div>
<div style=""margin-left:1em""><i class=""p"" style=""color:green"">νεοελλ.</i></div>
<div style=""margin-left:1em""><i class=""p"" style=""color:green"">βοτ.</i> γένος αγγειόσπερμων μονοκότυλων αγρωστωδών φυτών</div>
<div style=""margin-left:1em""><i class=""p"" style=""color:green"">αρχ.</i></div>
<div style=""margin-left:1em"">είδος υδροχαρούς καλάμου.</div>
<div style=""margin-left:1em"">[<span style=""color:brown""><b>ΕΤΥΜΟΛ.</b></span> Ονομασία φυτού, αβέβαιης ετυμολ., η οποία απαντά με τις μορφές: <i>φλέως</i>, <i>φλοῦς</i>, <i>φλέος</i>, ενώ και μια μορφή θ. *<i>φλειFο</i>- μαρτυρείται στο τοπωνύμιο <i>Φλειοῦς</i> (<i class=""p"" style=""color:green"">πρβλ.</i> το επίρρ. <i>ΦλειFοντᾱθεν</i> <span style=""color:red""><a href='/span&gt; *&lt;i&gt;ΦλειFο&lt;/i&gt;- &lt;i&gt;Fοντ&lt;/i&gt;-&lt;i&gt;ᾱθεν&lt;/i&gt; [&lt;i class=""p"" style=""color:green""&gt;βλ.&lt;/i&gt; και -&lt;i&gt;όεις&lt;/i&gt; &lt;span style=""color:red""&gt;&lt;&lt;/span&gt; -&lt;i&gt;εις&lt;/i&gt; &lt;span style=""color:red""&gt;&lt;&lt;/span&gt; ρίζα -&lt;i&gt;Fεντ&lt;/i&gt;-], καθώς και το μυκηναϊκό τοπωνύμιο &lt;i&gt;perewote&lt;/i&gt;, που αντιστοιχεί σε τ. τοπικής &lt;i&gt;ΦλειFοντει&lt;/i&gt; ή &lt;i&gt;ΦληFοντει&lt;/i&gt;). Η λ. ανάγεται από πολλούς μελετητές στην ΙΕ ρίζα *&lt;i&gt;bhle&lt;/i&gt;-&lt;i&gt;u&lt;/i&gt;- &lt;span style=""color:slategray""&gt;«φουσκώνω, πρήζομαι, ρέω»&lt;/span&gt; τού ρ. &lt;i&gt;φλέω&lt;/i&gt; &lt;span style=""color:slategray""&gt;«είμαι γεμάτος χυμούς, είμαι ανθηρός»&lt;/span&gt; (&lt;i class=""p"" style=""color:green""&gt;βλ. λ.&lt;/i&gt; &lt;i&gt;φλέω&lt;/i&gt;), άποψη η οποία μπορεί να αιτιολογηθεί, από σημασιολογική πλευρά, λόγω τής πλούσιας άνθησης τού φυτού (&lt;i class=""p"" style=""color:green""&gt;πρβλ.&lt;/i&gt; το ζεύγος &lt;i&gt;βρύον&lt;/i&gt;: &lt;i&gt;βρύω&lt;/i&gt;), ενώ, και από μορφολογική πλευρά, διευκολύνει την ερμηνεία τών ποικίλων μορφών με την αναγωγή σε θ. *&lt;i&gt;φληF&lt;/i&gt;- τής εκτεταμένης βαθμίδας τής ρίζας *&lt;i&gt;φλεF&lt;/i&gt;-, το οποίο εναλλάσσεται με το θ. *&lt;i&gt;φλωF&lt;/i&gt;- τής εκτεταμένης-ετεροιωμένης βαθμίδας. Σύμφωνα με αυτά, ο τ. &lt;i&gt;φλέως&lt;/i&gt; έχει προέλθει από *&lt;i&gt;φληFος με&lt;/i&gt; σίγηση τού ενδοφωνηεντικού &lt;i&gt;F&lt;/i&gt; και αντιμεταχώρηση (&lt;i class=""p"" style=""color:green""&gt;πρβλ.&lt;/i&gt; &lt;i&gt;λεώς&lt;/i&gt; &lt;span style=""color:red""&gt;&lt;&lt;/span&gt; &lt;i&gt;ληός&lt;/i&gt; / &lt;i&gt;λᾱός&lt;/i&gt;), ο τ. &lt;i&gt;φλέος&lt;/i&gt; από *&lt;i&gt;φληFος&lt;/i&gt; με βράχυνση τού -&lt;i&gt;η&lt;/i&gt;- πριν από φωνήεν (&lt;i class=""p"" style=""color:green""&gt;πρβλ.&lt;/i&gt; &lt;i&gt;ἕως&lt;/i&gt; &lt;span style=""color:red""&gt;&lt;&lt;/span&gt; &lt;i&gt;ἠώς&lt;/i&gt;), &lt;i&gt;ο&lt;/i&gt; τ. &lt;i&gt;φλοῦς&lt;/i&gt;—μέσω αμάρτυρου *&lt;i&gt;φλόος&lt;/i&gt;— από *&lt;i&gt;φλωFος&lt;/i&gt; με βράχυνση τού -&lt;i&gt;ω&lt;/i&gt;-, ενώ, τέλος, το θ. *&lt;i&gt;φλειFο&lt;/i&gt;- προήλθε από τ. *&lt;i&gt;φληF&lt;/i&gt;-&lt;i&gt;yο&lt;/i&gt;- (&lt;i class=""p"" style=""color:green""&gt;πρβλ.&lt;/i&gt; &lt;i&gt;ἱερηFιον&lt;/i&gt; &gt; &lt;i&gt;ἱερήιον&lt;/i'>/span&gt; *&lt;i&gt;ΦλειFο&lt;/i&gt;- &lt;i&gt;Fοντ&lt;/i&gt;-&lt;i&gt;ᾱθεν&lt;/i&gt; [&lt;i class=""p"" style=""color:green""&gt;βλ.&lt;/i&gt; και -&lt;i&gt;όεις&lt;/i&gt; &lt;span style=""color:red""&gt;&lt;&lt;/span&gt; -&lt;i&gt;εις&lt;/i&gt; &lt;span style=""color:red""&gt;&lt;&lt;/span&gt; ρίζα -&lt;i&gt;Fεντ&lt;/i&gt;-], καθώς και το μυκηναϊκό τοπωνύμιο &lt;i&gt;perewote&lt;/i&gt;, που αντιστοιχεί σε τ. τοπικής &lt;i&gt;ΦλειFοντει&lt;/i&gt; ή &lt;i&gt;ΦληFοντει&lt;/i&gt;). Η λ. ανάγεται από πολλούς μελετητές στην ΙΕ ρίζα *&lt;i&gt;bhle&lt;/i&gt;-&lt;i&gt;u&lt;/i&gt;- &lt;span style=""color:slategray""&gt;«φουσκώνω, πρήζομαι, ρέω»&lt;/span&gt; τού ρ. &lt;i&gt;φλέω&lt;/i&gt; &lt;span style=""color:slategray""&gt;«είμαι γεμάτος χυμούς, είμαι ανθηρός»&lt;/span&gt; (&lt;i class=""p"" style=""color:green""&gt;βλ. λ.&lt;/i&gt; &lt;i&gt;φλέω&lt;/i&gt;), άποψη η οποία μπορεί να αιτιολογηθεί, από σημασιολογική πλευρά, λόγω τής πλούσιας άνθησης τού φυτού (&lt;i class=""p"" style=""color:green""&gt;πρβλ.&lt;/i&gt; το ζεύγος &lt;i&gt;βρύον&lt;/i&gt;: &lt;i&gt;βρύω&lt;/i&gt;), ενώ, και από μορφολογική πλευρά, διευκολύνει την ερμηνεία τών ποικίλων μορφών με την αναγωγή σε θ. *&lt;i&gt;φληF&lt;/i&gt;- τής εκτεταμένης βαθμίδας τής ρίζας *&lt;i&gt;φλεF&lt;/i&gt;-, το οποίο εναλλάσσεται με το θ. *&lt;i&gt;φλωF&lt;/i&gt;- τής εκτεταμένης-ετεροιωμένης βαθμίδας. Σύμφωνα με αυτά, ο τ. &lt;i&gt;φλέως&lt;/i&gt; έχει προέλθει από *&lt;i&gt;φληFος με&lt;/i&gt; σίγηση τού ενδοφωνηεντικού &lt;i&gt;F&lt;/i&gt; και αντιμεταχώρηση (&lt;i class=""p"" style=""color:green""&gt;πρβλ.&lt;/i&gt; &lt;i&gt;λεώς&lt;/i&gt; &lt;span style=""color:red""&gt;&lt;&lt;/span&gt; &lt;i&gt;ληός&lt;/i&gt; / &lt;i&gt;λᾱός&lt;/i&gt;), ο τ. &lt;i&gt;φλέος&lt;/i&gt; από *&lt;i&gt;φληFος&lt;/i&gt; με βράχυνση τού -&lt;i&gt;η&lt;/i&gt;- πριν από φωνήεν (&lt;i class=""p"" style=""color:green""&gt;πρβλ.&lt;/i&gt; &lt;i&gt;ἕως&lt;/i&gt; &lt;span style=""color:red""&gt;&lt;&lt;/span&gt; &lt;i&gt;ἠώς&lt;/i&gt;), &lt;i&gt;ο&lt;/i&gt; τ. &lt;i&gt;φλοῦς&lt;/i&gt;—μέσω αμάρτυρου *&lt;i&gt;φλόος&lt;/i&gt;— από *&lt;i&gt;φλωFος&lt;/i&gt; με βράχυνση τού -&lt;i&gt;ω&lt;/i&gt;-, ενώ, τέλος, το θ. *&lt;i&gt;φλειFο&lt;/i&gt;- προήλθε από τ. *&lt;i&gt;φληF&lt;/i&gt;-&lt;i&gt;yο&lt;/i&gt;- (&lt;i class=""p"" style=""color:green""&gt;πρβλ.&lt;/i&gt; &lt;i&gt;ἱερηFιον&lt;/i&gt; &gt; &lt;i&gt;ἱερήιον&lt;/i</a> <i>ἱερεῖον</i>). Η άποψη αυτή, ωστόσο, παραμένει υποθετική, ενώ δεν μπορεί να αποκλειστεί και η περίπτωση να πρόκειται για δάνεια λ.].</div>"

So it starts okay, but messes up when the line gets too long.

@Markismus Markismus changed the title Conversion of abbyy lingvo to Stardict messed up the markup tags. Conversion of Abbyy Lingvo to Stardict and csv messed up the markup tags. Nov 12, 2020
@ilius ilius changed the title Conversion of Abbyy Lingvo to Stardict and csv messed up the markup tags. Problem with DSL file containing html tags Nov 12, 2020
@ilius
Copy link
Owner

ilius commented Nov 12, 2020

The DSL file contains html tags!

Have you tested it with DSL Compiler?

@ilius
Copy link
Owner

ilius commented Nov 12, 2020

I thought DSL was supposed to be a non-HTML format, that's why PyGlossary escaped < and > characters.

I can't see any mention of allowing html tags in these official documentations.

@Markismus
Copy link
Author

Markismus commented Nov 12, 2020

No, it has tags, just not html-tags. This is the same article from the decompressed dsl-file:

φλέως
	[m1]-ω, ο, ΝΑ, και φλέο, το, Ν, και φλέος, και ιων. τ. φλοῡς, και φλοῡν, τὸ, Α[/m]
	[m1][p]νεοελλ.[/p][/m]
	[m1][p]βοτ.[/p] γένος αγγειόσπερμων μονοκότυλων αγρωστωδών φυτών[/m]
	[m1][p]αρχ.[/p][/m]
	[m1]είδος υδροχαρούς καλάμου.[/m]
	[m1]\[[c brown][b]ΕΤΥΜΟΛ.[/b][/c] Ονομασία φυτού, αβέβαιης ετυμολ., η οποία απαντά με τις μορφές: [i]φλέως[/i], [i]φλοῦς[/i], [i]φλέος[/i], ενώ και μια μορφή θ. *[i]φλειFο[/i]- μαρτυρείται στο τοπωνύμιο [i]Φλειοῦς[/i] ([p]πρβλ.[/p] το επίρρ. [i]ΦλειFοντᾱθεν[/i] [c red]<[/c] *[i]ΦλειFο[/i]- [i]Fοντ[/i]-[i]ᾱθεν[/i] \[[p]βλ.[/p] και -[i]όεις[/i] [c red]<[/c] -[i]εις[/i] [c red]<[/c] ρίζα -[i]Fεντ[/i]-\], καθώς και το μυκηναϊκό τοπωνύμιο [i]perewote[/i], που αντιστοιχεί σε τ. τοπικής [i]ΦλειFοντει[/i] ή [i]ΦληFοντει[/i]). Η λ. ανάγεται από πολλούς μελετητές στην ΙΕ ρίζα *[i]bhle[/i]-[i]u[/i]- [c slategray]«φουσκώνω, πρήζομαι, ρέω»[/c] τού ρ. [i]φλέω[/i] [c slategray]«είμαι γεμάτος χυμούς, είμαι ανθηρός»[/c] ([p]βλ. λ.[/p] [i]φλέω[/i]), άποψη η οποία μπορεί να αιτιολογηθεί, από σημασιολογική πλευρά, λόγω τής πλούσιας άνθησης τού φυτού ([p]πρβλ.[/p] το ζεύγος [i]βρύον[/i]: [i]βρύω[/i]), ενώ, και από μορφολογική πλευρά, διευκολύνει την ερμηνεία τών ποικίλων μορφών με την αναγωγή σε θ. *[i]φληF[/i]- τής εκτεταμένης βαθμίδας τής ρίζας *[i]φλεF[/i]-, το οποίο εναλλάσσεται με το θ. *[i]φλωF[/i]- τής εκτεταμένης-ετεροιωμένης βαθμίδας. Σύμφωνα με αυτά, ο τ. [i]φλέως[/i] έχει προέλθει από *[i]φληFος με[/i] σίγηση τού ενδοφωνηεντικού [i]F[/i] και αντιμεταχώρηση ([p]πρβλ.[/p] [i]λεώς[/i] [c red]<[/c] [i]ληός[/i] / [i]λᾱός[/i]), ο τ. [i]φλέος[/i] από *[i]φληFος[/i] με βράχυνση τού -[i]η[/i]- πριν από φωνήεν ([p]πρβλ.[/p] [i]ἕως[/i] [c red]<[/c] [i]ἠώς[/i]), [i]ο[/i] τ. [i]φλοῦς[/i]—μέσω αμάρτυρου *[i]φλόος[/i]— από *[i]φλωFος[/i] με βράχυνση τού -[i]ω[/i]-, ενώ, τέλος, το θ. *[i]φλειFο[/i]- προήλθε από τ. *[i]φληF[/i]-[i]yο[/i]- ([p]πρβλ.[/p] [i]ἱερηFιον[/i] > [i]ἱερήιον[/i]> [i]ἱερεῖον[/i]). Η άποψη αυτή, ωστόσο, παραμένει υποθετική, ενώ δεν μπορεί να αποκλειστεί και η περίπτωση να πρόκειται για δάνεια λ.\].[/m]

So you got the [m1], [b] and [c] tags right, missed the [i] tags and converted the [p] tags to <i class=""p""> tags.

@Markismus
Copy link
Author

@ilius ilius changed the title Problem with DSL file containing html tags Problem converting DSL file (Papyros Greek) Nov 12, 2020
@ilius ilius added the Bug label Nov 12, 2020
@Markismus
Copy link
Author

Markismus commented Nov 12, 2020

Checking the current dictionary:
Tags present:

  • [b], [/b] – boldfaced font
  • [i], [/i] – italics
  • [c], [/c] – coloured (highlighted) font
  • [m] – sets the left paragraph margin. N is the number of spaces which will be used for the left-hand margin. N must be within the range from 0 to 9. The corresponding closing tag of the paragraph is [/m]. and left card margin.
  • [p], [/p] – labels (clicking a label displays its full text)
  • [sub][/sub] – subscript
  • [sup][/sup] - superscript

Tags not found in current dictionary:

  • [], [/] – the text between these tags is only displayed in full translation mode (see)
  • [u], [/u] – underlined font
  • [trn], [/trn] – translations zone.
  • [ex], [/ex] – examples zone.
  • [com], [/com] – comments zone.
  • [s],[/s] – multimedia zone (used to add pictures or sound files into a dictionary entries ).
  • [url],[/url] – link to a Web page.
  • [!trs], [/!trs] – the text between these tags will not be indexed
  • ['],[/'] – a stressed vowel in a word. You can change the colour of stressed vowels on the Entry window view tab of the Options dialog box (Tools>Options…).
  • [lang][/lang] – the language of the word or phrase; these tags are used in cards to mark words that are written in a language other than the target language. Words marked by [lang] tags will be indexed, translated, you will be able to see the list of their grammatical forms, etc. The name of the language must be enclosed in quotation marks, e.g. [lang name="Russian"]. See the list of supported DSL languages in the “Supported Languages” section.
  • [ref][/ref] – hyperlink to a card in the same dictionary (You can also use “<<” and “>>” to enclose the headword of the card to make a link).

@ilius
Copy link
Owner

ilius commented Nov 13, 2020

I pushed a change.
Please try again and check if output is okay.

@Markismus
Copy link
Author

👍 Will do. Thanks!

@Markismus
Copy link
Author

Markismus commented Nov 14, 2020

Quick check with Koreader, for the same entry, second page has a beautiful result:
Screenshot from 2020-11-14 10-40-47

I'll check further by running it through my script to convert it to Pocketbook format and ask ichnilatis for some more Goldendict dictionaries for testing. Ichnilatus is a mobileread forum member who wanted the Goldendict dictionaries converted to Pocketbook. The forum thread is here.

EDIT: You even got rid of the quotes around the dictionary name. Nice!

@ilius
Copy link
Owner

ilius commented Nov 14, 2020

Great.
Please check an English glossary as well if you can.
So that I can use to write unit tests.

@ilius ilius closed this as completed Nov 14, 2020
@Markismus
Copy link
Author

I received one English-Greek dictionary and two other Greek-Greek ones. Will the En-Gr work for you unit tests? The dictionaries were uploaded here.

@ilius
Copy link
Owner

ilius commented Nov 14, 2020

Target language is important for testing, so anything to English would be good.
Because I can't read Greek or Russian.
We have a lot of Russian tests added by the Russian user who wrote the code years ago (he's gone).

@Markismus
Copy link
Author

Markismus commented Nov 14, 2020

Ichnalatis uploaded a Russian-English dictionary for you here. It converts without errors. Haven't tested it further. (Can't read Russian either. :) )

@ilius
Copy link
Owner

ilius commented Nov 14, 2020

Thanks

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

2 participants