Search it kann nicht mit Silbentrennung  umgehen #130

greatif · 2017-09-19T08:58:03Z

Beispiel:
Das FOR-AddOn Hyphenator (https://github.com/FriendsOfREDAXO/hyphenator) nimmt in Texten durch Einfügen des Trenn-Symbols &shy eine Silbentrennung vor:
echo hyphenator::hyphenate(REX_VALUE[id=1]);

Dadurch werden dann im Frontend silbengetrennte Wörter ausgegeben.

Da Search it (Version 6.4.1) nur noch über das Frontend indexiert, landen dann durch &shy die Silben (anstatt der ganzen Wörter) im Suchindex.

Fazit:
Search it kann allgemein nicht mit &shy umgehen.

Evtl. wäre dies ein Argument, um wieder eine DB-Indexierung zuzulassen...

The text was updated successfully, but these errors were encountered:

tyrant88 · 2017-09-19T09:05:20Z

Nee das ist nur ein Argument die Worttrenung von search it zu überprüfen.

greatif · 2017-09-19T09:19:18Z

Ok, oder so. Das bedeutet grds. dann allerdings, dass keine weiteren Frontend-Ersetzungen denkbar sind, die aus der Indexierung herausgehalten werden sollen.

tyrant88 · 2017-09-19T09:35:00Z

Genau. Ich gehe davon aus, dass das was im Frontend erscheint (Endergebnis aller Ersetzungen), das ist was gesucht und gezeigt werden soll.

xong · 2017-09-19T09:49:30Z

Siehe Issue #108. RexSearch war noch als reines Indexierungs-Addon gedacht. Das man damit auch eine Fulltextsuche durchführen konnte, war für mich nur ein bestimmter Anwendungsfall.
Ich hatte früher oft den Fall, dass ich nicht nur (Frontend-)Artikel durchsuchen wollte, sondern alle möglichen Datenquellen. Das ist im Moment so leider nicht mehr möglich.

Zum Problem hier: Eventuell kann das Plaintext-Plugin  vor dem Indexieren mittels Regex filtern.

tyrant88 · 2017-09-23T17:52:19Z

Worttrennung ging nicht zu ändern, da die die RegEx Klasse [:punc:] (punctation) auf das Semikolon von "" anspringt...
Xongs Vorschlag macht ja noch mehr Sinn, da eine HTML-Entity eigentlich eh nichts im plaintext zu suchen hat.
Nur wollte ich nicht, dass ein Normalo erst das plaintext plugin anwerfen muss, weil er Hyphenator benutzt... deshalb wende ich auf den plaintext ein html_entity_decode an...
Die Spezialisten wiederum können mit dem plaintext plugin das Standard-Verhalten umgehen.

greatif · 2017-09-23T23:39:46Z

Der Normalo hat sich sogar zuerst mit dem Plaintext-Plugin beschäftigt. Leider führt die Hilfe-Seite für das Plugin /index.php?page=packages&subpage=help&package=search_it/plaintext, die auf die Doku im "alten Wiki" verweist, auf einen toten Link. Sprich: Keine Doku verfügbar.
Also wurde "auf gut Glück" versucht, beim Plaintext-Plugin unter "Reguläre Ausdrücke" 1. Zeile '' durch 2. Zeile '' zu ersetzen. Allein dies zeigte keinen Effekt bei der Indexierung.
Wenn die Hilfestellung für eine korrekte Verwendung hier etwas besser wäre, dann wäre es m.E. auch dem Normalo zuzumuten, das Plugin zu nutzen.
Praktikabelste Lösung im Moment: Auf d. Addon Hyphenator verzichten u. via CSS hyphens: auto; die Silbentrennung machen.
Konsequenz: Die Frage, ob ein FOR-Hyphenator-Addon Sinn macht?
Fazit: Eine zumindest rudimentäre Doku zum Plaintext-Plugin wäre für den Normalo jedenfalls interessant.

tyrant88 · 2017-09-24T12:50:59Z

Du bist doch gar nicht gemeint! :-)
Genau das Gleiche hab ich auch probiert, die Lösung ist: die zweite Zeile muss eine Leerzeile sein.
Deshalb hab ich auch die Doku angepasst.
Und es ist aber auch nicht mehr nötig, weil ich das durch html_entity_decode umwandele.

alxndr-w · 2018-08-13T09:45:40Z

Fazit: Eine zumindest rudimentäre Doku zum Plaintext-Plugin wäre für den Normalo jedenfalls interessant.

@greatif was sollte da deines Erachtens drinstehen? Hast du dich in soweit damit beschäftigt, dass du was dazu schreiben kannst?

greatif changed the title ~~Nur Silben im Index bei Verwendung d. FOR-AddOns Hyphenator~~ Search it kann nicht mit Silbentrennung  umgehen Sep 19, 2017

tyrant88 closed this as completed Sep 24, 2017

tyrant88 mentioned this issue Sep 24, 2017

6.4.2 #133

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Search it kann nicht mit Silbentrennung  umgehen #130

Search it kann nicht mit Silbentrennung  umgehen #130

greatif commented Sep 19, 2017 •

edited

Loading

tyrant88 commented Sep 19, 2017

greatif commented Sep 19, 2017 •

edited

Loading

tyrant88 commented Sep 19, 2017

xong commented Sep 19, 2017 •

edited

Loading

tyrant88 commented Sep 23, 2017

greatif commented Sep 23, 2017

tyrant88 commented Sep 24, 2017

alxndr-w commented Aug 13, 2018

Search it kann nicht mit Silbentrennung &shy; umgehen #130

Search it kann nicht mit Silbentrennung &shy; umgehen #130

Comments

greatif commented Sep 19, 2017 • edited Loading

tyrant88 commented Sep 19, 2017

greatif commented Sep 19, 2017 • edited Loading

tyrant88 commented Sep 19, 2017

xong commented Sep 19, 2017 • edited Loading

tyrant88 commented Sep 23, 2017

greatif commented Sep 23, 2017

tyrant88 commented Sep 24, 2017

alxndr-w commented Aug 13, 2018

Search it kann nicht mit Silbentrennung umgehen #130

Search it kann nicht mit Silbentrennung umgehen #130

greatif commented Sep 19, 2017 •

edited

Loading

greatif commented Sep 19, 2017 •

edited

Loading

xong commented Sep 19, 2017 •

edited

Loading