Philippus · Philippus · May 13, 2024 · May 11, 2024 · May 11, 2024 · May 11, 2024
diff --git a/elastic4s-domain/src/main/scala/com/sksamuel/elastic4s/analysis/TokenFilter.scala b/elastic4s-domain/src/main/scala/com/sksamuel/elastic4s/analysis/TokenFilter.scala
@@ -11,10 +11,12 @@ trait TokenFilter {
 case class SynonymTokenFilter(override val name: String,
                               path: Option[String] = None,
                               synonyms: Set[String] = Set.empty,
-                              ignoreCase: Option[Boolean] = None,
+                              @deprecated ignoreCase: Option[Boolean] = None,
                               format: Option[String] = None,
                               expand: Option[Boolean] = None,
-                              tokenizer: Option[String] = None) extends TokenFilter {
+                              @deprecated tokenizer: Option[String] = None,
+                              updateable: Option[Boolean] = None,
+                              lenient: Option[Boolean] = None) extends TokenFilter {
   require(path.isDefined || synonyms.nonEmpty, "synonym requires either `synonyms` or `synonyms_path` to be configured")
 
   override def build: XContentBuilder = {
@@ -24,7 +26,9 @@ case class SynonymTokenFilter(override val name: String,
     if (synonyms.nonEmpty) b.array("synonyms", synonyms.toArray)
     format.foreach(b.field("format", _))
     ignoreCase.foreach(b.field("ignore_case", _))
+    updateable.foreach(b.field("updateable", _))
     expand.foreach(b.field("expand", _))
+    lenient.foreach(b.field("lenient", _))
     tokenizer.foreach(b.field("tokenizer", _))
     b
   }
@@ -35,6 +39,8 @@ case class SynonymTokenFilter(override val name: String,
   def format(format: String): SynonymTokenFilter = copy(format = format.some)
   def ignoreCase(ignoreCase: Boolean): SynonymTokenFilter = copy(ignoreCase = ignoreCase.some)
   def expand(expand: Boolean): SynonymTokenFilter = copy(expand = expand.some)
+  def updateable(updateable: Boolean): SynonymTokenFilter = copy(updateable = updateable.some)
+  def lenient(lenient: Boolean): SynonymTokenFilter = copy(lenient = lenient.some)
 }
 
 case class WordDelimiterGraphTokenFilter(override val name: String,
@@ -50,17 +56,21 @@ case class WordDelimiterGraphTokenFilter(override val name: String,
                                          splitOnNumerics: Option[Boolean] = None,
                                          stem_english_possessive: Option[Boolean] = None,
                                          typeTable: Option[String] = None,
-                                         typeTablePath: Option[String] = None) extends TokenFilter {
+                                         typeTablePath: Option[String] = None,
+                                         adjustOffsets: Option[Boolean] = None,
+                                         ignoreKeywords: Option[Boolean] = None) extends TokenFilter {
 
   override def build: XContentBuilder = {
     val b = XContentFactory.jsonBuilder()
     b.field("type", "word_delimiter_graph")
+    adjustOffsets.foreach(b.field("adjust_offsets", _))
     preserveOriginal.foreach(b.field("preserve_original", _))
     catenateNumbers.foreach(b.field("catenate_numbers", _))
     catenateWords.foreach(b.field("catenate_words", _))
     catenateAll.foreach(b.field("catenate_all", _))
     generateWordParts.foreach(b.field("generate_word_parts", _))
     generateNumberParts.foreach(b.field("generate_number_parts", _))
+    ignoreKeywords.foreach(b.field("ignore_keywords", _))
     protectedWords.foreach(b.field("protected_words", _))
     protectedWordsPath.foreach(b.field("protected_words_path", _))
     splitOnCaseChange.foreach(b.field("split_on_case_change", _))
@@ -71,11 +81,13 @@ case class WordDelimiterGraphTokenFilter(override val name: String,
     b
   }
 
+  def adjustOffsets(bool: Boolean): WordDelimiterGraphTokenFilter = copy(adjustOffsets = bool.some)
   def generateWordParts(bool: Boolean): WordDelimiterGraphTokenFilter = copy(generateWordParts = bool.some)
   def generateNumberParts(bool: Boolean): WordDelimiterGraphTokenFilter = copy(generateNumberParts = bool.some)
   def catenateWords(bool: Boolean): WordDelimiterGraphTokenFilter = copy(catenateWords = bool.some)
   def catenateNumbers(bool: Boolean): WordDelimiterGraphTokenFilter = copy(catenateNumbers = bool.some)
   def catenateAll(bool: Boolean): WordDelimiterGraphTokenFilter = copy(catenateAll = bool.some)
+  def ignoreKeywords(bool: Boolean): WordDelimiterGraphTokenFilter = copy(ignoreKeywords = bool.some)
   def splitOnCaseChange(bool: Boolean): WordDelimiterGraphTokenFilter = copy(splitOnCaseChange = bool.some)
   def preserveOriginal(bool: Boolean): WordDelimiterGraphTokenFilter = copy(preserveOriginal = bool.some)
   def protectedWords(words: String): WordDelimiterGraphTokenFilter = copy(protectedWords = words.some)
@@ -89,10 +101,12 @@ case class WordDelimiterGraphTokenFilter(override val name: String,
 case class SynonymGraphTokenFilter(override val name: String,
                                    path: Option[String] = None,
                                    synonyms: Set[String] = Set.empty,
-                                   ignoreCase: Option[Boolean] = None,
+                                   @deprecated ignoreCase: Option[Boolean] = None,
                                    format: Option[String] = None,
                                    expand: Option[Boolean] = None,
-                                   tokenizer: Option[String] = None) extends TokenFilter {
+                                   @deprecated tokenizer: Option[String] = None,
+                                   updateable: Option[Boolean] = None,
+                                   lenient: Option[Boolean] = None) extends TokenFilter {
 
   require(path.isDefined || synonyms.nonEmpty, "synonym_graph requires either `synonyms` or `synonyms_path` to be configured")
 
@@ -103,7 +117,9 @@ case class SynonymGraphTokenFilter(override val name: String,
     if (synonyms.nonEmpty) b.array("synonyms", synonyms.toArray)
     format.foreach(b.field("format", _))
     ignoreCase.foreach(b.field("ignore_case", _))
+    updateable.foreach(b.field("updateable", _))
     expand.foreach(b.field("expand", _))
+    lenient.foreach(b.field("lenient", _))
     tokenizer.foreach(b.field("tokenizer", _))
     b
   }
@@ -113,7 +129,9 @@ case class SynonymGraphTokenFilter(override val name: String,
   def tokenizer(tokenizer: String): SynonymGraphTokenFilter = copy(tokenizer = tokenizer.some)
   def format(format: String): SynonymGraphTokenFilter = copy(format = Some(format))
   def ignoreCase(ignoreCase: Boolean): SynonymGraphTokenFilter = copy(ignoreCase = Some(ignoreCase))
-  def expand(expand: Boolean): SynonymGraphTokenFilter = copy(expand = Some(expand))
+  def expand(expand: Boolean): SynonymGraphTokenFilter = copy(expand = expand.some)
+  def updateable(updateable: Boolean): SynonymGraphTokenFilter = copy(updateable = updateable.some)
+  def lenient(lenient: Boolean): SynonymGraphTokenFilter = copy(lenient = lenient.some)
 }
 
 case class TruncateTokenFilter(override val name: String,

diff --git a/...-tests/src/test/resources/json/analysis/tokenfilter/synonymgraphtokenfilter_path_raw.json b/...-tests/src/test/resources/json/analysis/tokenfilter/synonymgraphtokenfilter_path_raw.json
@@ -0,0 +1,10 @@
+{
+    "type": "synonym_graph",
+    "synonyms_path": "analysis/synonyms.txt",
+    "format": "solr",
+    "ignore_case": true,
+    "updateable": true,
+    "expand": true,
+    "lenient": true,
+    "tokenizer": "whitespace"
+}
diff --git a/...ts/src/test/resources/json/analysis/tokenfilter/synonymgraphtokenfilter_synonyms_raw.json b/...ts/src/test/resources/json/analysis/tokenfilter/synonymgraphtokenfilter_synonyms_raw.json
@@ -0,0 +1,13 @@
+{
+    "type": "synonym_graph",
+    "synonyms": [
+        "british,english",
+        "queen,monarch"
+    ],
+    "format": "solr",
+    "ignore_case": true,
+    "updateable": true,
+    "expand": true,
+    "lenient": true,
+    "tokenizer": "whitespace"
+}
diff --git a/...tic4s-tests/src/test/resources/json/analysis/tokenfilter/synonymtokenfilter_path_raw.json b/...tic4s-tests/src/test/resources/json/analysis/tokenfilter/synonymtokenfilter_path_raw.json
@@ -0,0 +1,10 @@
+{
+    "type": "synonym",
+    "synonyms_path": "analysis/synonyms.txt",
+    "format": "solr",
+    "ignore_case": true,
+    "updateable": true,
+    "expand": true,
+    "lenient": true,
+    "tokenizer": "whitespace"
+}
diff --git a/...s-tests/src/test/resources/json/analysis/tokenfilter/synonymtokenfilter_synonyms_raw.json b/...s-tests/src/test/resources/json/analysis/tokenfilter/synonymtokenfilter_synonyms_raw.json
@@ -0,0 +1,13 @@
+{
+    "type": "synonym",
+    "synonyms": [
+        "british,english",
+        "queen,monarch"
+    ],
+    "format": "solr",
+    "ignore_case": true,
+    "updateable": true,
+    "expand": true,
+    "lenient": true,
+    "tokenizer": "whitespace"
+}
diff --git a/...tests/src/test/resources/json/analysis/tokenfilter/worddelimitergraphtokenfilter_raw.json b/...tests/src/test/resources/json/analysis/tokenfilter/worddelimitergraphtokenfilter_raw.json
@@ -1,11 +1,13 @@
 {
     "type": "word_delimiter_graph",
+    "adjust_offsets": true,
     "preserve_original": true,
     "catenate_numbers": true,
     "catenate_words": true,
     "catenate_all": true,
     "generate_word_parts": true,
     "generate_number_parts": true,
+    "ignore_keywords": true,
     "protected_words_path": "my_protected_words.txt",
     "split_on_case_change": true,
     "split_on_numerics": true,

diff --git a/elastic4s-tests/src/test/scala/com/sksamuel/elastic4s/analysis/TokenFilterTest.scala b/elastic4s-tests/src/test/scala/com/sksamuel/elastic4s/analysis/TokenFilterTest.scala
@@ -5,16 +5,76 @@ import org.scalatest.matchers.should.Matchers
 import org.scalatest.wordspec.AnyWordSpec
 
 class TokenFilterTest extends AnyWordSpec with Matchers with JsonSugar {
+  "SynonymTokenFilter" should {
+    "build json with synonyms" in {
+      SynonymTokenFilter(
+        name = "my_synonym",
+        path = Option("analysis/synonyms.txt"),
+        synonyms = Set("british,english", "queen,monarch"),
+        ignoreCase = Option(true),
+        format = Option("solr"),
+        expand = Option(true),
+        tokenizer = Option("whitespace"),
+        updateable = Option(true),
+        lenient = Option(true)
+      ).build.string should matchJsonResource("/json/analysis/tokenfilter/synonymtokenfilter_synonyms_raw.json")
+    }
+
+    "build json with path" in {
+      SynonymTokenFilter(
+        name = "my_synonym",
+        path = Option("analysis/synonyms.txt"),
+        ignoreCase = Option(true),
+        format = Option("solr"),
+        expand = Option(true),
+        tokenizer = Option("whitespace"),
+        updateable = Option(true),
+        lenient = Option(true)
+      ).build.string should matchJsonResource("/json/analysis/tokenfilter/synonymtokenfilter_path_raw.json")
+    }
+  }
+
+  "SynonymGraphTokenFilter" should {
+    "build json with synonyms" in {
+      SynonymGraphTokenFilter(
+        name = "my_synonym",
+        path = Option("analysis/synonyms.txt"),
+        synonyms = Set("british,english", "queen,monarch"),
+        ignoreCase = Option(true),
+        format = Option("solr"),
+        expand = Option(true),
+        tokenizer = Option("whitespace"),
+        updateable = Option(true),
+        lenient = Option(true)
+      ).build.string should matchJsonResource("/json/analysis/tokenfilter/synonymgraphtokenfilter_synonyms_raw.json")
+    }
+
+    "build json with path" in {
+      SynonymGraphTokenFilter(
+        name = "my_synonym",
+        path = Option("analysis/synonyms.txt"),
+        ignoreCase = Option(true),
+        format = Option("solr"),
+        expand = Option(true),
+        tokenizer = Option("whitespace"),
+        updateable = Option(true),
+        lenient = Option(true)
+      ).build.string should matchJsonResource("/json/analysis/tokenfilter/synonymgraphtokenfilter_path_raw.json")
+    }
+  }
+
   "WordDelimiterGraphTokenFilter" should {
     "build json" in {
       WordDelimiterGraphTokenFilter(
+        adjustOffsets = Option(true),
         name = "my_word_delimiter_graph",
         preserveOriginal = Option(true),
         catenateNumbers = Option(true),
         catenateWords = Option(true),
         catenateAll = Option(true),
         generateWordParts = Option(true),
         generateNumberParts = Option(true),
+        ignoreKeywords = Option(true),
         protectedWordsPath = Option("my_protected_words.txt"),
         splitOnCaseChange = Option(true),
         splitOnNumerics = Option(true),