From e05c5ecfcc60fac506d41f9682d257d1c868d1fb Mon Sep 17 00:00:00 2001 From: bact Date: Wed, 22 May 2019 15:19:49 +0700 Subject: [PATCH] Fix Thai valid text and add Thai illegal sequences - Fix a invalid sequence in "valid text" `kScriptText` - Add two illegal sequence in `kBadlyFormedThaiWords` --- unittest/normstrngs_test.cc | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/unittest/normstrngs_test.cc b/unittest/normstrngs_test.cc index 76ba4dac57..cd34f4e87e 100644 --- a/unittest/normstrngs_test.cc +++ b/unittest/normstrngs_test.cc @@ -76,7 +76,8 @@ const char kKorText[] = "이는 것으로"; // Hindi words containing illegal vowel sequences. const char* kBadlyFormedHinWords[] = {"उपयोक्ताो", "नहीें", "प्रंात", "कहीअे", "पत्रिाका", "छह्णाीस"}; -const char* kBadlyFormedThaiWords[] = {"ฤิ", "กา้ํ", "กิำ"}; +// Thai illegal sequences. +const char* kBadlyFormedThaiWords[] = {"ฤิ", "กา้ํ", "กิำ", "นำ้", "เเก"}; TEST(NormstrngsTest, DetectsCorrectText) { string chars; @@ -287,7 +288,7 @@ TEST(NormstrngsTest, AllScriptsRegtest) { {"Thai", "อ้อ! กับนัง....แม่ยอดพระกลิ่น นั่นเอง ! หรับก็ย่อมจะรู้โดยชัดเจนว่า " "ถ้าตราบใดยังมีเรือปืนอยู่ใกล้ ๆ แล้ว ตราบนั้น " - "พระดำรินี้ ที่มีคตีท่ำกรวยหมากและธปเทียน " + "พระดำรินี้ ที่มีท่ากรวยหมากและธูปเทียน " "อันยานมีเรือเปนต้นฃ้ามยาก ฯ เพราะว่าแม่น้ำนั่นมีน้ำใสยิ่ง แม้เพียง"}, {"Vietnamese", "vợ đến tai mụ hung thần Xăng-tô- mê-a. Mụ vô cùng "