Skip to content

HTTPS clone URL

Subversion checkout URL

You can clone with HTTPS or Subversion.

Download ZIP
Browse files

Merge pull request #38 from kscanne/hebrew_hashtag_punctuation

Allow maqaf, geresh, gershayim in hashtags
  • Loading branch information...
commit 197892928cf112809778d072a1bba0018d5a1e4e 2 parents 17b101d + 84de955
@keitaf keitaf authored
Showing with 4 additions and 0 deletions.
  1. +4 −0 extract.yml
View
4 extract.yml
@@ -713,6 +713,10 @@ tests:
text: "#برنامه_نویسی #رییس_جمهور #رئيس_الوزراء, #ثبت_نام. #لس_آنجلس"
expected: ["برنامه_نویسی", "رییس_جمهور", "رئيس_الوزراء", "ثبت_نام", "لس_آنجلس"]
+ - description: "Extract Hebrew hashtags"
+ text: "#עַל־יְדֵי #וכו׳ #מ״כ"
+ expected: ["עַל־יְדֵי", "וכו׳", "מ״כ"]
+
- description: "Extract Thai hashtags"
text: "#ผู้เริ่ม #การเมือง #รายละเอียด #นักท่องเที่ยว #ของขวัญ #สนามบิน #เดินทาง #ประธาน"
expected: ["ผู้เริ่ม", "การเมือง", "รายละเอียด", "นักท่องเที่ยว", "ของขวัญ", "สนามบิน", "เดินทาง", "ประธาน"]
Please sign in to comment.
Something went wrong with that request. Please try again.