Permalink
Browse files

Allow maqaf, geresh, gershayim in hashtags

  • Loading branch information...
1 parent 17b101d commit 84de955d3e85b042553b5a4b0425c6514ff2e14c @kscanne kscanne committed Mar 7, 2012
Showing with 4 additions and 0 deletions.
  1. +4 −0 extract.yml
View
@@ -713,6 +713,10 @@ tests:
text: "#برنامه_نویسی #رییس_جمهور #رئيس_الوزراء, #ثبت_نام. #لس_آنجلس"
expected: ["برنامه_نویسی", "رییس_جمهور", "رئيس_الوزراء", "ثبت_نام", "لس_آنجلس"]
+ - description: "Extract Hebrew hashtags"
+ text: "#עַל־יְדֵי #וכו׳ #מ״כ"
+ expected: ["עַל־יְדֵי", "וכו׳", "מ״כ"]
+
- description: "Extract Thai hashtags"
text: "#ผู้เริ่ม #การเมือง #รายละเอียด #นักท่องเที่ยว #ของขวัญ #สนามบิน #เดินทาง #ประธาน"
expected: ["ผู้เริ่ม", "การเมือง", "รายละเอียด", "นักท่องเที่ยว", "ของขวัญ", "สนามบิน", "เดินทาง", "ประธาน"]

0 comments on commit 84de955

Please sign in to comment.