Permalink
Browse files

Add test cases for hashtag with Zero-Width Non-Joiner

  • Loading branch information...
1 parent def9095 commit df24c1047909d7fb63d128df861d2f6af2ae4fa7 @keitaf keitaf committed Feb 23, 2012
Showing with 6 additions and 2 deletions.
  1. +6 −2 extract.yml
View
@@ -709,14 +709,18 @@ tests:
text: "#سیاست #ایران #السياسة #السياح #لغات #اتمی #کنفرانس #العربية #الجزيرة #فارسی"
expected: ["سیاست", "ایران", "السياسة", "السياح", "لغات", "اتمی", "کنفرانس", "العربية", "الجزيرة", "فارسی"]
- - description: "Extract Arabic hashtags with dash"
+ - description: "Extract Arabic hashtags with underscore"
text: "#برنامه_نویسی #رییس_جمهور #رئيس_الوزراء, #ثبت_نام. #لس_آنجلس"
expected: ["برنامه_نویسی", "رییس_جمهور", "رئيس_الوزراء", "ثبت_نام", "لس_آنجلس"]
- - description: "Extract Thai hashtags with dash"
+ - description: "Extract Thai hashtags"
text: "#ผู้เริ่ม #การเมือง #รายละเอียด #นักท่องเที่ยว #ของขวัญ #สนามบิน #เดินทาง #ประธาน"
expected: ["ผู้เริ่ม", "การเมือง", "รายละเอียด", "นักท่องเที่ยว", "ของขวัญ", "สนามบิน", "เดินทาง", "ประธาน"]
+ - description: "Extract Arabic hashtags with Zero-Width Non-Joiner"
+ text: "#أي‌بي‌إم #می‌خواهم"
+ expected: ["أي‌بي‌إم", "می‌خواهم"]
+
hashtags_with_indices:
- description: "Extract a hastag at the start"
text: "#hashtag here"

0 comments on commit df24c10

Please sign in to comment.