Keyword density showing 0% in Hebrew #264

Closed
oritc opened this Issue Sep 24, 2013 · 7 comments

Comments

Projects
None yet
3 participants

oritc commented Sep 24, 2013

The analysis of keyword density is showing 0% in Hebrew even though the keyword count is large enough.
The website is not online so I can't post a link but I'll add some screenshots.
example

Contributor

jrfnl commented Feb 27, 2014

@oritc Could you provide me with a number of short sample texts + associated keyword + expected results for testing purposes ?

oritc commented Mar 3, 2014

Hi
I made a word document (attached) with 2 examples. Hope it helps.
Thank you.

On Thu, Feb 27, 2014 at 10:10 PM, Juliette notifications@github.com wrote:

@oritc https://github.com/oritc Could you provide me with a number of
short sample texts + associated keyword + expected results for testing
purposes ?

Reply to this email directly or view it on GitHubhttps://github.com/Yoast/wordpress-seo/issues/264#issuecomment-36285519
.

Contributor

jrfnl commented Mar 3, 2014

@oritc Attachments will not come through on GitHub.

oritc commented Mar 3, 2014

Example 1:

Text:

הוצאה לפועל

עיסוקו העיקרי של משרדה של עורך דין שלי גרשט הינו בהליכי הוצאה לפועל, ייצוג
חייבים, פשיטות רגל וגבייה.

עורכת דין שלי גרשט הינה עורכת דין בהוצאה לפועל בעלת ניסיון רב , יחס אישי
ומקצועיות ועל כן מייצגת חייבים בתיקי הוצאה לפועל, זוכים בתיקי הוצאה
לפועל והוצאה
לפועל מזונות.

המשרד עוסק בייצוג מול מערכת ההוצאה לפועל, תוך גישה ישירה למערכת התיקים בהוצאה
לפועל ומעקב שוטף לרבות:

Keyword: הוצאה לפועל

Num of appearances (marked): 8

Example 2:
עורך דין שלי גרשט - פשיטת רגל

לאדם ההופך להיות חדל פירעון בשל חובותיו הרבים והכבדים, ניתנת האפשרות
לבחון ביצוע הליכי פשיטת רגל.

הליך פשיטת רגל, בשונה מהליכי הוצאה
לפועלhttp://shellyglaw.com/%d7%a2%d7%95%d7%a8%d7%9a-%d7%93%d7%99%d7%9f-%d7%94%d7%95%d7%a6%d7%90%d7%94-%d7%9c%d7%a4%d7%95%d7%a2%d7%9c/,
מרכז את כל פעולות הגבייה, בפיקוח בית המשפט המחוזי ובאמצעות "הנאמן".

היתרון העצום של הליך פשיטת רגל הוא בכך שכנגד החייב מעוכבים כל ההליכים, ניתן
צו כינוס, הליך והגנה שבסופם עשוי החייב לקבל הפטר כלומר: מחיקת כל חובותיו
ובכך לפתוח דף חדש.

עורכת דין שלי גרשט, העוסקת בפשיטת רגל תסייע בכל ההליך החל משלב הגשת הבקשה,
עיכוב הליכים, דיון בהליך פשיטת הרגל, הכרזה על פשיטת רגל ולבסוף הרגע המיוחל
הסדר נושים והפטר.

Keyword: פשיטת רגל

Num of appearances (marked): 7

On Mon, Mar 3, 2014 at 12:46 PM, Juliette notifications@github.com wrote:

@oritc https://github.com/oritc Attachments will not come through on
GitHub.


Reply to this email directly or view it on GitHubhttps://github.com/Yoast/wordpress-seo/issues/264#issuecomment-36498884
.

Contributor

jrfnl commented Mar 4, 2014

Based on the sample texts I received here and in some related issues, I have made some small improvements to the keyword density calculation for non-latin, non-ideograph based languages by means of commit 97d0973.
Hopefully that will yield more consistent results. The changes are included in the the v1.5 branch.

Would you be willing to test this yourself ? You can download the v1.5 branch here in GitHub. Please do make a backup of the database before testing and don't test in a production/live environment.

Related issues: #703, #681, #349, #264 and #145.

Contributor

jrfnl commented Mar 5, 2014

@oritc Just checking: if I'm looking for the keyword in your texts, in the first I encounter the exact keyword 4 times, in the second 5 times. You state they appear 7/8 times. I imagine this is because of some variation to the keyword which is very hard to account for if we need to do this for all languages. Can you confirm this ?

@barrykooij barrykooij added a commit that referenced this issue Mar 16, 2014

@barrykooij barrykooij This should fix the keyword density problem in the Page Analysis.
Related #707
Related #720
Related #349
Related #729
Related #703
Related #264
Related #756
159425a
Owner

omarreiss commented Oct 14, 2014

@jrfnl that is correct. It is possible words in hebrew are prefixed with for example ב (in), ו (and) or ה (the). This is indeed the case in the examples used. Since we cannot account for such cases, I am closing this issue.

omarreiss closed this Oct 14, 2014

@seripap seripap pushed a commit to seripap/wordpress-seo that referenced this issue Nov 19, 2015

@terw-dan terw-dan Fixes #264, #681, #1236, #915, #1103 and #613
The keyword density is now checked with a regex so it matches nog latin-chars. Also the diacritics are replaced on the keyword so they match with the text that has the diacritics replaced.
1ac0b0a
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment