Qalsadi: Arabic mophological analyzer Library for python.
Switch branches/tags
Nothing to show
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Failed to load latest commit information.
doc
qalsadi
tests
.gitignore
MANIFEST
Makefile
README.md
epydoc.conf
requirements.txt
setup.py

README.md

#Qalsadi Arabic Morphological Analyzer for Python

Developpers: Taha Zerrouki: http://tahadz.com taha dot zerrouki at gmail dot com

Features value
Authors Authors.md
Release 0.2
License GPL
Tracker linuxscout/qalsadi/Issues
Website https://pypi.python.org/pypi/qalsadi
Doc package Documentaion
Source Github
Download sourceforge
Feedbacks Comments
Accounts @Twitter @Sourceforge

Citation

If you would cite it in academic work, can you use this citation

T. Zerrouki‏, Qalsadi, Arabic mophological analyzer Library for python.,  https://pypi.python.org/pypi/qalsadi/

or in bibtex format

@misc{zerrouki2012qalsadi,
  title={qalsadi, Arabic mophological analyzer Library for python.},
  author={Zerrouki, Taha},
  url={https://pypi.python.org/pypi/qalsadi},
  year={2012}
}

مزايا

Features

  • Arabic word Light Stemming.

Applications

  • Stemming texts
  • Text Classification and categorization
  • Sentiment Analysis
  • Named Entities Recognition

Installation

pip install qalsadi

Requirements

pip install -r requirements.txt 

Usage

Example

filename="samples/text.txt"
import qalsadi.analex as qa
try:
    myfile=open(filename)
    text=(myfile.read()).decode('utf8');

    if text == None:
        text=u"السلام عليكم"
except:
    text=u"أسلم"
    print " given text"

debug=False;
limit=500
analyzer = qa.Analex()
analyzer.set_debug(debug);
result = analyzer.check_text(text);
print '----------------python format result-------'
print result
for i in range(len(result)):
#       print "--------تحليل كلمة  ------------", word.encode('utf8');
    print "-------------One word detailed case------";
    for analyzed in  result[i]:
        print "-------------one case for word------";
        print repr(analyzed);

Output description

Category Applied on feature شرح example
affix all affix_key مفتاح الزوائد ال--َاتُ-
affix all affix الزوائد
input all word الكلمة المدخلة البيانات
input all unvocalized غير مشكول
morphology noun tag_mamnou3 ممنوع من الصرف 0
morphology verb tag_confirmed خاصية الفعل المؤكد 0
morphology verb tag_mood حالة الفعل المضارع (منصوب، مجزوم، مرفوع) 0
morphology verb tag_pronoun الضمير 0
morphology verb tag_transitive التعدي اللزوم 0
morphology verb tag_voice البناء للمعلوم/ البناء للمجهول 0
morphology noun tag_regular قياسي/ سماعي 1
morphology noun/verb tag_gender النوع ( مؤنث مذكر) 3
morphology verb tag_person الشخص (المتكلم الغائب المخاطب) 4
morphology noun tag_number العدد(فرد/مثنى/جمع) 21
original noun/verb freq درجة شيوع الكلمة 694644
original all original_tags خصائص الكلمة الأصلية (u
original all original الكلمة الأصلية بَيَانٌ
original all root الجذر بين
original all tag_original_gender جنس الكلمة الأصلية مذكر
original noun tag_original_number عدد الكلمة الأصلية مفرد
output all type نوع الكلمة Noun:مصدر
output all semivocalized الكلمة مشكولة بدون علامة الإعراب الْبَيَانَات
output all vocalized الكلمةمشكولة الْبَيَانَاتُ
output all stem الجذع بيان
output all tags تعريف::جمع مؤنث سالم:مرفوع:متحرك:ينون:جمع:::
syntax all tag_break الكلمة منفصلة عمّا قبلها 0
syntax all tag_initial خاصية نحوية، الكلمة في بداية الجملة 0
syntax all tag_transparent البدل 0
syntax noun tag_added خاصية نحوية، الكلمة مضاف 0
syntax all need الكلمة تحتاج إلى كلمة أخرى (المتعدي، العوامل) غير منجزة
syntax tool action العمل
syntax tool object_type نوع المعمول، بالنسبة للعامل، مثلا اسم لحرف الجر

Files

  • file/directory category description

Featured Posts