# Using Indic NLP Library
[https://github.com/anoopkunchukuttan/indic_nlp_library](https://github.com/anoopkunchukuttan/indic_nlp_library)

## Morphological Analysis

In [1]:
from indicnlp.morph import unsupervised_morph 

In [2]:
morph = unsupervised_morph.UnsupervisedMorphAnalyzer("bn")

In [3]:
text = u"""
করা করেছিলাম করেছি করতে করেছিল হয়েছে হয়েছিল হয় হওয়ার হবে আবিষ্কৃত আবিষ্কার অভিষিক্ত অভিষেক অভিষেকের আমি আমার আমাদের তুমি তোমার তোমাদের বসা বসেছিল বসে বসি বসেছিলাম বস বসার
"""

In [4]:
word_token = text.split(" ")

word_morph = []

for i in word_token:
    word_morph.append(morph.morph_analyze(i))

In [5]:
for i,j in zip(word_token, word_morph):
    print repr(i).decode("unicode_escape") + " => " + repr(j).decode("unicode_escape")

u'
করা' => [u'
করা']
u'করেছিলাম' => [u'করে', u'ছিলাম']
u'করেছি' => [u'করেছ', u'ি']
u'করতে' => [u'কর', u'তে']
u'করেছিল' => [u'করেছিল']
u'হয়েছে' => [u'হয়ে', u'ছে']
u'হয়েছিল' => [u'হয়ে', u'ছিল']
u'হয়' => [u'হয়']
u'হওয়ার' => [u'হওয়ার']
u'হবে' => [u'হবে']
u'আবিষ্কৃত' => [u'আবিষ্', u'কৃত']
u'আবিষ্কার' => [u'আবিষ্কার']
u'অভিষিক্ত' => [u'অভি', u'ষি', u'ক্ত']
u'অভিষেক' => [u'অভিষেক']
u'অভিষেকের' => [u'অভিষেক', u'ের']
u'আমি' => [u'আমি']
u'আমার' => [u'আমার']
u'আমাদের' => [u'আমাদের']
u'তুমি' => [u'তুমি']
u'তোমার' => [u'তো', u'মার']
u'তোমাদের' => [u'তোমাদের']
u'বসা' => [u'বসা']
u'বসেছিল' => [u'বসে', u'ছিল']
u'বসে' => [u'বসে']
u'বসি' => [u'ব', u'সি']
u'বসেছিলাম' => [u'বসে', u'ছিলাম']
u'বস' => [u'বস']
u'বসার
' => [u'বসার
']


## Transliteration

In [6]:
from indicnlp.transliterate.unicode_transliterate import ItransTransliterator

In [7]:
bangla_text = "ami apni tumi tomar tomader amar apnar apnader akash"

In [41]:
text_trans = ItransTransliterator.from_itrans(bangla_text, "bn")

In [42]:
print repr(text_trans).decode("unicode_escape")

u'অমি অপ্নি তুমি তোমর্ তোমদের্ অমর্ অপ্নর্ অপ্নদের্ অকশ্'


# Using Silpa
[https://github.com/libindic/Silpa-Flask](https://github.com/libindic/Silpa-Flask)

## Transliteration

In [2]:
from transliteration import getInstance 

In [3]:
trans = getInstance()

In [6]:
text_trans = trans.transliterate(bangla_text, "bn_IN")

Found  6  rules.
Found  6  rules.
Found  6  rules.
Found  6  rules.
Found  6  rules.
Found  6  rules.
Found  6  rules.
Found  6  rules.
Found  6  rules.


In [7]:
print repr(text_trans).decode("unicode_escape")

u'ওমী     অমোর    '


# Using BengaliStemmer
[https://github.com/gdebasis/BengaliStemmer](https://github.com/gdebasis/BengaliStemmer)

## Stemming

In [47]:
import rbs

In [49]:
word_stem = []

for i in word_token:
    word_stem.append(rbs.stemWord(i, True))

In [50]:
for i,j in zip(word_token, word_stem):
    print repr(i).decode("unicode_escape") + " => " + repr(j).decode("unicode_escape")

u'
করা' => u'
কর'
u'করেছিলাম' => u'করেছিলাম'
u'করেছি' => u'করেছ'
u'করতে' => u'করত'
u'করেছিল' => u'করেছিল'
u'হয়েছে' => u'হয়েছ'
u'হয়েছিল' => u'হয়েছিল'
u'হয়' => u'হ'
u'হওয়ার' => u'হ'
u'হবে' => u'হব'
u'আবিষ্কৃত' => u'আবিষ্কৃত'
u'আবিষ্কার' => u'আবিষ্ক'
u'অভিষিক্ত' => u'অভিষিক্ত'
u'অভিষেক' => u'অভিষেক'
u'অভিষেকের' => u'অভিষেক'
u'আমি' => u'আম'
u'আমার' => u'আমার'
u'আমাদের' => u'আম'
u'তুমি' => u'তুম'
u'তোমার' => u'তোম'
u'তোমাদের' => u'তোম'
u'বসা' => u'বস'
u'বসেছিল' => u'বসেছিল'
u'বসে' => u'বস'
u'বসি' => u'বস'
u'বসেছিলাম' => u'বসেছিলাম'
u'বস' => u'বস'
u'বসার
' => u'বসার
'
