In [15]:
import numpy as np
import pandas as pd

In [16]:
df = pd.read_csv('data/poems.csv', names=['id', 'text', 'tags'])

In [17]:
df.shape

(3797, 3)

In [18]:
df

Unnamed: 0,id,text,tags
0,22,أَلا مَن مُبلِغُ الأَحلافِ عَنِّي\nفَقَد تُهدَ...,قصائد عامه-عموديه-بحر الوافر- قافية الحاء (ح)
1,24,يا مالِ والحقُّ عنده فقِفُوا\nتُؤتَونَ فيه الو...,قصائد قصيره-عموديه-بحر المنسرح- قافية الفاء (ف)
2,25,صرمَت ظليمةُ خُلّتي ومراسلي\nوتباعدَت ضنّاً بز...,قصائد عامه-عموديه-بحر الكامل- قافية اللام (ل)
3,26,وَجِلاداً إِن نَشِطتَ لهُ\nعاجِلاً ليسَت لهُ ع...,قصائد قصيره-عموديه-بحر المديد- قافية الميم (م)
4,27,قَد تَقَطَرنَ بالعبيرِ ومَسكٍ\nوَتَكَبَينَ بال...,قصائد قصيره-عموديه-بحر الخفيف- قافية الياء (ي)
...,...,...,...
3792,4208,عن أمركم يتصرف الثقلانِ\nوبنصركم يتعاقبُ الملو...,قصائد عامه-عموديه-بحر الكامل- قافية النون (ن)
3793,4209,يا سيدي جاءتك رفعة شاعرٍ\nشهدت له الشعراءُ بال...,قصائد عامه-عموديه-بحر الكامل- قافية النون (ن)
3794,4210,أيابن خيارٍ بلغت المرام\nوقد يكسفُ البدر عند ا...,قصائد عامه-عموديه-بحر المتقارب- قافية الميم (م)
3795,4211,أيابُ الإمامِ حياةُ الأمم\nتوالى السرورُ بهِ و...,قصائد عامه-عموديه-بحر المتقارب- قافية الميم (م)


In [19]:
all_tags = set()
for i, item in df.iterrows():
    for t in item['tags'].split('-'):
        all_tags.add(t)

In [20]:
preprocessing_map = {
    'sea': set(filter(lambda x: 'بحر' in x, all_tags)),
    'ending': set(filter(lambda x: 'قافية' in x, all_tags)),
    'subject': set(filter(lambda x: 'قصائد' in x, all_tags)),
}

In [21]:
def get_sea(key):
    def func(x):
        tags_set = preprocessing_map[key]
        for t in x.split('-'):
            if t in tags_set:
                return t
        return np.nan
    return func

df['sea'] = df['tags'].apply(get_sea('sea'))
df['ending'] = df['tags'].apply(get_sea('ending'))
df['subject'] = df['tags'].apply(get_sea('subject'))

In [22]:
df

Unnamed: 0,id,text,tags,sea,ending,subject
0,22,أَلا مَن مُبلِغُ الأَحلافِ عَنِّي\nفَقَد تُهدَ...,قصائد عامه-عموديه-بحر الوافر- قافية الحاء (ح),بحر الوافر,قافية الحاء (ح),قصائد عامه
1,24,يا مالِ والحقُّ عنده فقِفُوا\nتُؤتَونَ فيه الو...,قصائد قصيره-عموديه-بحر المنسرح- قافية الفاء (ف),بحر المنسرح,قافية الفاء (ف),قصائد قصيره
2,25,صرمَت ظليمةُ خُلّتي ومراسلي\nوتباعدَت ضنّاً بز...,قصائد عامه-عموديه-بحر الكامل- قافية اللام (ل),بحر الكامل,قافية اللام (ل),قصائد عامه
3,26,وَجِلاداً إِن نَشِطتَ لهُ\nعاجِلاً ليسَت لهُ ع...,قصائد قصيره-عموديه-بحر المديد- قافية الميم (م),بحر المديد,قافية الميم (م),قصائد قصيره
4,27,قَد تَقَطَرنَ بالعبيرِ ومَسكٍ\nوَتَكَبَينَ بال...,قصائد قصيره-عموديه-بحر الخفيف- قافية الياء (ي),بحر الخفيف,قافية الياء (ي),قصائد قصيره
...,...,...,...,...,...,...
3792,4208,عن أمركم يتصرف الثقلانِ\nوبنصركم يتعاقبُ الملو...,قصائد عامه-عموديه-بحر الكامل- قافية النون (ن),بحر الكامل,قافية النون (ن),قصائد عامه
3793,4209,يا سيدي جاءتك رفعة شاعرٍ\nشهدت له الشعراءُ بال...,قصائد عامه-عموديه-بحر الكامل- قافية النون (ن),بحر الكامل,قافية النون (ن),قصائد عامه
3794,4210,أيابن خيارٍ بلغت المرام\nوقد يكسفُ البدر عند ا...,قصائد عامه-عموديه-بحر المتقارب- قافية الميم (م),بحر المتقارب,قافية الميم (م),قصائد عامه
3795,4211,أيابُ الإمامِ حياةُ الأمم\nتوالى السرورُ بهِ و...,قصائد عامه-عموديه-بحر المتقارب- قافية الميم (م),بحر المتقارب,قافية الميم (م),قصائد عامه


In [23]:
df[df.subject == 'قصائد ذم']

Unnamed: 0,id,text,tags,sea,ending,subject
8,31,رُبَّما ضَربَةٍ بسيفٍ صَقِيلٍ\nدُونَ بُصرَى وَ...,قصائد ذم-عموديه-بحر الخفيف- قافية الهمزة (ء),بحر الخفيف,قافية الهمزة (ء),قصائد ذم
