In [74]:
import pandas as pd
import numpy as np

from assessment.motivation_letter_assessor import count_total

In [79]:
df = pd.read_csv('../data/letters_with_grammar.csv')

In [80]:
questions_percentiles = {}

for col in df.columns:
    if col.startswith('question_'):
        all_scores = df[col].dropna()  # Drop NaN values to avoid errors
        questions_percentiles[col] = np.percentile(all_scores, [5, 20, 40, 70, 90])


In [81]:
questions_percentiles

{'question_1': array([0.25605044, 0.32888703, 0.37261043, 0.44196429, 0.50736603]),
 'question_2': array([0.27108292, 0.34387925, 0.39831877, 0.47050882, 0.5395731 ]),
 'question_3': array([0.2556844 , 0.34676914, 0.39169471, 0.44504784, 0.50376501]),
 'question_4': array([0.29287933, 0.34822476, 0.38855073, 0.4413141 , 0.49134033]),
 'question_5': array([0.27144551, 0.34573663, 0.39428987, 0.45225834, 0.51105902]),
 'question_6': array([0.17879566, 0.21923439, 0.24869516, 0.29151949, 0.34653676]),
 'question_7': array([0.32283916, 0.44933891, 0.51021342, 0.58215219, 0.64887917])}

In [82]:
df['total'] = df.apply(lambda row: count_total(row.to_dict(), questions_percentiles), axis=1)

In [83]:
df.columns

Index(['letter_id', 'program', 'average_score', 'mentions_average',
       'word_count', 'text', 'normalized_text', 'question_1', 'question_2',
       'question_3', 'question_4', 'question_5', 'question_6', 'question_7',
       'grammar_errors', 'grammar_errors_description', 'total'],
      dtype='object')

In [85]:
df['total'].describe()

count    1317.000000
mean       25.367502
std         6.506609
min         1.000000
25%        21.000000
50%        26.000000
75%        30.000000
max        41.000000
Name: total, dtype: float64

In [86]:
df.to_csv('../data/letters_with_total.csv', index=False)

In [87]:
df[df['total'] > 35]

Unnamed: 0,letter_id,program,average_score,mentions_average,word_count,text,normalized_text,question_1,question_2,question_3,question_4,question_5,question_6,question_7,grammar_errors,grammar_errors_description,total
28,14039024,AL Філологія,9.0,1,881,Шановний [РЕКТОР]!\nЗвертаюся до Вас з проханн...,шановний [ ректор ] ! \n звертатися прохання р...,0.596932,0.504140,0.494713,0.492975,0.505375,0.342913,0.601235,13,"[{""message"": ""\u041a\u0440\u0430\u0449\u0435: ...",37
29,13670580,AL Філологія,-,1,882,Звертаюся до вас оскільки прагну вступити до У...,звертатися оскільки прагнути вступити уку навч...,0.534578,0.438128,0.482262,0.419886,0.545571,0.300307,0.604112,4,"[{""message"": ""\u041f\u0456\u0441\u043b\u044f \...",37
30,13482056,AL Філологія,11.0,1,846,"Шановний [РЕКТОР]!\nЯ, [ВСТУПНИК], звертаюся д...","шановний [ ректор ] ! \n , [ вступник ] , звер...",0.495234,0.587268,0.499561,0.466779,0.635140,0.322465,0.621052,5,"[{""message"": ""\u041c\u043e\u0436\u043b\u0438\u...",39
31,13950221,AL Філологія,11.06,1,900,Шановні працівники приймальної комісії!\nЗверт...,шановний працівник приймальний комісія ! \n зв...,0.539189,0.533241,0.578218,0.430203,0.493923,0.285583,0.658967,8,"[{""message"": ""\u0412\u0441\u0442\u0430\u0432\u...",38
43,13459164,AL Філологія,-,1,784,Шановний [РЕКТОР]!\nЯ пишу цей мотиваційний ли...,шановний [ ректор ] ! \n писати мотиваційний л...,0.520156,0.578668,0.526098,0.577952,0.531585,0.345383,0.668762,7,"[{""message"": ""\u041f\u0440\u0430\u0432\u0438\u...",40
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1122,13942517,Психологія,11.05,1,813,Шановні працівники приймальної комісії! Зверта...,шановний працівник приймальний комісія ! зверт...,0.496986,0.537883,0.442874,0.496743,0.454683,0.302225,0.635013,8,"[{""message"": ""\u041f\u0435\u0440\u0435\u0434 \...",37
1130,13780060,Психологія,10.2,1,813,Шановний [РЕКТОР] !\nЗвертаюся до Вас у зв’язк...,шановний [ ректор ] ! \n звертатися зв’язку пр...,0.478599,0.470093,0.499812,0.520564,0.466043,0.301258,0.584624,5,"[{""message"": ""\u0425\u043e\u0447\u0430 \u0432\...",37
1132,13787104,Психологія,11.0,1,869,"Шановний [РЕКТОР]!\nЯ, [ВСТУПНИК], звертаюся д...","шановний [ ректор ] ! \n , [ вступник ] , звер...",0.536643,0.646651,0.542917,0.528639,0.465719,0.160973,0.765729,4,"[{""message"": ""\u041d\u0435 \u0441\u0442\u0430\...",39
1244,13864036,ЕПЕ,11.0,1,894,Шановний [РЕКТОР]!\nЗвертаюся до Вас щодо всту...,шановний [ ректор ] ! \n звертатися вступ уку ...,0.476938,0.508033,0.503530,0.506397,0.482150,0.346689,0.581971,9,"[{""message"": ""\u0417\u0433\u0456\u0434\u043d\u...",37
