You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
В вашем примере есть ошибка - при вызове методов (напр. ruts.diversity_stats.calc_ttr(t1) - вы передаёте строку целиком (переменная t1), а нужно передавать массив слов.
Если хотите рассчитать только одну метрику для экономии ресурсов - делайте это так:
words=WordsExtractor(lowercase=True).extract(post.text_)
print(ruts.diversity_stats.calc_ttr(words)) # ttr - одна из метрик
Заметил странное поведение , все значения разные.
t1 = 'Бальзам хороший, но пришёл один а не два, как написано '
{'ttr': 1.0,
'rttr': 3.162277660168379,
'cttr': 2.23606797749979,
'httr': 1.0,
'sttr': 0,
'mttr': 0.0,
'dttr': 0,
'mattr': 1.0,
'msttr': 1.0,
'mtld': 0.0,
'mamtld': 1.0,
'hdd': -1,
'simpson_index': 0,
'hapax_index': 0}
vs
ttr 0.4
rttr 2.9664793948382653
cttr 2.0976176963403033
httr 0.7713465066366824
sttr 0.5314553128319692
mttr 0.1313826679597258
dttr 7.611354035728222
mattr 0.41
msttr 0.42
mtld 14.338133470257823
mamtld 12.708333333333334
hdd 0.4587105249530551
simpson_index 15.0
hapax_index 319.06649307394474
The text was updated successfully, but these errors were encountered: