## Решение практической задачи 3

### Задача: Формирование эффективных рабочих коллективов

> Решение практической задачи выполняется в два этапа. На первом этапе необходимо использовать библиотеку OCEAN-AI для получения гипотез предсказаний (оценок персональных качеств личности человека). На втором этапе следует использовать метод _colleague_ranking из библиотеки OCEAN-AI для решения представленной практической задачи на примере поиска подходящих коллег для целевого коллеги. Примеры результатов работы и реализации представлены ниже.

> Таким образом, библиотека OCEAN-AI предоставляет инструменты для анализа персональных качеств личности коллег и может помочь в формировании эффективных рабочих групп, улучшении коммуникации и сокращении конфликтов в коллективе.

<center>
    <img src="https://raw.githubusercontent.com/aimclub/OCEANAI/main/docs/source/user_guide/notebooks/images/Step_1_get_scores_en.svg" width="100%"/>
</center>

<center>
    <img src="https://raw.githubusercontent.com/aimclub/OCEANAI/main/docs/source/user_guide/notebooks/images/Step_2_task_3_en.svg" width="100%"/>
</center>

<hr>

In [57]:
import os  # Взаимодействие с файловой системой
import sys # Доступ к некоторым переменным и функциям Python

PATH_TO_SOURCE = os.path.abspath(os.path.dirname(globals()['_dh'][0]))
PATH_TO_ROOT = os.path.join(PATH_TO_SOURCE, '..', '..', '..')

sys.path.insert(0, os.path.abspath(PATH_TO_ROOT))

### `FI V2`

In [58]:
# Импорт необходимых инструментов
import os
import pandas as pd

# Импорт модуля
from oceanai.modules.lab.build import Run

# Создание экземпляра класса
_b5 = Run()

# Настройка ядра
_b5.path_to_save_ = './models' # Директория для сохранения файла
_b5.chunk_size_ = 2000000      # Размер загрузки файла из сети за 1 шаг

corpus = 'fi'

# Формирование аудиомоделей
res_load_model_hc = _b5.load_audio_model_hc()
res_load_model_nn = _b5.load_audio_model_nn()

# Загрузка весов аудиомоделей
url = _b5.weights_for_big5_['audio'][corpus]['hc']['googledisk']
res_load_model_weights_hc = _b5.load_audio_model_weights_hc(url = url, force_reload = False)

url = _b5.weights_for_big5_['audio'][corpus]['nn']['googledisk']
res_load_model_weights_nn = _b5.load_audio_model_weights_nn(url = url, force_reload = False)

# Формирование видеомоделей
res_load_model_hc = _b5.load_video_model_hc(lang='en')
res_load_model_deep_fe = _b5.load_video_model_deep_fe()
res_load_model_nn = _b5.load_video_model_nn()

# Загрузка весов видеомоделей
url = _b5.weights_for_big5_['video'][corpus]['hc']['googledisk']
res_load_model_weights_hc = _b5.load_video_model_weights_hc(url = url, force_reload = False)

url = _b5.weights_for_big5_['video'][corpus]['fe']['googledisk']
res_load_model_weights_deep_fe = _b5.load_video_model_weights_deep_fe(url = url, force_reload = False)

url = _b5.weights_for_big5_['video'][corpus]['nn']['googledisk']
res_load_model_weights_nn = _b5.load_video_model_weights_nn(url = url, force_reload = False)

# Загрузка словаря с экспертными признаками (текстовая модальность)
res_load_text_features = _b5.load_text_features()

# Формирование текстовых моделей 
res_setup_translation_model = _b5.setup_translation_model() # только для русского языка
res_setup_translation_model = _b5.setup_bert_encoder(force_reload = False)
res_load_text_model_hc_fi = _b5.load_text_model_hc(corpus=corpus)
res_load_text_model_nn_fi = _b5.load_text_model_nn(corpus=corpus)

# Загрузка весов текстовых моделей
url = _b5.weights_for_big5_['text'][corpus]['hc']['googledisk']
res_load_text_model_weights_hc_fi = _b5.load_text_model_weights_hc(url = url, force_reload = False)

url = _b5.weights_for_big5_['text'][corpus]['nn']['googledisk']
res_load_text_model_weights_nn_fi = _b5.load_text_model_weights_nn(url = url, force_reload = False)

# Формирование модели для мультимодального объединения информации
res_load_avt_model_b5 = _b5.load_avt_model_b5()

# Загрузка весов модели для мультимодального объединения информации
url = _b5.weights_for_big5_['avt'][corpus]['b5']['googledisk']
res_load_avt_model_weights_b5 = _b5.load_avt_model_weights_b5(url = url, force_reload = False)

PATH_TO_DIR = './video_FI/'
PATH_SAVE_VIDEO = './video_FI/test/'

_b5.path_to_save_ = PATH_SAVE_VIDEO

# Загрузка 10 тестовых аудиовидеозаписей из корпуса First Impression V2
# URL: https://chalearnlap.cvc.uab.cat/dataset/24/description/
domain = 'https://download.sberdisk.ru/download/file/'
tets_name_files = [
    '429713680?token=FqHdMLSSh7zYSZt&filename=_plk5k7PBEg.003.mp4',
    '429713681?token=Hz9b4lQkrLfic33&filename=be0DQawtVkE.002.mp4',
    '429713683?token=EgUXS9Xs8xHm5gz&filename=2d6btbaNdfo.000.mp4',
    '429713684?token=1U26753kmPYdIgt&filename=300gK3CnzW0.003.mp4',
    '429713685?token=LyigAWLTzDNwKJO&filename=300gK3CnzW0.001.mp4',
    '429713686?token=EpfRbCKHyuc4HPu&filename=cLaZxEf1nE4.004.mp4',
    '429713687?token=FNTkwqBr4jOS95l&filename=g24JGYuT74A.004.mp4',
    '429713688?token=qDT95nz7hfm2Nki&filename=JZNMxa3OKHY.000.mp4',
    '429713689?token=noLguEGXDpbcKhg&filename=nvlqJbHk_Lc.003.mp4',
    '429713679?token=9L7RQ0hgdJlcek6&filename=4vdJGgZpj4k.003.mp4'
]

for curr_files in tets_name_files:
    _b5.download_file_from_url(url = domain + curr_files, out = True)

# Получение прогнозов
_b5.path_to_dataset_ = PATH_TO_DIR # Директория набора данных
_b5.ext_ = ['.mp4'] # Расширения искомых файлов

# Полный путь к файлу с верными предсказаниями для подсчета точности
url_accuracy = _b5.true_traits_[corpus]['googledisk']

_b5.get_avt_predictions(url_accuracy = url_accuracy, lang = 'en')

<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:00:29</span><span style="color:#666">]</span> <span style="color:#666">Извлечение признаков (экспертных и нейросетевых) из текста ...</span>** 

<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:00:29</span><span style="color:#666">]</span> <span style="color:#666">Получение прогнозов и вычисление точности (мультимодальное объединение) ...</span>**<p><span style="color:#666">&nbsp;&nbsp;&nbsp;&nbsp;10 из 10 (100.0%) ... kaggle/working/OCEANAI/video_FI/test/4vdJGgZpj4k.003.mp4 ...</span></p>

Unnamed: 0_level_0,Path,Openness,Conscientiousness,Extraversion,Agreeableness,Non-Neuroticism
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1,be0DQawtVkE.002.mp4,0.676612,0.568144,0.552115,0.646172,0.640899
2,cLaZxEf1nE4.004.mp4,0.663619,0.5505,0.556719,0.585134,0.587168
3,g24JGYuT74A.004.mp4,0.586715,0.395457,0.407597,0.528028,0.502627
4,nvlqJbHk_Lc.003.mp4,0.511955,0.463753,0.391108,0.443741,0.438813
5,JZNMxa3OKHY.000.mp4,0.604756,0.522703,0.528715,0.593952,0.578697
6,_plk5k7PBEg.003.mp4,0.646188,0.609137,0.521393,0.612698,0.604051
7,2d6btbaNdfo.000.mp4,0.623021,0.661305,0.477141,0.655363,0.60524
8,300gK3CnzW0.003.mp4,0.468087,0.448507,0.372154,0.509777,0.453799
9,300gK3CnzW0.001.mp4,0.460228,0.411986,0.414164,0.497072,0.429769
10,4vdJGgZpj4k.003.mp4,0.583865,0.615778,0.494801,0.604368,0.585843


<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:00:29</span><span style="color:#666">]</span> <span style="color:#666">Точность по отдельным персональным качествам личности человека ...</span>** 

Unnamed: 0_level_0,Openness,Conscientiousness,Extraversion,Agreeableness,Non-Neuroticism,Mean
Metrics,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
MAE,0.073,0.0633,0.091,0.0703,0.0692,0.0734
Accuracy,0.927,0.9367,0.909,0.9297,0.9308,0.9266


<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:00:29</span><span style="color:#666">]</span> <span style="color:#666">Средняя средних абсолютных ошибок: <span style="color:#1776D2">0.0734</span>, средняя точность: <span style="color:#1776D2">0.9266</span> ...</span>** 

<span style="color:#008001">**Лог файлы успешно сохранены ...**</span>

<span style="color:#666">**--- Время выполнения: 69.449 сек. ---**</span>

True

<hr>

Для поиска подходящего коллеги по работе необходимо знать по два коэффициента корреляции для каждого персонального качества личности человека. Эти коэффициенты должны показывать, как изменится оценка качества одного человека, если она будет больше или меньше оценки качества другого человека.

В качестве примера предлагается использование коэффициентов корреляции между двумя людьми в контексте отношений "начальник-подчиненный", представленных в статье:

1) Kuroda S., Yamamoto I. Good boss, bad boss, workers’ mental health and productivity: Evidence from Japan // Japan & The World Economy. – 2018. – vol. 48. – pp. 106-118.

Пользователь может установить свои коэффициенты корреляции

In [59]:
# Загрузка датафрейма с коэффициентами корреляции
url = 'https://download.sberdisk.ru/download/file/478675819?token=LuB7L1QsEY0UuSs&filename=colleague_ranking.csv'
df_correlation_coefficients = pd.read_csv(url)
df_correlation_coefficients = pd.DataFrame(
    df_correlation_coefficients.drop(['ID'], axis = 1)
)

df_correlation_coefficients.index.name = 'ID'
df_correlation_coefficients.index += 1
df_correlation_coefficients.index = df_correlation_coefficients.index.map(str)

df_correlation_coefficients

Unnamed: 0_level_0,Score_comparison,Openness,Conscientiousness,Extraversion,Agreeableness,Non-Neuroticism
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1,higher,-0.0602,0.0471,-0.107,-0.0832,0.19
2,lower,-0.172,-0.105,0.0772,0.0703,-0.229


#### Поиск старшего коллеги

In [60]:
# Список оценок персональных качеств личности целевого человека
target_scores = [0.527886, 0.522337, 0.458468, 0.51761, 0.444649]

_b5._colleague_ranking(
    correlation_coefficients = df_correlation_coefficients,
    target_scores = target_scores,
    colleague = 'major',
    equal_coefficients = 0.5,
    out = False
)

_b5._save_logs(df = _b5.df_files_colleague_, name = 'major_colleague_ranking_fi_en', out = True)

# Опционно
df = _b5.df_files_colleague_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,Match
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
5,JZNMxa3OKHY.000.mp4,0.605,0.523,0.529,0.594,0.579,0.229
8,300gK3CnzW0.003.mp4,0.468,0.449,0.372,0.51,0.454,0.023
3,g24JGYuT74A.004.mp4,0.587,0.395,0.408,0.528,0.503,0.006
7,2d6btbaNdfo.000.mp4,0.623,0.661,0.477,0.655,0.605,0.003
10,4vdJGgZpj4k.003.mp4,0.584,0.616,0.495,0.604,0.586,0.002
6,_plk5k7PBEg.003.mp4,0.646,0.609,0.521,0.613,0.604,-0.002
1,be0DQawtVkE.002.mp4,0.677,0.568,0.552,0.646,0.641,-0.005
2,cLaZxEf1nE4.004.mp4,0.664,0.551,0.557,0.585,0.587,-0.011
9,300gK3CnzW0.001.mp4,0.46,0.412,0.414,0.497,0.43,-0.154
4,nvlqJbHk_Lc.003.mp4,0.512,0.464,0.391,0.444,0.439,-0.176


#### Поиск младшего коллеги

In [61]:
# Список оценок персональных качеств личности целевого человека
target_scores = [0.527886, 0.522337, 0.458468, 0.51761, 0.444649]

_b5._colleague_ranking(
    correlation_coefficients = df_correlation_coefficients,
    target_scores = target_scores,
    colleague = 'minor',
    equal_coefficients = 0.5,
    out = False
)

_b5._save_logs(df = _b5.df_files_colleague_, name = 'minor_colleague_ranking_fi_en', out = True)

# Опционно
df = _b5.df_files_colleague_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,Match
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
5,JZNMxa3OKHY.000.mp4,0.605,0.523,0.529,0.594,0.579,0.107
4,nvlqJbHk_Lc.003.mp4,0.512,0.464,0.391,0.444,0.439,-0.004
9,300gK3CnzW0.001.mp4,0.46,0.412,0.414,0.497,0.43,-0.012
8,300gK3CnzW0.003.mp4,0.468,0.449,0.372,0.51,0.454,-0.193
3,g24JGYuT74A.004.mp4,0.587,0.395,0.408,0.528,0.503,-0.204
10,4vdJGgZpj4k.003.mp4,0.584,0.616,0.495,0.604,0.586,-0.219
2,cLaZxEf1nE4.004.mp4,0.664,0.551,0.557,0.585,0.587,-0.222
6,_plk5k7PBEg.003.mp4,0.646,0.609,0.521,0.613,0.604,-0.23
7,2d6btbaNdfo.000.mp4,0.623,0.661,0.477,0.655,0.605,-0.232
1,be0DQawtVkE.002.mp4,0.677,0.568,0.552,0.646,0.641,-0.235


<hr>

Для поиска подходящего коллеги по типу личности MBTI необходимо знать коэффициенты корреляции между личностными качествами человека и типами личности MBTI, а также оценки этих качеств для целевого человека.

В качестве примера предлагается использование коэффициентов корреляции, представленных в статье:

1) Furnham A. The big five facets and the MBTI: The relationship between the 30 NEO-PI (R) Facets and the four Myers-Briggs Type Indicator (MBTI) scores // Psychology. - 2022. vol. 13(10). - pp. 1504-1516.

Пользователь может установить свои коэффициенты корреляции

In [62]:
# Загрузка датафрейма с коэффициентами корреляции
url = 'https://download.sberdisk.ru/download/file/493644095?token=EX7hFxNJhMoLumI&filename=df_mbti_correlation.csv'
df_correlation_coefficients = pd.read_csv(url)

df_correlation_coefficients.index.name = 'ID'
df_correlation_coefficients.index += 1
df_correlation_coefficients.index = df_correlation_coefficients.index.map(str)

df_correlation_coefficients

Unnamed: 0_level_0,Trait,EI,SN,TF,JP
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
1,Openness,0.09,-0.03,-0.14,-0.16
2,Conscientiousness,0.04,-0.04,0.2,0.14
3,Extraversion,0.2,-0.03,0.01,-0.07
4,Agreeableness,0.02,0.05,-0.35,0.03
5,Non-Neuroticism,0.08,0.0,0.16,0.0


In [63]:
_b5._colleague_personality_type_match(
    correlation_coefficients = df_correlation_coefficients,
    target_scores = [0.34, 0.56, 0.42, 0.57, 0.56],
    threshold = 0.5,
    out = True
)

_b5._save_logs(df = _b5.df_files_MBTI_colleague_match_, name = 'MBTI_colleague_personality_type_match_en', out = True)

# Optional
df = _b5.df_files_MBTI_colleague_match_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:6]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,EI,SN,TF,JP,MBTI,Match
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
9,300gK3CnzW0.001.mp4,0.46,0.412,0.414,0.497,0.43,-0.185056,0.017858,0.083105,0.030038,ISTJ,100.0
8,300gK3CnzW0.003.mp4,0.468,0.449,0.372,0.51,0.454,-0.160607,0.068636,-0.27892,0.053447,ISFJ,75.0
10,4vdJGgZpj4k.003.mp4,0.584,0.616,0.495,0.604,0.586,0.037174,0.002915,-0.081327,0.045557,ESFJ,50.0
7,2d6btbaNdfo.000.mp4,0.623,0.661,0.477,0.655,0.605,0.048622,0.00194,-0.092272,0.04596,ESFJ,50.0
4,nvlqJbHk_Lc.003.mp4,0.512,0.464,0.391,0.444,0.439,-0.094676,-0.007262,-0.083236,-0.132773,INFP,25.0
3,g24JGYuT74A.004.mp4,0.587,0.395,0.408,0.528,0.503,0.006237,0.036846,-0.269697,-0.104866,ESFP,25.0
2,cLaZxEf1nE4.004.mp4,0.664,0.551,0.557,0.585,0.587,0.251766,-0.029373,-0.08809,-0.050525,ENFP,0.0
1,be0DQawtVkE.002.mp4,0.677,0.568,0.552,0.646,0.641,0.258239,-0.027279,-0.099192,-0.047981,ENFP,0.0
6,_plk5k7PBEg.003.mp4,0.646,0.609,0.521,0.613,0.604,0.247379,-0.028758,-0.081221,-0.036228,ENFP,0.0
5,JZNMxa3OKHY.000.mp4,0.605,0.523,0.529,0.594,0.579,0.239254,-0.025215,-0.09013,-0.042774,ENFP,0.0


<hr>

Для определения степени выраженности персональных растройств необходимо знать коэффициенты корреляции между персональными качествами личности человека и типами личности MBTI, а также кооэффициенты корреляции между типами личности MBTI и персональными растройствами.

В качестве примера предлагается использование коэффициентов корреляции между персональными качествами личности человека и типами личности MBTI, представленных в статье [1] и кооэффициентов корреляции между типами личности MBTI и персональными растройствами [2].

1) Furnham A. The big five facets and the MBTI: The relationship between the 30 NEO-PI (R) Facets and the four Myers-Briggs Type Indicator (MBTI) scores // Psychology. - 2022. vol. 13(10). - pp. 1504-1516.
2) Furnham A. MBTI and aberrant personality traits: dark-side trait correlates of the Myers Briggs type inventory // Psychology. - 2022. - vol. 13(5). - pp 805-815.

Среди персональных расстройста рассматриваются следующие:
1) Параноидное (Paranoid) — Недоверие и подозрительность по отношению к другим; мотивы интерпретируются как злонамеренные.
2) Шизоидное (Schizoid) — Эмоциональная холодность и отстранённость от социальных отношений; безразличие к похвалам и критике.
3) Шизотипическое (Schizotypal) — Странные убеждения или магическое мышление; поведение или речь, которые кажутся странными, эксцентричными или необычными.
4) Антисоциальное (Antisocial) — Пренебрежение к истине; импульсивность и неспособность планировать будущее; нарушение социальных норм.
5) Пограничное (Borderline) — Неуместная злость; нестабильные и интенсивные отношения, которые чередуются между идеализацией и обесцениванием.
6) Истерическое (Histrionic) — Чрезмерная эмоциональность и стремление к вниманию; драматизация, театральное поведение и преувеличенное выражение эмоций.
7) Нарциссическое (Narcissistic) — Высокомерные и надменные манеры или установки, преувеличенное чувство собственной значимости и права на особое отношение.
8) Избегающее (Avoidant) — Социальное избегание; чувство неполноценности и повышенная чувствительность к критике или отказу.
9) Зависимое (Dependent) — Трудности в принятии повседневных решений без чрезмерных советов и уверений; трудности в выражении несогласия из-за страха потери поддержки или одобрения.
10) Обсессивно-компульсивное личностное расстройство (OCPD) — Чрезмерная озабоченность порядком, перфекционизмом, контролем и деталями; стремление к соблюдению правил, часто в ущерб гибкости и эффективности.


Пользователь может установить свои коэффициенты корреляции

In [64]:
url = 'https://download.sberdisk.ru/download/file/493644095?token=EX7hFxNJhMoLumI&filename=df_mbti_correlation.csv'
df_correlation_coefficients_mbti = pd.read_csv(url)

df_correlation_coefficients_mbti.index.name = 'ID'
df_correlation_coefficients_mbti.index += 1
df_correlation_coefficients_mbti.index = df_correlation_coefficients_mbti.index.map(str)

url = 'https://download.sberdisk.ru/download/file/493644096?token=T309xfzRosPj3v9&filename=df_disorder_correlation.csv'
df_correlation_coefficients_disorders = pd.read_csv(url)

df_correlation_coefficients_disorders.index.name = 'ID'
df_correlation_coefficients_disorders.index += 1
df_correlation_coefficients_disorders.index = df_correlation_coefficients_disorders.index.map(str)

In [65]:
_b5._colleague_personality_desorders(
    correlation_coefficients_mbti = df_correlation_coefficients_mbti,
    correlation_coefficients_disorders = df_correlation_coefficients_disorders,
    personality_desorder_number = 3,
    threshold = 0.5,
    out = True
)

_b5._save_logs(df = _b5.df_files_MBTI_disorders_, name = 'MBTI_colleague_personality_type_match_fi_en', out = True)

# Optional
df = _b5.df_files_MBTI_disorders_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:6]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,MBTI,Disorder 1,Disorder 2,Disorder 3
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
1,be0DQawtVkE.002.mp4,0.677,0.568,0.552,0.646,0.641,ENFP,Paranoid (0.067),Narcissistic (0.064),Histrionic (0.062)
2,cLaZxEf1nE4.004.mp4,0.664,0.551,0.557,0.585,0.587,ENFP,Paranoid (0.063),Histrionic (0.06),Narcissistic (0.06)
3,g24JGYuT74A.004.mp4,0.587,0.395,0.408,0.528,0.503,ESFP,Narcissistic (0.089),Paranoid (0.084),Dependent (0.074)
4,nvlqJbHk_Lc.003.mp4,0.512,0.464,0.391,0.444,0.439,INFP,Avoidant (0.036),Schizoid (0.035),Narcissistic (0.031)
5,JZNMxa3OKHY.000.mp4,0.605,0.523,0.529,0.594,0.579,ENFP,Paranoid (0.061),Narcissistic (0.058),Histrionic (0.057)
6,_plk5k7PBEg.003.mp4,0.646,0.609,0.521,0.613,0.604,ENFP,Paranoid (0.06),Histrionic (0.057),Narcissistic (0.056)
7,2d6btbaNdfo.000.mp4,0.623,0.661,0.477,0.655,0.605,ESFJ,Narcissistic (0.034),Paranoid (0.034),Dependent (0.028)
8,300gK3CnzW0.003.mp4,0.468,0.449,0.372,0.51,0.454,ISFJ,Dependent (0.089),Narcissistic (0.087),Paranoid (0.082)
9,300gK3CnzW0.001.mp4,0.46,0.412,0.414,0.497,0.43,ISTJ,Schizoid (0.039),Avoidant (0.022),Dependent (0.012)
10,4vdJGgZpj4k.003.mp4,0.584,0.616,0.495,0.604,0.586,ESFJ,Narcissistic (0.03),Paranoid (0.029),Dependent (0.025)


### `MuPTA` (ru)

In [66]:
import os
import pandas as pd

# Импорт модуля
from oceanai.modules.lab.build import Run

# Создание экземпляра класса
_b5 = Run()

corpus = 'mupta'
lang = 'ru'

# Настройка ядра
_b5.path_to_save_ = './models' # Директория для сохранения файла
_b5.chunk_size_ = 2000000      # Размер загрузки файла из сети за 1 шаг

# Формирование аудиомоделей
res_load_model_hc = _b5.load_audio_model_hc()
res_load_model_nn = _b5.load_audio_model_nn()

# Загрузка весов аудиомоделей
url = _b5.weights_for_big5_['audio'][corpus]['hc']['googledisk']
res_load_model_weights_hc = _b5.load_audio_model_weights_hc(url = url, force_reload = False)

url = _b5.weights_for_big5_['audio'][corpus]['nn']['googledisk']
res_load_model_weights_nn = _b5.load_audio_model_weights_nn(url = url, force_reload = False)

# Формирование видеомоделей
res_load_model_hc = _b5.load_video_model_hc(lang=lang)
res_load_model_deep_fe = _b5.load_video_model_deep_fe()
res_load_model_nn = _b5.load_video_model_nn()

# Загрузка весов видеомоделей
url = _b5.weights_for_big5_['video'][corpus]['hc']['googledisk']
res_load_model_weights_hc = _b5.load_video_model_weights_hc(url = url, force_reload = False)

url = _b5.weights_for_big5_['video'][corpus]['fe']['googledisk']
res_load_model_weights_deep_fe = _b5.load_video_model_weights_deep_fe(url = url, force_reload = False)

url = _b5.weights_for_big5_['video'][corpus]['nn']['googledisk']
res_load_model_weights_nn = _b5.load_video_model_weights_nn(url = url, force_reload = False)

# Загрузка словаря с экспертными признаками (текстовая модальность)
res_load_text_features = _b5.load_text_features()

# Формирование текстовых моделей 
res_setup_translation_model = _b5.setup_translation_model() # только для русского языка
res_setup_translation_model = _b5.setup_bert_encoder(force_reload = False)
res_load_text_model_hc_fi = _b5.load_text_model_hc(corpus=corpus)
res_load_text_model_nn_fi = _b5.load_text_model_nn(corpus=corpus)

# Загрузка весов текстовых моделей
url = _b5.weights_for_big5_['text'][corpus]['hc']['googledisk']
res_load_text_model_weights_hc_fi = _b5.load_text_model_weights_hc(url = url, force_reload = False)

url = _b5.weights_for_big5_['text'][corpus]['nn']['googledisk']
res_load_text_model_weights_nn_fi = _b5.load_text_model_weights_nn(url = url, force_reload = False)

# Формирование модели для мультимодального объединения информации
res_load_avt_model_b5 = _b5.load_avt_model_b5()

# Загрузка весов модели для мультимодального объединения информации
url = _b5.weights_for_big5_['avt'][corpus]['b5']['googledisk']
res_load_avt_model_weights_b5 = _b5.load_avt_model_weights_b5(url = url, force_reload = False)

PATH_TO_DIR = './video_MuPTA/'
PATH_SAVE_VIDEO = './video_MuPTA/test/'

_b5.path_to_save_ = PATH_SAVE_VIDEO

# Загрузка 10 тестовых аудиовидеозаписей из корпуса MuPTA
# URL: https://hci.nw.ru/en/pages/mupta-corpus
domain = 'https://download.sberdisk.ru/download/file/'
tets_name_files = [
    '477995979?token=2cvyk7CS0mHx2MJ&filename=speaker_06_center_83.mov',
    '477995980?token=jGPtBPS69uzFU6Y&filename=speaker_01_center_83.mov',
    '477995967?token=zCaRbNB6ht5wMPq&filename=speaker_11_center_83.mov',
    '477995966?token=B1rbinDYRQKrI3T&filename=speaker_15_center_83.mov',
    '477995978?token=dEpVDtZg1EQiEQ9&filename=speaker_07_center_83.mov',
    '477995961?token=o1hVjw8G45q9L9Z&filename=speaker_19_center_83.mov',
    '477995964?token=5K220Aqf673VHPq&filename=speaker_23_center_83.mov',
    '477995965?token=v1LVD2KT1cU7Lpb&filename=speaker_24_center_83.mov',
    '477995962?token=tmaSGyyWLA6XCy9&filename=speaker_27_center_83.mov',
    '477995963?token=bTpo96qNDPcwGqb&filename=speaker_10_center_83.mov',
]

for curr_files in tets_name_files:
    _b5.download_file_from_url(url = domain + curr_files, out = True)

# Получение прогнозов
_b5.path_to_dataset_ = PATH_TO_DIR # Директория набора данных
_b5.ext_ = ['.mov'] # Расширения искомых файлов

# Полный путь к файлу с верными предсказаниями для подсчета точности
url_accuracy = _b5.true_traits_['mupta']['googledisk']

_b5.get_avt_predictions(url_accuracy = url_accuracy, lang = lang)

<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:11:08</span><span style="color:#666">]</span> <span style="color:#666">Извлечение признаков (экспертных и нейросетевых) из текста ...</span>** 

<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:11:11</span><span style="color:#666">]</span> <span style="color:#666">Получение прогнозов и вычисление точности (мультимодальное объединение) ...</span>**<p><span style="color:#666">&nbsp;&nbsp;&nbsp;&nbsp;10 из 10 (100.0%) ... kaggle/working/OCEANAI/video_MuPTA/test/speaker_11_center_83.mov ...</span></p>

Unnamed: 0_level_0,Path,Openness,Conscientiousness,Extraversion,Agreeableness,Non-Neuroticism
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1,speaker_01_center_83.mov,0.765416,0.696566,0.655036,0.758601,0.493137
2,speaker_15_center_83.mov,0.670995,0.670984,0.602225,0.708286,0.399343
3,speaker_07_center_83.mov,0.672468,0.662605,0.573035,0.705879,0.382358
4,speaker_19_center_83.mov,0.767356,0.658374,0.65355,0.801389,0.463584
5,speaker_27_center_83.mov,0.760904,0.710591,0.653713,0.827697,0.506974
6,speaker_10_center_83.mov,0.698376,0.599233,0.571993,0.674869,0.351017
7,speaker_24_center_83.mov,0.710313,0.662193,0.610217,0.71095,0.413197
8,speaker_06_center_83.mov,0.686585,0.659252,0.611847,0.749765,0.420683
9,speaker_23_center_83.mov,0.701222,0.688211,0.619921,0.807958,0.451005
10,speaker_11_center_83.mov,0.71846,0.599196,0.573454,0.73208,0.380035


<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:11:11</span><span style="color:#666">]</span> <span style="color:#666">Точность по отдельным персональным качествам личности человека ...</span>** 

Unnamed: 0_level_0,Openness,Conscientiousness,Extraversion,Agreeableness,Non-Neuroticism,Mean
Metrics,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
MAE,0.0709,0.079,0.1324,0.1069,0.1,0.0978
Accuracy,0.9291,0.921,0.8676,0.8931,0.9,0.9022


<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:11:11</span><span style="color:#666">]</span> <span style="color:#666">Средняя средних абсолютных ошибок: <span style="color:#1776D2">0.0978</span>, средняя точность: <span style="color:#1776D2">0.9022</span> ...</span>** 

<span style="color:#008001">**Лог файлы успешно сохранены ...**</span>

<span style="color:#666">**--- Время выполнения: 564.559 сек. ---**</span>

True

<hr>

Для поиска подходящего коллеги по работе необходимо знать по два коэффициента корреляции для каждого персонального качества личности человека. Эти коэффициенты должны показывать, как изменится оценка качества одного человека, если она будет больше или меньше оценки качества другого человека.

В качестве примера предлагается использование коэффициентов корреляции между двумя людьми в контексте отношений "начальник-подчиненный", представленных в статье:

1) Kuroda S., Yamamoto I. Good boss, bad boss, workers’ mental health and productivity: Evidence from Japan // Japan & The World Economy. – 2018. – vol. 48. – pp. 106-118.

Пользователь может установить свои коэффициенты корреляции

In [67]:
# Загрузка датафрейма с коэффициентами корреляции
url = 'https://download.sberdisk.ru/download/file/478675819?token=LuB7L1QsEY0UuSs&filename=colleague_ranking.csv'
df_correlation_coefficients = pd.read_csv(url)
df_correlation_coefficients = pd.DataFrame(
    df_correlation_coefficients.drop(['ID'], axis = 1)
)

df_correlation_coefficients.index.name = 'ID'
df_correlation_coefficients.index += 1
df_correlation_coefficients.index = df_correlation_coefficients.index.map(str)

df_correlation_coefficients

Unnamed: 0_level_0,Score_comparison,Openness,Conscientiousness,Extraversion,Agreeableness,Non-Neuroticism
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1,higher,-0.0602,0.0471,-0.107,-0.0832,0.19
2,lower,-0.172,-0.105,0.0772,0.0703,-0.229


#### Поиск старшего коллеги

In [68]:
# Список оценок персональных качеств личности целевого человека
target_scores = [0.527886, 0.522337, 0.458468, 0.51761, 0.444649]

_b5._colleague_ranking(
    correlation_coefficients = df_correlation_coefficients,
    target_scores = target_scores,
    colleague = 'major',
    equal_coefficients = 0.5,
    out = False
)

_b5._save_logs(df = _b5.df_files_colleague_, name = 'major_colleague_ranking_mupta_ru', out = True)

# Опционно
df = _b5.df_files_colleague_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,Match
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
1,speaker_01_center_83.mov,0.765,0.697,0.655,0.759,0.493,-0.053
5,speaker_27_center_83.mov,0.761,0.711,0.654,0.828,0.507,-0.055
9,speaker_23_center_83.mov,0.701,0.688,0.62,0.808,0.451,-0.058
4,speaker_19_center_83.mov,0.767,0.658,0.654,0.801,0.464,-0.064
6,speaker_10_center_83.mov,0.698,0.599,0.572,0.675,0.351,-0.212
3,speaker_07_center_83.mov,0.672,0.663,0.573,0.706,0.382,-0.217
2,speaker_15_center_83.mov,0.671,0.671,0.602,0.708,0.399,-0.224
10,speaker_11_center_83.mov,0.718,0.599,0.573,0.732,0.38,-0.224
7,speaker_24_center_83.mov,0.71,0.662,0.61,0.711,0.413,-0.231
8,speaker_06_center_83.mov,0.687,0.659,0.612,0.75,0.421,-0.234


#### Поиск младшего коллеги

In [69]:
# Список оценок персональных качеств личности целевого человека
target_scores = [0.527886, 0.522337, 0.458468, 0.51761, 0.444649]

_b5._colleague_ranking(
    correlation_coefficients = df_correlation_coefficients,
    target_scores = target_scores,
    colleague = 'minor',
    equal_coefficients = 0.5,
    out = False
)

_b5._save_logs(df = _b5.df_files_colleague_, name = 'minor_colleague_ranking_mupta_ru', out = True)

# Опционно
df = _b5.df_files_colleague_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,Match
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
8,speaker_06_center_83.mov,0.687,0.659,0.612,0.75,0.421,-0.007
2,speaker_15_center_83.mov,0.671,0.671,0.602,0.708,0.399,-0.014
7,speaker_24_center_83.mov,0.71,0.662,0.61,0.711,0.413,-0.016
10,speaker_11_center_83.mov,0.718,0.599,0.573,0.732,0.38,-0.019
3,speaker_07_center_83.mov,0.672,0.663,0.573,0.706,0.382,-0.019
6,speaker_10_center_83.mov,0.698,0.599,0.572,0.675,0.351,-0.025
9,speaker_23_center_83.mov,0.701,0.688,0.62,0.808,0.451,-0.191
4,speaker_19_center_83.mov,0.767,0.658,0.654,0.801,0.464,-0.201
5,speaker_27_center_83.mov,0.761,0.711,0.654,0.828,0.507,-0.213
1,speaker_01_center_83.mov,0.765,0.697,0.655,0.759,0.493,-0.214


<hr>

Для поиска подходящего коллеги по типу личности MBTI необходимо знать коэффициенты корреляции между личностными качествами человека и типами MBTI, а также оценки этих качеств для целевого человека.

В качестве примера предлагается использование коэффициентов корреляции, представленных в статье:

1) Furnham A. The big five facets and the MBTI: The relationship between the 30 NEO-PI (R) Facets and the four Myers-Briggs Type Indicator (MBTI) scores // Psychology. - 2022. vol. 13(10). - pp. 1504-1516.

Пользователь может установить свои коэффициенты корреляции

In [70]:
# Загрузка датафрейма с коэффициентами корреляции
url = 'https://download.sberdisk.ru/download/file/493644095?token=EX7hFxNJhMoLumI&filename=df_mbti_correlation.csv'
df_correlation_coefficients = pd.read_csv(url)

df_correlation_coefficients.index.name = 'ID'
df_correlation_coefficients.index += 1
df_correlation_coefficients.index = df_correlation_coefficients.index.map(str)

df_correlation_coefficients

Unnamed: 0_level_0,Trait,EI,SN,TF,JP
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
1,Openness,0.09,-0.03,-0.14,-0.16
2,Conscientiousness,0.04,-0.04,0.2,0.14
3,Extraversion,0.2,-0.03,0.01,-0.07
4,Agreeableness,0.02,0.05,-0.35,0.03
5,Non-Neuroticism,0.08,0.0,0.16,0.0


In [71]:
_b5._colleague_personality_type_match(
    correlation_coefficients = df_correlation_coefficients,
    target_scores = [0.34, 0.56, 0.42, 0.57, 0.56],
    threshold = 0.5,
    out = False
)

_b5._save_logs(df = _b5.df_files_MBTI_colleague_match_, name = 'MBTI_colleague_personality_type_match_ru', out = True)

# Optional
df = _b5.df_files_MBTI_colleague_match_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:6]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,EI,SN,TF,JP,MBTI,Match
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
1,speaker_01_center_83.mov,0.765,0.697,0.655,0.759,0.493,0.203478,-0.032546,-0.305707,-0.048042,ENFP,0.0
2,speaker_15_center_83.mov,0.671,0.671,0.602,0.708,0.399,0.189892,-0.029622,-0.265515,-0.034329,ENFP,0.0
3,speaker_07_center_83.mov,0.672,0.663,0.573,0.706,0.382,0.185162,-0.028575,-0.264129,-0.033766,ENFP,0.0
4,speaker_19_center_83.mov,0.767,0.658,0.654,0.801,0.464,0.205048,-0.028893,-0.323879,-0.052312,ENFP,0.0
5,speaker_27_center_83.mov,0.761,0.711,0.654,0.828,0.507,0.28476,-0.029477,-0.166449,-0.043191,ENFP,0.0
6,speaker_10_center_83.mov,0.698,0.599,0.572,0.675,0.351,0.186638,-0.028337,-0.264573,-0.047641,ENFP,0.0
7,speaker_24_center_83.mov,0.71,0.662,0.61,0.711,0.413,0.193622,-0.030556,-0.275847,-0.04233,ENFP,0.0
8,speaker_06_center_83.mov,0.687,0.659,0.612,0.75,0.421,0.191873,-0.027835,-0.28788,-0.037895,ENFP,0.0
9,speaker_23_center_83.mov,0.701,0.688,0.62,0.808,0.451,0.194701,-0.026765,-0.309276,-0.035002,ENFP,0.0
10,speaker_11_center_83.mov,0.718,0.599,0.573,0.732,0.38,0.187559,-0.026121,-0.292044,-0.049246,ENFP,0.0


<hr>

Для определения степени выраженности персональных растройств необходимо знать коэффициенты корреляции между персональными качествами личности человека и типами личности MBTI, а также кооэффициенты корреляции между типами личности MBTI и персональными растройствами.

В качестве примера предлагается использование коэффициентов корреляции между персональными качествами личности человека и типами личности MBTI, представленных в статье [1] и кооэффициентов корреляции между типами личности MBTI и персональными растройствами [2].

1) Furnham A. The big five facets and the MBTI: The relationship between the 30 NEO-PI (R) Facets and the four Myers-Briggs Type Indicator (MBTI) scores // Psychology. - 2022. vol. 13(10). - pp. 1504-1516.
2) Furnham A. MBTI and aberrant personality traits: dark-side trait correlates of the Myers Briggs type inventory // Psychology. - 2022. - vol. 13(5). - pp 805-815.

Среди персональных расстройста рассматриваются следующие:
1) Параноидное (Paranoid) — Недоверие и подозрительность по отношению к другим; мотивы интерпретируются как злонамеренные.
2) Шизоидное (Schizoid) — Эмоциональная холодность и отстранённость от социальных отношений; безразличие к похвалам и критике.
3) Шизотипическое (Schizotypal) — Странные убеждения или магическое мышление; поведение или речь, которые кажутся странными, эксцентричными или необычными.
4) Антисоциальное (Antisocial) — Пренебрежение к истине; импульсивность и неспособность планировать будущее; нарушение социальных норм.
5) Пограничное (Borderline) — Неуместная злость; нестабильные и интенсивные отношения, которые чередуются между идеализацией и обесцениванием.
6) Истерическое (Histrionic) — Чрезмерная эмоциональность и стремление к вниманию; драматизация, театральное поведение и преувеличенное выражение эмоций.
7) Нарциссическое (Narcissistic) — Высокомерные и надменные манеры или установки, преувеличенное чувство собственной значимости и права на особое отношение.
8) Избегающее (Avoidant) — Социальное избегание; чувство неполноценности и повышенная чувствительность к критике или отказу.
9) Зависимое (Dependent) — Трудности в принятии повседневных решений без чрезмерных советов и уверений; трудности в выражении несогласия из-за страха потери поддержки или одобрения.
10) Обсессивно-компульсивное личностное расстройство (OCPD) — Чрезмерная озабоченность порядком, перфекционизмом, контролем и деталями; стремление к соблюдению правил, часто в ущерб гибкости и эффективности.


Пользователь может установить свои коэффициенты корреляции

In [72]:
url = 'https://download.sberdisk.ru/download/file/493644095?token=EX7hFxNJhMoLumI&filename=df_mbti_correlation.csv'
df_correlation_coefficients_mbti = pd.read_csv(url)

df_correlation_coefficients_mbti.index.name = 'ID'
df_correlation_coefficients_mbti.index += 1
df_correlation_coefficients_mbti.index = df_correlation_coefficients_mbti.index.map(str)

url = 'https://download.sberdisk.ru/download/file/493644096?token=T309xfzRosPj3v9&filename=df_disorder_correlation.csv'
df_correlation_coefficients_disorders = pd.read_csv(url)

df_correlation_coefficients_disorders.index.name = 'ID'
df_correlation_coefficients_disorders.index += 1
df_correlation_coefficients_disorders.index = df_correlation_coefficients_disorders.index.map(str)

In [73]:
_b5._colleague_personality_desorders(
    correlation_coefficients_mbti = df_correlation_coefficients_mbti,
    correlation_coefficients_disorders = df_correlation_coefficients_disorders,
    personality_desorder_number = 3,
    threshold = 0.5,
    out = True
)

_b5._save_logs(df = _b5.df_files_MBTI_disorders_, name = 'MBTI_colleague_personality_type_match_fi_en', out = True)

# Optional
df = _b5.df_files_MBTI_disorders_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:6]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,MBTI,Disorder 1,Disorder 2,Disorder 3
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
1,speaker_01_center_83.mov,0.765,0.697,0.655,0.759,0.493,ENFP,Narcissistic (0.121),Paranoid (0.119),Dependent (0.083)
2,speaker_15_center_83.mov,0.671,0.671,0.602,0.708,0.399,ENFP,Narcissistic (0.106),Paranoid (0.105),Dependent (0.072)
3,speaker_07_center_83.mov,0.672,0.663,0.573,0.706,0.382,ENFP,Narcissistic (0.105),Paranoid (0.104),Dependent (0.071)
4,speaker_19_center_83.mov,0.767,0.658,0.654,0.801,0.464,ENFP,Narcissistic (0.127),Paranoid (0.125),Dependent (0.087)
5,speaker_27_center_83.mov,0.761,0.711,0.654,0.828,0.507,ENFP,Paranoid (0.09),Narcissistic (0.087),Histrionic (0.073)
6,speaker_10_center_83.mov,0.698,0.599,0.572,0.675,0.351,ENFP,Narcissistic (0.106),Paranoid (0.105),Dependent (0.071)
7,speaker_24_center_83.mov,0.71,0.662,0.61,0.711,0.413,ENFP,Narcissistic (0.11),Paranoid (0.109),Dependent (0.074)
8,speaker_06_center_83.mov,0.687,0.659,0.612,0.75,0.421,ENFP,Narcissistic (0.114),Paranoid (0.112),Dependent (0.078)
9,speaker_23_center_83.mov,0.701,0.688,0.62,0.808,0.451,ENFP,Narcissistic (0.121),Paranoid (0.118),Dependent (0.084)
10,speaker_11_center_83.mov,0.718,0.599,0.573,0.732,0.38,ENFP,Narcissistic (0.115),Paranoid (0.113),Dependent (0.079)


### `MuPTA` (en)

In [74]:
import os
import pandas as pd

# Импорт модуля
from oceanai.modules.lab.build import Run

# Создание экземпляра класса
_b5 = Run()

corpus = 'fi'
lang = 'en'

# Настройка ядра
_b5.path_to_save_ = './models' # Директория для сохранения файла
_b5.chunk_size_ = 2000000      # Размер загрузки файла из сети за 1 шаг

# Формирование аудиомоделей
res_load_model_hc = _b5.load_audio_model_hc()
res_load_model_nn = _b5.load_audio_model_nn()

# Загрузка весов аудиомоделей
url = _b5.weights_for_big5_['audio'][corpus]['hc']['googledisk']
res_load_model_weights_hc = _b5.load_audio_model_weights_hc(url = url, force_reload = False)

url = _b5.weights_for_big5_['audio'][corpus]['nn']['googledisk']
res_load_model_weights_nn = _b5.load_audio_model_weights_nn(url = url, force_reload = False)

# Формирование видеомоделей
res_load_model_hc = _b5.load_video_model_hc(lang=lang)
res_load_model_deep_fe = _b5.load_video_model_deep_fe()
res_load_model_nn = _b5.load_video_model_nn()

# Загрузка весов видеомоделей
url = _b5.weights_for_big5_['video'][corpus]['hc']['googledisk']
res_load_model_weights_hc = _b5.load_video_model_weights_hc(url = url, force_reload = False)

url = _b5.weights_for_big5_['video'][corpus]['fe']['googledisk']
res_load_model_weights_deep_fe = _b5.load_video_model_weights_deep_fe(url = url, force_reload = False)

url = _b5.weights_for_big5_['video'][corpus]['nn']['googledisk']
res_load_model_weights_nn = _b5.load_video_model_weights_nn(url = url, force_reload = False)

# Загрузка словаря с экспертными признаками (текстовая модальность)
res_load_text_features = _b5.load_text_features()

# Формирование текстовых моделей 
res_setup_translation_model = _b5.setup_translation_model() # только для русского языка
res_setup_translation_model = _b5.setup_bert_encoder(force_reload = False)
res_load_text_model_hc_fi = _b5.load_text_model_hc(corpus=corpus)
res_load_text_model_nn_fi = _b5.load_text_model_nn(corpus=corpus)

# Загрузка весов текстовых моделей
url = _b5.weights_for_big5_['text'][corpus]['hc']['googledisk']
res_load_text_model_weights_hc_fi = _b5.load_text_model_weights_hc(url = url, force_reload = False)

url = _b5.weights_for_big5_['text'][corpus]['nn']['googledisk']
res_load_text_model_weights_nn_fi = _b5.load_text_model_weights_nn(url = url, force_reload = False)

# Формирование модели для мультимодального объединения информации
res_load_avt_model_b5 = _b5.load_avt_model_b5()

# Загрузка весов модели для мультимодального объединения информации
url = _b5.weights_for_big5_['avt'][corpus]['b5']['googledisk']
res_load_avt_model_weights_b5 = _b5.load_avt_model_weights_b5(url = url)

PATH_TO_DIR = './video_MuPTA/'
PATH_SAVE_VIDEO = './video_MuPTA/test/'

_b5.path_to_save_ = PATH_SAVE_VIDEO

# Загрузка 10 тестовых аудиовидеозаписей из корпуса MuPTA
# URL: https://hci.nw.ru/en/pages/mupta-corpus
domain = 'https://download.sberdisk.ru/download/file/'
tets_name_files = [
    '477995979?token=2cvyk7CS0mHx2MJ&filename=speaker_06_center_83.mov',
    '477995980?token=jGPtBPS69uzFU6Y&filename=speaker_01_center_83.mov',
    '477995967?token=zCaRbNB6ht5wMPq&filename=speaker_11_center_83.mov',
    '477995966?token=B1rbinDYRQKrI3T&filename=speaker_15_center_83.mov',
    '477995978?token=dEpVDtZg1EQiEQ9&filename=speaker_07_center_83.mov',
    '477995961?token=o1hVjw8G45q9L9Z&filename=speaker_19_center_83.mov',
    '477995964?token=5K220Aqf673VHPq&filename=speaker_23_center_83.mov',
    '477995965?token=v1LVD2KT1cU7Lpb&filename=speaker_24_center_83.mov',
    '477995962?token=tmaSGyyWLA6XCy9&filename=speaker_27_center_83.mov',
    '477995963?token=bTpo96qNDPcwGqb&filename=speaker_10_center_83.mov',
]

for curr_files in tets_name_files:
    _b5.download_file_from_url(url = domain + curr_files, out = True)

# Получение прогнозов
_b5.path_to_dataset_ = PATH_TO_DIR # Директория набора данных
_b5.ext_ = ['.mov'] # Расширения искомых файлов

# Полный путь к файлу с верными предсказаниями для подсчета точности
url_accuracy = _b5.true_traits_['mupta']['googledisk']

_b5.get_avt_predictions(url_accuracy = url_accuracy, lang = lang)

<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:21:39</span><span style="color:#666">]</span> <span style="color:#666">Извлечение признаков (экспертных и нейросетевых) из текста ...</span>** 

<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:21:40</span><span style="color:#666">]</span> <span style="color:#666">Получение прогнозов и вычисление точности (мультимодальное объединение) ...</span>**<p><span style="color:#666">&nbsp;&nbsp;&nbsp;&nbsp;10 из 10 (100.0%) ... kaggle/working/OCEANAI/video_MuPTA/test/speaker_11_center_83.mov ...</span></p>

Unnamed: 0_level_0,Path,Openness,Conscientiousness,Extraversion,Agreeableness,Non-Neuroticism
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1,speaker_01_center_83.mov,0.590114,0.540202,0.437401,0.5878,0.510256
2,speaker_15_center_83.mov,0.580967,0.560311,0.503614,0.600134,0.519449
3,speaker_07_center_83.mov,0.440438,0.465158,0.287292,0.425223,0.395389
4,speaker_19_center_83.mov,0.509879,0.446402,0.42639,0.451874,0.447009
5,speaker_27_center_83.mov,0.560265,0.665581,0.425382,0.58864,0.566939
6,speaker_10_center_83.mov,0.477925,0.502658,0.373761,0.441541,0.425135
7,speaker_24_center_83.mov,0.426992,0.510604,0.299171,0.432961,0.442596
8,speaker_06_center_83.mov,0.661469,0.675205,0.604212,0.646378,0.643688
9,speaker_23_center_83.mov,0.502359,0.544019,0.309871,0.445746,0.455199
10,speaker_11_center_83.mov,0.402578,0.343891,0.316861,0.421123,0.382922


<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:21:40</span><span style="color:#666">]</span> <span style="color:#666">Точность по отдельным персональным качествам личности человека ...</span>** 

Unnamed: 0_level_0,Openness,Conscientiousness,Extraversion,Agreeableness,Non-Neuroticism,Mean
Metrics,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
MAE,0.1643,0.1621,0.1768,0.2582,0.1099,0.1743
Accuracy,0.8357,0.8379,0.8232,0.7418,0.8901,0.8257


<span style="color:#666">**[</span><span style="color:#1776D2">2024-10-25 20:21:40</span><span style="color:#666">]</span> <span style="color:#666">Средняя средних абсолютных ошибок: <span style="color:#1776D2">0.1743</span>, средняя точность: <span style="color:#1776D2">0.8257</span> ...</span>** 

<span style="color:#008001">**Лог файлы успешно сохранены ...**</span>

<span style="color:#666">**--- Время выполнения: 551.022 сек. ---**</span>

True

<hr>

Для поиска подходящего коллеги по работе необходимо знать по два коэффициента корреляции для каждого персонального качества личности человека. Эти коэффициенты должны показывать, как изменится оценка качества одного человека, если она будет больше или меньше оценки качества другого человека.

В качестве примера предлагается использование коэффициентов корреляции между двумя людьми в контексте отношений "начальник-подчиненный", представленных в статье:

1) Kuroda S., Yamamoto I. Good boss, bad boss, workers’ mental health and productivity: Evidence from Japan // Japan & The World Economy. – 2018. – vol. 48. – pp. 106-118.

Пользователь может установить свои коэффициенты корреляции

In [75]:
# Загрузка датафрейма с коэффициентами корреляции
url = 'https://download.sberdisk.ru/download/file/478675819?token=LuB7L1QsEY0UuSs&filename=colleague_ranking.csv'
df_correlation_coefficients = pd.read_csv(url)
df_correlation_coefficients = pd.DataFrame(
    df_correlation_coefficients.drop(['ID'], axis = 1)
)

df_correlation_coefficients.index.name = 'ID'
df_correlation_coefficients.index += 1
df_correlation_coefficients.index = df_correlation_coefficients.index.map(str)

df_correlation_coefficients

Unnamed: 0_level_0,Score_comparison,Openness,Conscientiousness,Extraversion,Agreeableness,Non-Neuroticism
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
1,higher,-0.0602,0.0471,-0.107,-0.0832,0.19
2,lower,-0.172,-0.105,0.0772,0.0703,-0.229


#### Поиск старшего коллеги

In [76]:
# Список оценок персональных качеств личности целевого человека
target_scores = [0.527886, 0.522337, 0.458468, 0.51761, 0.444649]

_b5._colleague_ranking(
    correlation_coefficients = df_correlation_coefficients,
    target_scores = target_scores,
    colleague = 'major',
    equal_coefficients = 0.5,
    out = False
)

_b5._save_logs(df = _b5.df_files_colleague_, name = 'major_colleague_ranking_mupta_en', out = True)

# Опционно
df = _b5.df_files_colleague_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,Match
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
5,speaker_27_center_83.mov,0.56,0.666,0.425,0.589,0.567,0.089
9,speaker_23_center_83.mov,0.502,0.544,0.31,0.446,0.455,0.081
1,speaker_01_center_83.mov,0.59,0.54,0.437,0.588,0.51,0.072
4,speaker_19_center_83.mov,0.51,0.446,0.426,0.452,0.447,0.015
8,speaker_06_center_83.mov,0.661,0.675,0.604,0.646,0.644,-0.004
2,speaker_15_center_83.mov,0.581,0.56,0.504,0.6,0.519,-0.014
10,speaker_11_center_83.mov,0.403,0.344,0.317,0.421,0.383,-0.139
3,speaker_07_center_83.mov,0.44,0.465,0.287,0.425,0.395,-0.163
6,speaker_10_center_83.mov,0.478,0.503,0.374,0.442,0.425,-0.172
7,speaker_24_center_83.mov,0.427,0.511,0.299,0.433,0.443,-0.175


#### Поиск младшего коллеги

In [77]:
# Список оценок персональных качеств личности целевого человека
target_scores = [0.527886, 0.522337, 0.458468, 0.51761, 0.444649]

_b5._colleague_ranking(
    correlation_coefficients = df_correlation_coefficients,
    target_scores = target_scores,
    colleague = 'minor',
    equal_coefficients = 0.5,
    out = False
)

_b5._save_logs(df = _b5.df_files_colleague_, name = 'minor_colleague_ranking_mupta_en', out = True)

# Опционно
df = _b5.df_files_colleague_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,Match
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
7,speaker_24_center_83.mov,0.427,0.511,0.299,0.433,0.443,0.014
3,speaker_07_center_83.mov,0.44,0.465,0.287,0.425,0.395,0.004
6,speaker_10_center_83.mov,0.478,0.503,0.374,0.442,0.425,-0.001
10,speaker_11_center_83.mov,0.403,0.344,0.317,0.421,0.383,-0.004
4,speaker_19_center_83.mov,0.51,0.446,0.426,0.452,0.447,-0.195
2,speaker_15_center_83.mov,0.581,0.56,0.504,0.6,0.519,-0.197
8,speaker_06_center_83.mov,0.661,0.675,0.604,0.646,0.644,-0.24
9,speaker_23_center_83.mov,0.502,0.544,0.31,0.446,0.455,-0.262
1,speaker_01_center_83.mov,0.59,0.54,0.437,0.588,0.51,-0.281
5,speaker_27_center_83.mov,0.56,0.666,0.425,0.589,0.567,-0.3


<hr>

Для поиска подходящего коллеги по типу личности MBTI необходимо знать коэффициенты корреляции между личностными качествами человека и типами личности MBTI, а также оценки этих качеств для целевого человека.

В качестве примера предлагается использование коэффициентов корреляции, представленных в статье:

1) Furnham A. The big five facets and the MBTI: The relationship between the 30 NEO-PI (R) Facets and the four Myers-Briggs Type Indicator (MBTI) scores // Psychology. - 2022. vol. 13(10). - pp. 1504-1516.

Пользователь может установить свои коэффициенты корреляции

In [78]:
# Загрузка датафрейма с коэффициентами корреляции
url = 'https://download.sberdisk.ru/download/file/493644095?token=EX7hFxNJhMoLumI&filename=df_mbti_correlation.csv'
df_correlation_coefficients = pd.read_csv(url)

df_correlation_coefficients.index.name = 'ID'
df_correlation_coefficients.index += 1
df_correlation_coefficients.index = df_correlation_coefficients.index.map(str)

df_correlation_coefficients

Unnamed: 0_level_0,Trait,EI,SN,TF,JP
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
1,Openness,0.09,-0.03,-0.14,-0.16
2,Conscientiousness,0.04,-0.04,0.2,0.14
3,Extraversion,0.2,-0.03,0.01,-0.07
4,Agreeableness,0.02,0.05,-0.35,0.03
5,Non-Neuroticism,0.08,0.0,0.16,0.0


In [79]:
_b5._colleague_personality_type_match(
    correlation_coefficients = df_correlation_coefficients,
    target_scores = [0.34, 0.56, 0.42, 0.57, 0.56],
    threshold = 0.5,
    out = False
)

_b5._save_logs(df = _b5.df_files_MBTI_colleague_match_, name = 'MBTI_colleague_personality_type_match_en', out = True)

# Optional
df = _b5.df_files_MBTI_colleague_match_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:6]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,EI,SN,TF,JP,MBTI,Match
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1
10,speaker_11_center_83.mov,0.403,0.344,0.317,0.421,0.383,-0.152416,0.014283,0.07054,0.025814,ISTJ,100.0
3,speaker_07_center_83.mov,0.44,0.465,0.287,0.425,0.395,-0.15584,0.019177,0.051323,0.012702,ISTJ,100.0
9,speaker_23_center_83.mov,0.502,0.544,0.31,0.446,0.455,-0.040332,-0.049823,0.118554,0.004104,INTJ,75.0
6,speaker_10_center_83.mov,0.478,0.503,0.374,0.442,0.425,-0.140501,-0.016633,0.250221,0.159757,INTJ,75.0
7,speaker_24_center_83.mov,0.427,0.511,0.299,0.433,0.443,-0.121906,-0.020287,0.239629,0.147756,INTJ,75.0
1,speaker_01_center_83.mov,0.59,0.54,0.437,0.588,0.51,0.039815,0.003201,-0.103039,0.029462,ESFJ,50.0
5,speaker_27_center_83.mov,0.56,0.666,0.425,0.589,0.567,0.049099,-0.001238,-0.064888,0.050975,ENFJ,25.0
4,speaker_19_center_83.mov,0.51,0.446,0.426,0.452,0.447,-0.102043,-0.007242,-0.078293,-0.127786,INFP,25.0
2,speaker_15_center_83.mov,0.581,0.56,0.504,0.6,0.519,0.228981,-0.024943,-0.091172,-0.03176,ENFP,0.0
8,speaker_06_center_83.mov,0.661,0.675,0.604,0.646,0.644,0.271805,-0.03266,-0.074765,-0.03421,ENFP,0.0


<hr>

Для определения степени выраженности персональных растройств необходимо знать коэффициенты корреляции между персональными качествами личности человека и типами личности MBTI, а также кооэффициенты корреляции между типами личности MBTI и персональными растройствами.

В качестве примера предлагается использование коэффициентов корреляции между персональными качествами личности человека и типами личности MBTI, представленных в статье [1] и кооэффициентов корреляции между типами личности MBTI и персональными растройствами [2].

1) Furnham A. The big five facets and the MBTI: The relationship between the 30 NEO-PI (R) Facets and the four Myers-Briggs Type Indicator (MBTI) scores // Psychology. - 2022. vol. 13(10). - pp. 1504-1516.
2) Furnham A. MBTI and aberrant personality traits: dark-side trait correlates of the Myers Briggs type inventory // Psychology. - 2022. - vol. 13(5). - pp 805-815.

Среди персональных расстройста рассматриваются следующие:
1) Параноидное (Paranoid) — Недоверие и подозрительность по отношению к другим; мотивы интерпретируются как злонамеренные.
2) Шизоидное (Schizoid) — Эмоциональная холодность и отстранённость от социальных отношений; безразличие к похвалам и критике.
3) Шизотипическое (Schizotypal) — Странные убеждения или магическое мышление; поведение или речь, которые кажутся странными, эксцентричными или необычными.
4) Антисоциальное (Antisocial) — Пренебрежение к истине; импульсивность и неспособность планировать будущее; нарушение социальных норм.
5) Пограничное (Borderline) — Неуместная злость; нестабильные и интенсивные отношения, которые чередуются между идеализацией и обесцениванием.
6) Истерическое (Histrionic) — Чрезмерная эмоциональность и стремление к вниманию; драматизация, театральное поведение и преувеличенное выражение эмоций.
7) Нарциссическое (Narcissistic) — Высокомерные и надменные манеры или установки, преувеличенное чувство собственной значимости и права на особое отношение.
8) Избегающее (Avoidant) — Социальное избегание; чувство неполноценности и повышенная чувствительность к критике или отказу.
9) Зависимое (Dependent) — Трудности в принятии повседневных решений без чрезмерных советов и уверений; трудности в выражении несогласия из-за страха потери поддержки или одобрения.
10) Обсессивно-компульсивное личностное расстройство (OCPD) — Чрезмерная озабоченность порядком, перфекционизмом, контролем и деталями; стремление к соблюдению правил, часто в ущерб гибкости и эффективности.


Пользователь может установить свои коэффициенты корреляции

In [80]:
url = 'https://download.sberdisk.ru/download/file/493644095?token=EX7hFxNJhMoLumI&filename=df_mbti_correlation.csv'
df_correlation_coefficients_mbti = pd.read_csv(url)

df_correlation_coefficients_mbti.index.name = 'ID'
df_correlation_coefficients_mbti.index += 1
df_correlation_coefficients_mbti.index = df_correlation_coefficients_mbti.index.map(str)

url = 'https://download.sberdisk.ru/download/file/493644096?token=T309xfzRosPj3v9&filename=df_disorder_correlation.csv'
df_correlation_coefficients_disorders = pd.read_csv(url)

df_correlation_coefficients_disorders.index.name = 'ID'
df_correlation_coefficients_disorders.index += 1
df_correlation_coefficients_disorders.index = df_correlation_coefficients_disorders.index.map(str)

In [81]:
_b5._colleague_personality_desorders(
    correlation_coefficients_mbti = df_correlation_coefficients_mbti,
    correlation_coefficients_disorders = df_correlation_coefficients_disorders,
    personality_desorder_number = 3,
    threshold = 0.5,
    out = True
)

_b5._save_logs(df = _b5.df_files_MBTI_disorders_, name = 'MBTI_colleague_personality_type_match_fi_en', out = True)

# Optional
df = _b5.df_files_MBTI_disorders_.rename(columns = {'Openness':'OPE', 'Conscientiousness':'CON', 'Extraversion': 'EXT', 'Agreeableness': 'AGR', 'Non-Neuroticism': 'NNEU'})
columns_to_round = df.columns[1:6]
df[columns_to_round] = df[columns_to_round].apply(lambda x: [round(i, 3) for i in x])
df

Unnamed: 0_level_0,Path,OPE,CON,EXT,AGR,NNEU,MBTI,Disorder 1,Disorder 2,Disorder 3
Person ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1
1,speaker_01_center_83.mov,0.59,0.54,0.437,0.588,0.51,ESFJ,Narcissistic (0.037),Paranoid (0.036),Dependent (0.03)
2,speaker_15_center_83.mov,0.581,0.56,0.504,0.6,0.519,ENFP,Paranoid (0.06),Narcissistic (0.057),Histrionic (0.054)
3,speaker_07_center_83.mov,0.44,0.465,0.287,0.425,0.395,ISTJ,Schizoid (0.033),Avoidant (0.019),Dependent (0.009)
4,speaker_19_center_83.mov,0.51,0.446,0.426,0.452,0.447,INFP,Schizoid (0.036),Avoidant (0.036),Narcissistic (0.029)
5,speaker_27_center_83.mov,0.56,0.666,0.425,0.589,0.567,ENFJ,Narcissistic (0.026),Paranoid (0.026),Dependent (0.021)
6,speaker_10_center_83.mov,0.478,0.503,0.374,0.442,0.425,INTJ,Schizoid (0.03),OCPD (0.021),Avoidant (0.017)
7,speaker_24_center_83.mov,0.427,0.511,0.299,0.433,0.443,INTJ,Schizoid (0.026),OCPD (0.02),Avoidant (0.015)
8,speaker_06_center_83.mov,0.661,0.675,0.604,0.646,0.644,ENFP,Paranoid (0.061),Histrionic (0.06),Narcissistic (0.057)
9,speaker_23_center_83.mov,0.502,0.544,0.31,0.446,0.455,INTJ,OCPD (0.012),Schizoid (0.01),Avoidant (0.006)
10,speaker_11_center_83.mov,0.403,0.344,0.317,0.421,0.383,ISTJ,Schizoid (0.032),Avoidant (0.018),Dependent (0.01)
