In [1]:
!pip install dash
!pip install dash-html-components
!pip install dash-core-components
!pip install dash-table



In [2]:
!pip install pandas
!pip install numpy



In [28]:
import functools
import operator

from typing import *

import pprint
import collections

import json

In [29]:
_deltas_df: pd.DataFrame = pd.\
        read_csv('./termwise_prnd_deltas.csv', dtype=np.int32).\
        sort_index().\
        to_numpy()
# g_deltas = _deltas_df[_g_deltas_df]
g_deltas = _deltas_df[:, 1:]
g_deltas_l_index = _deltas_df[:, 0]

def get_delta_rows(
    a_l: IText,
    a_delta_source: IDeltaSource = None
) -> np.ndarray:
    """
    Возвращает словарь numpy-массивов со значениями дельт заданного текста a_l.
    Ключ -- номер текста. Дельта термина номер i лежит на i-й позиции массива.
    
    Если a_delta_source не равно None -- просто возвращает сам a_delta_source.
    """
    
    if isinstance(a_l, int):
        a_l = [a_l]
    elif not isinstance(a_l, collections.abc.Iterable):
        raise ValueError(f'В качестве a_l передано не int и не итерируемое: {a_l}')
    
    if a_delta_source is not None:
        return a_delta_source
    
    return {l: g_deltas[np.searchsorted(g_deltas_l_index, l)] for l in a_l}

In [30]:
import pandas as pd
import numpy as np

In [31]:
# Множество номеров текстов:
IText = Union[int, Iterable[int]]

# Множество номеров терминов:
ITermId = Union[int, Iterable[int]]

# Словарь для предрасчитанных строк из g_deltas. Ключ -- номер текста.
# Если None -- будет использована функция get_delta_row():
IDeltaSource = Optional[Dict[int, np.ndarray]]

# Словарь для набора множеств из множеств номеров терминов.
# См. terms_view(...):
IThesaurusView = Dict[Any, Iterable[int]]

In [32]:
import dash
import pandas as pd
from dash import dcc, html, Input, Output, callback

external_stylesheets = ['https://codepen.io/chriddyp/pen/bWLwgP.css']

app = dash.Dash(__name__, external_stylesheets=external_stylesheets)

def combine_names(row):
    return f"{row['Фамилия']} {row['Имя']} {row['Отчество']}"

g_persons_df = pd.read_csv('./db_persons.csv')[['ID', 'Фамилия', 'Имя', 'Отчество']]
g_persons_df['ФИО'] = g_persons_df.apply(combine_names, axis=1)
gpersons = g_persons_df[['ФИО', 'ID']]
gpersons.columns = ['label', 'value']
gpersons = gpersons.to_dict(orient='records')

app.layout = html.Div([
    html.Label('Выберите автора'),
    dcc.Dropdown(
        options=gpersons,
        placeholder="Выберите автора",
        id='author',
    ),
    html.Div(id='selected-author'),  # Для вывода выбранного значения
    dcc.Dropdown(id='works-dropdown', 
                 multi=True,
                 optionHeight=40),  # Для списка "Работы"
    html.Div(id='selected-pub'),  # Для вывода выбранного значения
], style={'columnCount': 1})

# Глобальная переменная для хранения значения автора
selected_author_value = None

# Функция обратного вызова для обновления выбранного автора
@app.callback(
    Output('selected-author', 'children'),
    Input('author', 'value')
)
def update_selected_author(selected_value):
    global selected_author_value
    selected_author_value = selected_value
    
    if selected_value is None:
        return "Выберите автора"
    else:
        return f"Выбран автор: {selected_value}"



# Глобальная переменная для хранения значения автора
selected_pub_value = []


@app.callback(
    Output('works-dropdown', 'options', allow_duplicate=True),
    Output('works-dropdown', 'value', allow_duplicate=True),
    Output('selected-pub', 'children'),
    Input('works-dropdown', 'value'),
    prevent_initial_call=True
)
def update_selected_pub(selected_value):
    global selected_author_value
    global selected_pub_value

    selected_pub_value = selected_value
    if selected_value is None:
        return [], [], []
    if selected_value.count('Все работы'):
        return [{'label': "Все работы", 'value': 'Все работы'}], ['Все работы'], ['Все работы']
    else:
        all_options = update_works_dropdown(selected_author_value)
        return all_options[0], selected_value, selected_pub_value


# Функция обратного вызова для обновления списка "Работы"
@app.callback(
    Output('works-dropdown', 'options'),
    Output('works-dropdown', 'value'),
    Input('author', 'value'),
)
def update_works_dropdown(selected_value):
    
    if selected_value is None:
        return [], []

    # Загрузка данных из файла "data_from_json_files.csv"
    data_df = pd.read_csv('./data_from_json_files.csv')

    # Преобразование выбранного ID автора в строку
    selected_value_str = str(selected_value)

    # Разделение значения "Авторы" на список ID авторов
    data_df['Авторы'] = data_df['Авторы'].apply(lambda x: [] if pd.isna(x) else x.split(', '))

    # Фильтрация строк, в которых в списке ID авторов есть выбранный автор
    works = data_df[data_df['Авторы'].apply(lambda x: selected_value_str in x)]

    works_data = works[['Название', 'ID']].drop_duplicates(subset=['ID'])
    # Обрезаем названия работ до первых 15 символов
    works_data['Название'] = works_data['Название'].str[:200]
    
    works_data.columns = ['label', 'value']
    works_data = works_data.to_dict(orient='records')
    #print(works_data)
    works_data.insert(0, {'label': "Все работы", 'value': 'Все работы'})
    return works_data, []



if __name__ == '__main__':
    app.run_server(debug=True)


In [33]:
_deltas_df

array([[  853,     0,     0, ...,     0,     0,     0],
       [  911,     0,     0, ...,     0,     0,     0],
       [  927,     0,     0, ...,     0,     0,     0],
       ...,
       [72691,     0,     0, ...,     0,     0,     0],
       [72698,     0,     0, ...,     0,     0,     0],
       [72701,     0,     0, ...,     0,     0,     0]])

In [50]:
#global selected_pub_value
term_dict_array = []

for i in selected_pub_value:
    for j in _deltas_df:
        if j[0] == i:
            term_dict = {}
            for k in range(1, len(j)):
                if j[k] != 0:
                    term_dict[k-1] = j[k]
                    print(i, k-1, j[k])
            term_dict_array.append(term_dict)
print(term_dict_array)

68131 8 2
68131 15 1
68131 34 4
68131 51 1
68131 98 1
68131 107 1
68131 120 1
68131 139 1
68131 143 1
68131 148 1
72573 8 5
72573 15 1
72573 17 1
72573 18 1
72573 21 1
72573 34 5
72573 46 2
72573 54 1
72573 76 1
72573 84 1
72573 97 1
72573 98 3
72573 101 1
72573 102 2
72573 106 1
72573 114 2
72573 128 5
72573 134 1
72573 138 2
72573 141 1
72573 148 8
72573 159 4
72573 165 1
72573 178 2
72573 180 1
72573 195 1
72573 578 1
72573 2486 1
[{8: 2, 15: 1, 34: 4, 51: 1, 98: 1, 107: 1, 120: 1, 139: 1, 143: 1, 148: 1}, {8: 5, 15: 1, 17: 1, 18: 1, 21: 1, 34: 5, 46: 2, 54: 1, 76: 1, 84: 1, 97: 1, 98: 3, 101: 1, 102: 2, 106: 1, 114: 2, 128: 5, 134: 1, 138: 2, 141: 1, 148: 8, 159: 4, 165: 1, 178: 2, 180: 1, 195: 1, 578: 1, 2486: 1}]


In [114]:
def find_areas_by_term_dicts(data, term_dicts_list):
    def traverse_hierarchy(node, term_id):
        if 'terms' in node and str(term_id) in node['terms']:
            return [area for area in node['terms'][str(term_id)]]
        for area, children in node['children'].items():
            child_areas = traverse_hierarchy(children, term_id)
            if child_areas:
                return [area] + child_areas
        return []
    
    areas_dict = {}
    for term_dict in term_dicts_list:
        for term_id, _ in term_dict.items():
            term_areas = traverse_hierarchy(data['thesaurus'], term_id)
            areas_dict[term_id] = term_areas
    return areas_dict

# Ваши входные данные
hierarchy_data = json.load(open('./terms.json', 'r'))

term_dicts_list = term_dict_array

areas_dict = find_areas_by_term_dicts(hierarchy_data, term_dicts_list)

for term_id, term_areas in areas_dict.items():
    areas_str = ", ".join(term_areas)
    print(f"Термин с id {term_id} относится к научным областям: {areas_str}")


Термин с id 8 относится к научным областям: 
Термин с id 15 относится к научным областям: 
Термин с id 34 относится к научным областям: 
Термин с id 51 относится к научным областям: 
Термин с id 98 относится к научным областям: 
Термин с id 107 относится к научным областям: 
Термин с id 120 относится к научным областям: 
Термин с id 139 относится к научным областям: 
Термин с id 143 относится к научным областям: 
Термин с id 148 относится к научным областям: 
Термин с id 17 относится к научным областям: 
Термин с id 18 относится к научным областям: 
Термин с id 21 относится к научным областям: 
Термин с id 46 относится к научным областям: 
Термин с id 54 относится к научным областям: 
Термин с id 76 относится к научным областям: 
Термин с id 84 относится к научным областям: 
Термин с id 97 относится к научным областям: 
Термин с id 101 относится к научным областям: 
Термин с id 102 относится к научным областям: 
Термин с id 106 относится к научным областям: 
Термин с id 114 относится к

In [14]:
g_ultimate_term_json = json.load(open('./terms.json', 'r'))
g_term_to_words = {int(i): g_ultimate_term_json['term_to_words'][i] for i in g_ultimate_term_json['term_to_words']}
g_term_to_lemmas = {int(i): g_ultimate_term_json['term_to_lemma'][i] for i in g_ultimate_term_json['term_to_lemma']}
g_thesaurus = g_ultimate_term_json['thesaurus']

In [15]:
# Пример использования:
g_thesaurus['children']['Математический аппарат']['children']['Алгебра и теория чисел']['children']['Алгебраическая геометрия']['terms'], g_term_to_words[238], g_term_to_lemmas[238]

([262, 263, 264, 265, 266, 267, 268, 269, 270, 271, 272],
 ['представления', 'групп', 'Ли'],
 ['представление', 'группа', 'ли'])

In [16]:
def get_term_words(a_term: int) -> str:
    res = ''
    words = g_term_to_words[a_term]
    for word in words:
        res += word + ' ' 
    return res.strip()

In [17]:
# g_pubs_df = pd.read_csv('./persons/db_pubs.csv').set_index('ID').sort_index()
# g_pubs_df
g_pubs_df = pd.read_csv('./data_from_json_files.csv').\
        set_index('ID').\
        drop('Unnamed: 0', axis=1).\
        sort_index()
# 'Unnamed: 0' -- точно не ID публикации
g_pubs_df = g_pubs_df[~g_pubs_df.index.duplicated(keep='first')]
g_pubs_df

Unnamed: 0_level_0,reference,year,kind,Unnamed: 5,Авторы,Год издания,Название,Наименование источника,DOI,ISBN/ISSN,Город,Наименование конференции,Обозначение и номер тома,"Объём, стр.","Публикация имеет версию на другом языке или вышла в другом издании, например, в электронной (или онлайн) версии журнала",Сведения об издании,Связь с публикацией,Страницы,Электронная публикация
ID,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
844,"Корсун В.Ф., Тертышный Г.Г. Методы и средства ...",2005,Доклад,Рассматриваются методы и средства волнового фи...,"10493, 717",2005,Методы и средства волнового фитоуправления в б...,,,,-,Управление и информационные технологии,,,,,,-,
845,"Солонин М.С., Уткин В.А. Метод динамической ко...",2005,Доклад,В докладе рассматривается задача стабилизации ...,"10595, 751",2005,Метод динамической компенсации в задаче оценив...,,,,-,Управление и информационные технологии,,,,,,-,
846,"Краснова С.А., Кузнецов С.И., Уткин А.В. Управ...",2005,Доклад,Рассматривается задача управления угловым поло...,"383, 10594, 750",2005,Управление электромеханическими системами в ус...,,,,-,Управление и информационные технологии,,,,,,-,
847,"Rivera Domínguez J., Лукьянов А.Г., Castillo T...",2005,Доклад,The paper focuses on the design of an error fe...,"10596, 10590, 10597, 751",2005,VSS Error Feedback Regulation for Linear Systems,,,,-,IFAC World Congresses,,,,,,-,
848,"Кузнецов С.И., Сиротина Т.Г., Уткин В.А. Задач...",2005,Тезисы доклада,Предложена декомпозиционная процедура синтеза ...,"10594, 664, 751",2005,Задача стабилизации линейных систем с сигмоида...,,,,-,Системы управления эволюцией организации,,,,,,-,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
72933,"Широкий А.А., Калашников А.О. Influence of the...",2023,Статья в журнале/сборнике,This paper is devoted to studying the influenc...,"47161, 9742",2023,Influence of the Internal Structure on the Int...,Mathematics,10.3390/math11040998,2227-7390,"Basel, Switzerland",,"Т. 11, вып. 4",,,,,https://www.mdpi.com/2227-7390/11/4/998,Да
72940,"Воеводин А.В., Корняков А.А., Петров А.С., Пет...",2021,Статья в журнале/сборнике,A problem of the flow around a rectangular win...,"72903, 72906, 72904, 70957, 72905",2021,Wing buffet control by using an ejector-type d...,Journal of Applied Mechanics and Technical Phy...,10.1134/S0021894421020152,0021-8944,Zhukovsky,,"Т. 62, №2",,Да,,"<a href=""/node/72910"">72910</a>",308–316,
72941,"Жарко Е.Ф., Чернышев К.Р. Digital Twins: Forec...",2023,Доклад,"Industries, especially in the energy sector, a...","256, 794",2023,Digital Twins: Forecasting and Formation of Op...,Proceedings of the 2023 International Russian ...,10.1109/SmartIndustryCon57312.2023.10110766,978-1-6654-6429-1,Piscataway,2023 International Russian Smart Industry Conf...,,,,,,"158-163, https://ieeexplore.ieee.org/document/...",Да
72952,"Девятков Т.В., Девятков В.В., Габалин А.В. При...",2023,Статья в журнале/сборнике,В статье анализируются вопросы применения ими...,"26687, 15276, 166",2023,Применение имитационного моделирования при опе...,Проблемы информатики,10.37791/2687-0649-2023-18-2,N 2687-0649,Москва,,Том 18. №2. 2023,,,,,60-72,


[{'label': 'Сравнительный анализ устойчивости различных методов оценивания параметров билинейной авторегрессионной модели', 'value': 71950}]
