In [1]:
import pandas as pd
import xml.etree.ElementTree as ET
from io import StringIO
import json

In [2]:
from hse3_files.converter import xml_to_json
from hse3_files.parser_fucn import find_section_by_optimized_path
from hse3_files.parser_sex_age import get_sex, get_age
from hse3_files.parser_gospital import get_gosp_info
from hse3_files.parser_amnez_disease import get_amnez_d
from hse3_files.parser_condition import get_condition
from hse3_files.parser_diagn import get_diagnosis
from hse3_files.parses_amnez_life import get_amnez_life
from hse3_files.parser_wards import get_ward_table

In [3]:
%load_ext autoreload
%autoreload 2


In [4]:
def xml_to_json(xml_file_path, json_file_path):
    # Read XML data from file
    with open(xml_file_path, 'r', encoding='utf-8') as file:
        xml_data = file.read()

    # Parse the XML data
    root = ET.fromstring(xml_data)
    
    # Function to convert the parsed XML element into a Python dictionary
    def elem_to_dict(elem):
        d = {}
        for child in elem:
            if child.tag not in d:
                d[child.tag] = elem_to_dict(child)
            else:
                if not isinstance(d[child.tag], list):
                    d[child.tag] = [d[child.tag]]
                d[child.tag].append(elem_to_dict(child))
        d.update({k: v for k, v in elem.attrib.items()})
        if elem.text and elem.text.strip():
            d['text'] = elem.text.strip()
        else:
            d.pop('text', None)  # Remove empty text fields
        return d
    
    # Convert the root element to a dictionary and save to JSON file
    with open(json_file_path, 'w', encoding='utf-8') as json_file:
        json_data = elem_to_dict(root)
        json.dump(json_data, json_file, ensure_ascii=False, indent=4)

In [41]:
path_xml = '../data/test_1.xml'
path_json = '../data/test_1.json'

In [42]:
xml_to_json(path_xml, path_json)

In [43]:
with open(path_json, 'r', encoding='utf-8') as file:
    data = json.load(file)

In [44]:
get_sex(data)

'Мужской'

In [45]:
get_age(data)

'19601212'

In [46]:
a, b, c = get_gosp_info(data)

In [47]:
a

Unnamed: 0,Вид нозологической единицы,Врачебное описание нозологической единицы,Код по МКБ-10
0,Основное заболевание,ИБС. Впервые возникшая стенокардия.,I20.0
1,Основное заболевание,ИБС. Впервые возникшая стенокардия.,I20.0
2,Осложнение основного заболевания,ОСН 1 по Killip.,I50.1
3,Сопутствующее заболевание,Дегенеративный порок. Аортальный стеноз 2 степ...,I35.2
4,Сопутствующее заболевание,Перенесенное ОНМК по ишемическому типу в ВБС в...,I69.4
5,Сопутствующее заболевание,Сахарный диабет 2 типа. Целевой уровень гликог...,E11.8
6,Сопутствующее заболевание,Ожирение 1 степени. (ИМТ 34 кг/м2).,E66.9
7,Фоновое заболевание,Гипертоническая болезнь III стадии. Контролиру...,I11.9


In [48]:
b

'Первичный'

In [49]:
c

'Доставлен бригадой скорой помощи'

In [50]:
get_amnez_d(data)

'Больным себя считает с 20.00 30.12.22г, когда в покое и при минимальной ФН начал отмечать давящие боли за грудиной, длительностью до 15-20 минут, с иррадиацией в обе руки. Принял 1 дозу НТГ, с положительным эффектом. В связи с рецидивированием болей, вызвал бСМП, доставлен в ПО ОКД. \nПринимает конкор, физиотенз, фелодип, аторвастатин, варфарин, юперио, аторвастатин, форсигу.  \nПовышение АД много лет. Максимальное АД 240/мм.рт.ст. Медикаментозно достигнутое АД 130-140/мм.рт.ст. (регулярно принимает гипотензивные препараты)\nСахарный диабет 2 типа (постоянно принимает галвус, метформин )\nПеренесенное ОНМК по ишемическому типу в ВБС в 2015г.\nОИМ, БА, ЯБ ЖКТ отрицает.\nПроведен тромболизис догоспитально нет \nЭпидемиологический анамнез:\nСо слов пациента, с больными корью не контактировал(а)., В течение последнего месяца за территорию РФ не выезжал (а). Со слов пациента, с больным &quot;оспой обезьян&quot; не контактировал (а). \nБолел ранее COVID-19  да   2021г \nВакцинация от COVID-

In [51]:
get_diagnosis(data)

Unnamed: 0,Вид нозологической единицы,Врачебное описание нозологической единицы,Код по МКБ-10
0,Основное заболевание,ИБС. Впервые возникшая стенокардия.,I20.0
1,Основное заболевание,ИБС. Впервые возникшая стенокардия.,I20.0
2,Осложнение основного заболевания,ОСН 1 по Killip.,I50.1
3,Сопутствующее заболевание,Дегенеративный порок. Аортальный стеноз 2 степ...,I35.2
4,Сопутствующее заболевание,Перенесенное ОНМК по ишемическому типу в ВБС в...,I69.4
5,Сопутствующее заболевание,Сахарный диабет 2 типа. Целевой уровень гликог...,E11.8
6,Сопутствующее заболевание,Ожирение 1 степени. (ИМТ 34 кг/м2).,E66.9
7,Фоновое заболевание,Гипертоническая болезнь III стадии. Контролиру...,I11.9


ячейка снизу отработала правильно - в самом файле такое значение

In [52]:
get_amnez_life(data)

'Б'

In [53]:
get_condition(data)

['Состояние: Средней тяжести',
 'Жалобы: на давящие боли за грудиной в покое и при минимальной ФН, длительностью до 15-20 минут, с иррадиацией в обе руки. На момент осмотра боли отрицает.',
 'Объективный статус: \nСтепень тяжести Средней тяжести Сознание: ясное \nТелосложение гиперстеник Питание: избыточное \n РОСТ  175  ВЕС  105  ИМТ 34\nКожные покровы: физиологической окраски нормальной влажности \nТ-ра тела 36,5С, зев чистый, не гиперемирован.\nЛимфоузлы: не увеличены \nОпорно-двигательный аппарат: без патологии; Нижние конечности: физиологической окраски  не гиперемированы на ощупь теплые пульсация отчетливая при пальпации безболезненны \nДыхание: везикулярное Хрипы: не выслушиваются ЧДД 17 в мин spO2 -98%\nПеркуссия легких: при сравнительной перкуссии легкий над всей поверхностью легочных полей определяется ясный легочный звук.\nОбласть сердца и крупных сосудов не изменена \nДругие пульсации в области сердца: нет.\nВерхушечный толчок  не уширен в V межреберье кнутри от СКЛ на 2 см