In [1]:
import numpy as np
import pandas as pd
import csv
import random

# Здесь представлены все возможные симптомы при собачьих болезнях, которые представлены в этой модели

In [2]:
all_symptoms = [
    "высокая температура",
    "выраженная депрессия",
    "вялость",
    "мышечная дрожь",
    "галлюцинации",
    "пугливость",
    "агрессивность",
    "стремление бежать",
    "поражение ЦНС",
    "судороги",
    "эпилептические припадки",
    "паралич мышц",
    "нарушение координации",
    "серозно-слизистые, а затем гнойные истечения из носа",
    "серозно-слизистые, а затем гнойные истечения из глаз",
    "конъюнктивит",
    "помутнение зрения",
    "пустулезная сыпь",
    "приступы рвоты",
    "затруднение глотания",
    "извращенный аппетит",
    "тошнота, рвота с примесью крови",
    "обезвоживание",
    "проблемы с ЖКТ",
    "отказ от пищи",
    "обильное слюнотечение",
    "поражение респираторной системы",
    "анорексия",
    "постоянный плач",
    "сильный зуд и расчёсы",
]

# Здесь указаны болезни их симптомы с вероятностями. В любой болезни есть обязательные симптомы и необязательные

In [3]:
diseases = {
    "Инфекционный гепатит собак": {
        "мышечная дрожь": 1.0,
        "конъюнктивит": 1.0,
        "поражение респираторной системы": 1.0,
        "высокая температура": 0.6,
        "проблемы с ЖКТ": 0.7,
    },
    "Чума плотоядных": {
        "эпилептические припадки": 1.0,
        "нарушение координации": 1.0,
        "высокая температура": 0.6,
        "выраженная депрессия": 0.8,
        "вялость": 0.8,
        "мышечная дрожь": 0.7,
        "пугливость": 0.8,
        "серозно-слизистые, а затем гнойные истечения из носа": 0.9,
        "серозно-слизистые, а затем гнойные истечения из глаз": 0.9,
        "пустулезная сыпь": 0.85,
        "приступы рвоты": 0.8,
        "проблемы с ЖКТ": 0.7,
    },
    "Семейство парвовирусов": {
        "тошнота, рвота с примесью крови": 1.0,
        "обезвоживание": 1.0,
        "высокая температура": 0.6,
        "вялость": 0.8,
        "проблемы с ЖКТ": 0.7,
        "поражение респираторной системы": 0.8,
    },
    "Бешенство": {
        "галлюцинации": 1.0,
        "агрессивность": 1.0,
        "стремление бежать": 1.0,
        "пугливость": 0.8,
        "паралич мышц": 0.9,
        "затруднение глотания": 0.85,
        "извращенный аппетит": 0.85,
        "обильное слюнотечение": 0.95,
    },
    "Болезнь Ауески": {
        "судороги": 1.0,
        "паралич мышц": 1.0,
        "сильный зуд и расчёсы": 1.0,
        "высокая температура": 0.6,
    },
    "Семейство вирусов герпеса": {
        "конъюнктивит": 1.0,
        "помутнение зрения": 1.0,
        "выраженная депрессия": 0.8,
        "проблемы с ЖКТ": 0.7,
        "поражение респираторной системы": 0.8,
        "анорексия": 0.85,
        "постоянный плач": 0.9,
    },
    "Вирус гриппа": {
        "конъюнктивит": 1.0,
        "высокая температура": 0.8,
        "вялость": 0.8,
        "серозно-слизистые, а затем гнойные истечения из носа": 0.9,
        "отказ от пищи": 0.85,
        "поражение респираторной системы": 0.8,
    },
    "Коронавирус": {"проблемы с ЖКТ": 1.0},
}

In [4]:
with open("diseases.csv", "w", newline="", encoding="utf-8") as file:
    writer = csv.writer(file)
    writer.writerow(all_symptoms + ["болезнь"])

    for i in range(5000):
        disease, symptoms = random.choice(list(diseases.items()))
        row = [0] * len(all_symptoms)
        
        for symptom, weight in symptoms.items():
            row[all_symptoms.index(symptom)] = 1 if random.random() < weight else 0

        noise_symptoms = random.sample(
            [s for s in all_symptoms if s not in symptoms], 
            k=random.randint(2, 5)
        )
        for ns in noise_symptoms:
            if random.random() < 0.2:
                row[all_symptoms.index(ns)] = 1

        row.append(disease)
        writer.writerow(row)