<a href="https://colab.research.google.com/github/hoony6134/project/blob/main/1314_%EC%9E%84%EC%A0%95%ED%9B%88_2%ED%95%99%EA%B8%B0_%ED%94%84%EB%A1%9C%EA%B7%B8%EB%9E%98%EB%B0%8D_%ED%94%84%EB%A1%9C%EC%A0%9D%ED%8A%B8.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# COVID-19 Symptoms Classification System
### Developed by JeongHoon Lim

## Descriptions
* **Background** | 현재 우리는 코로나19 속에서 살아가고 있다. 코로나19 자가검진 키트를 통해 코로나19의 감염 여부를 판별하는 것이 가장 좋으나, 매 번 키트를 통해 검사하기 힘들고, 또 간단한 증상이 있는데, 이것이 코로나19의 증상인지 아닌지 확인해 보고 싶을 때가 많다. 이러한 점에서, 코로나19의 증상 정보를 입력하면 자신이 코로나19에 걸렸는지 아닌지를 간단하게 판별해 주는 시스템을 만들어 보고자 본 주제를 선정하게 되었다. (단, 본 프로그램을 통한 결과는 단순 참고용이며, 의료적 목적으로 사용해서는 안된다.)
* **Dataset** | [Covid-19 symptoms classification (Kaggle)](https://www.kaggle.com/datasets/zhiruo19/covid19-symptoms-classification) 사용
* **Details** | 체온(temp), 신체의 전반적인 고통 여부(bodypain), 나이(age), 콧물 여부(runny nose)의 4가지 독립변수로부터 감염 여부(infected)라는 하나의 종속 변수를 도출해 내는 프로그램이다.

## Preparation

### Libraries
* 인공지능 학습에 필요한 라이브러리와 데이터 처리를 위해 필요한 라이브러리를 import하였다.

In [None]:
import tensorflow as tf
import numpy as np
import pandas as pd
from tensorflow import keras
from pandas import read_csv

### File Import
* Kaggle에서 가져온 데이터셋에서 화씨 단위로 되어 있던 체온 데이터를 섭씨 단위로 변환하여 처리하였고, 사용할 독립변수를 선택하여 처리 후 .csv 파일을 GitHub에 업로드하여 Colab에서 불러왔다.
* 이 때, 파일이 깨지지 않도록 인코딩을 cp949로 바꾸어 Colab에서 처리하였다.


In [None]:
file_location = 'https://raw.githubusercontent.com/hoony6134/2022_programming_project_ai/main/covid.csv'
data = pd.read_csv(file_location, encoding='cp949')
data

Unnamed: 0,temp,bodypain,age,runnynose,infected
0,37.405479,0,26,1,0
1,36.730702,1,61,1,1
2,37.732271,1,13,0,0
3,38.524698,1,55,1,1
4,37.809265,1,37,0,0
...,...,...,...,...,...
1994,38.706606,1,33,1,1
1995,38.707766,1,38,0,1
1996,37.669128,1,76,0,1
1997,36.980879,1,62,1,1


## Building AI

### Variables
* Xlist: 독립변수 리스트 (체온, 신체의 전반적인 고통 여부, 나이, 콧물이 나는 지 여부)
* Ylist: 종속변수 리스트 (코로나19 감염 여부)

In [None]:
Xlist = data[['temp','bodypain','age','runnynose']]
Ylist = data[['infected']]
print(Xlist.shape, Ylist.shape)

(1999, 4) (1999, 1)


### Model
* 자주 사용되는 활성함수인 relu, sigmoid, tanh 중 tanh는 범위가 -1~1이므로 본 데이터와 적합하지 않다고 판단하였고, 선형 데이터가 아니므로 relu보다는 sigmoid가 적합할 것 같다는 판단 하에 여러 activation function을 사용해 본 결과, Sigmoid가 적합한 함수로 판단되어 sigmoid 함수를 활성함수로 사용하였다.
* Optimizer 중 Adam의 loss 값이 낮게 나오고, 상대적으로 정확한 결과가 나오는 것으로 판단되어 Adam을 Optimizer로 설정하였다.
* 본 데이터는 결과가 T/F (이진)로 나오는 것을 목표로 하기 때문에, 손실 함수로 binary_crossentropy를 사용하는 것이 적합하다고 판단하였다.

In [None]:
X = tf.keras.layers.Input(shape=4)
Y = tf.keras.layers.Dense(1, activation='sigmoid')(X)
model = tf.keras.models.Model(X, Y)
model.compile(optimizer='adam',loss='binary_crossentropy',
              metrics='accuracy')

### Epoch Setting & Model Training
* 사용자로부터 epoch 값을 입력받고, epc-10번 만큼 **출력 없이** 학습하여 효율적으로 학습하도록 하였고, 가장 마지막에 10번 학습을 진행하고, 진행 내용을 출력하여 사용자가 loss와 accuracy를 확인할 수 있도록 하였다.

In [None]:
epc=int(input("Epoch 값을 입력하세요: "))
model.fit(Xlist, Ylist, epochs=epc-10,verbose=0)
model.fit(Xlist, Ylist, epochs=10,verbose=1)

Epoch 값을 입력하세요: 1000
Epoch 1/10
Epoch 2/10
Epoch 3/10
Epoch 4/10
Epoch 5/10
Epoch 6/10
Epoch 7/10
Epoch 8/10
Epoch 9/10
Epoch 10/10


<keras.callbacks.History at 0x7fa6d5497bb0>

## Usage
* 본 시스템을 시설 입구 등에 설치하거나 스마트폰 애플리케이션 등을 통해 사용자에게 도달할 수 있도록 하고, 시설 입구의 체온 센서와 연동하거나 스마트폰의 온도 센서, 혹은 스마트 체온계(또는 일반 체온계의 측정값을 입력)와 연동하여 체온 정보를 입력받고, 건강 상태를 간단히 응답하면 코로나 19의 감염 가능성을 알려주도록 하였다.
* 실제로 아래 모델에서 모두 입력하면, 결과가 소수로 나오게 되는데, 1에 가까울 수록 코로나19에 걸렸을 가능성이 높다고 판단하는 것이고, 0에 가까울 수록 코로나19에 걸렸을 가능성이 낮다고 판단하게 된다. 이를 이용하여 결과값에 100을 곱하여 백분율 형태로 감염 확률을 판단하여 사용자에게 제공한다.
* 다만, 의료 목적으로 사용하는 데에는 어려움이 있으므로 참고용으로 사용하도록 하는 문구를 표시하였다.

In [None]:
temp=float(input("기기를 통해 측정한 체온을 섭씨 단위로 입력해 주세요: "))
bodypain=int(input("몸의 컨디션이 전반적으로 좋지 않거나, 아프신가요? 있으면 1, 없으면 0을 입력해 주세요: "))
age=int(input("나이를 입력해 주세요: "))
runnynose=int(input("콧물이 나시나요? 콧물이 나면 1, 나지 않으면 0을 입력해 주세요: "))
Fl=model.predict([[temp,bodypain,age,runnynose]],verbose=0)
accuracy=str(str(Fl[[0]]*100).replace("[","").replace("]",""))
# print(accuracy)
if Fl[[0]]<0.5:
  print("코로나19에 감염된 것 같아 보이지 않습니다. (AI가 판단한 감염 확률은 "+accuracy+"% 입니다.)")
else:
  print("코로나19에 감염된 것 같아 보입니다. (AI가 판단한 감염 확률은"+str(Fl[[0]]*100)+"%입니다.)")
print("=============================\n*** DISCLAIMER: 본 프로그램은 단순 참고용이며, 어떠한 법적 효력이나 의료적 효력을 지니고 있지 않음을 알려드립니다.\n본 프로그램을 사용해 주셔서 감사합니다.")

사용자의 체온을 섭씨 단위로 입력해 주세요: 37.8
몸의 컨디션이 전반적으로 좋지 않거나, 아프신가요? 있으면 1, 없으면 0을 입력해 주세요: 1
나이를 입력해 주세요: 54
콧물이 나시나요? 콧물이 나면 1, 나지 않으면 0을 입력해 주세요: 1
62.996136
코로나19에 감염된 것 같아 보입니다. (AI가 판단한 감염 확률은[[62.996136]]%입니다.)
*** DISCLAIMER: 본 프로그램은 단순 참고용이며, 어떠한 법적 효력이나 의료적 효력을 지니고 있지 않음을 알려드립니다. ***
본 프로그램을 사용해 주셔서 감사합니다.
