# **응급상황 자동 인식 및 응급실 연계 서비스**
# **단계4 : 통합 - pipeline**

## **0.미션**

단계 4에서는, 단계1,2,3 에서 생성한 함수들을 모듈화하고, 단위 테스트 및 파이프라인 코드를 작성합니다.

* **미션6**
    * 단위 테스트
        * 각 기능(함수)에 대해 단계별로 테스트를 수행하며 오류를 해결합니다.
    * 파이프라인 구축
        * 단계1의 결과가 단계2 모델에 input이 되고, 모델의 예측 결과를 기반으로
        * 응급실 추천되도록
        * 조원들이 녹음한 음성 파일에 임의의 좌표(위도, 경도)값을 부여
            * 음성파일 이름과 좌표를 저장하는 별도 데이터셋 생성
        * 각 모듈을 연결하여 파이프라인 구성하는 ipynb 파일 생성



## **1.환경설정**

### (1) 경로 설정

구글 드라이브 연결

#### 1) 구글 드라이브 폴더 생성
* 새 폴더(project6_2)를 생성하고
* 제공 받은 파일을 업로드

#### 2) 구글 드라이브 연결

In [3]:
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [4]:
path = '/content/drive/MyDrive/project6_2/'

### (2) 라이브러리

#### 1) 필요한 라이브러리 설치

* requirements.txt 파일의 [경로 복사]를 한 후,
* 아래 경로에 붙여 넣기

In [5]:
# 경로 : /content/drive/MyDrive/project6_2/requirements.txt
# 경로가 다른 경우 아래 코드의 경로 부분을 수정하세요.

# !pip install -r /content/drive/MyDrive/project6_2/requirements.txt -q
!pip install -r /content/drive/MyDrive/project6_2/requirements.txt --use-deprecated=legacy-resolver -q > /dev/null 2>&1

#### 2) 라이브러리 로딩

In [6]:
#필요한 라이브러리 설치 및 불러우기
import os
import requests
import xml.etree.ElementTree as ET
import pandas as pd
import openai
from openai import OpenAI
import json
import sys
sys.path.append(path)

# 새로 추가한 것
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
from warnings import filterwarnings
FutureWarning
filterwarnings('ignore')

# 조에서 생성한 모듈 불러오기 -------------
from emergency import load_key_file, audio2text, text_summary, model_prediction, predict, get_dist, recommendation

## **2. 단위 테스트**

* 세부사항 : 아래 단계별로 데이터가 순차적으로 처리되도록 단위 테스트를 진행합니다.

### (1) open ai key 등록

In [7]:
api_key, c_id, c_key = load_key_file(path)

In [8]:
print(os.environ['OPENAI_API_KEY'])

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


In [9]:
# 결과 출력
print(f'c_id: {c_id}\nc_key: {c_key}')

c_id: 5ypqqec7qa
c_key: kO5OH7nDUYe3iy0BOgAbDpgVSBTsMb1MMWwexaKC


### (2) audio to text

In [10]:
filename = 'audio5.mp3'
text = audio2text(path, filename)
print(text)

화장실에서 미끄러워서 엉덩방아를 찍었어요. 그러고 꼬리뼈가 계속 아파요. 점점 아픈 것 같은데 응급실을 가야 할까요?



### (3) text summary

In [11]:
answer = text_summary(text)
print(answer)

미끄러져 엉덩방아를 찍고 꼬리뼈가 아픈 상황입니다.


### (4) 응급실 등급분류

In [12]:
model, tokenizer = model_prediction(path)

In [13]:
predicted_class, probabilities = predict(text, model, tokenizer)

print(f"예측된 클래스: {predicted_class}")
print(f"예측된 클래스 이름: {predicted_class+1}등급")
print(f"클래스별 확률: {probabilities}")

예측된 클래스: 2
예측된 클래스 이름: 3등급
클래스별 확률: tensor([[0.0047, 0.0522, 0.7146, 0.0074, 0.2211]])


In [14]:
predicted_class, probabilities = predict(answer, model, tokenizer)

print(f"예측된 클래스: {predicted_class}")
print(f"예측된 클래스 이름: {predicted_class+1}등급")
print(f"클래스별 확률: {probabilities}")

예측된 클래스: 0
예측된 클래스 이름: 1등급
클래스별 확률: tensor([[0.9393, 0.0027, 0.0098, 0.0033, 0.0449]])


### (5) 응급실추천

In [15]:
start_lat, start_lng = 35.159831727662414, 126.85177313374048
df = pd.read_csv(path+'응급실 정보.csv')
df.head()

Unnamed: 0,병원이름,주소,응급의료기관 종류,전화번호 1,전화번호 3,위도,경도
0,(의)내경의료재단울산제일병원,울산광역시 남구 남산로354번길 26 (신정동),응급실운영신고기관,052-220-3300,052-220-3334,35.548238,129.307011
1,(의)서일의료재단기장병원,부산광역시 기장군 기장읍 대청로72번길 6,지역응급의료기관,051-723-0171,051-723-2119,35.236029,129.216492
2,(의)성세의료재단 뉴성민병원,"인천광역시 서구 칠천왕로33번길 17 (석남동, 신석로 70(석남1동, 성민병원))",지역응급의료기관,032-726-1000,032-726-1190,37.508994,126.669479
3,(의)영문의료재단다보스병원,"경기도 용인시 처인구 백옥대로1082번길 18, 다보스종합병원 (김량장동)",지역응급의료센터,031-8021-2114,031-8021-2130,37.234641,127.210499
4,(의)효심의료재단용인서울병원,경기도 용인시 처인구 고림로 81 (고림동),지역응급의료기관,031-337-0114,031-336-0119,37.240316,127.214491


In [16]:
new_df = recommendation(start_lat, start_lng, df, c_id, c_key, predicted_class)

전남대학교병원 - 광주광역시 동구 제봉로 42 (학동) - 8135
조선대학교병원 - 광주광역시 동구 필문대로 365 (서석동) - 19722
목포한국병원 - 전라남도 목포시 영산로 483 (상동) - 69356


In [17]:
new_df.head()

Unnamed: 0,병원이름,주소,응급의료기관 종류,전화번호 1,전화번호 3,위도,경도,거리
0,전남대학교병원,광주광역시 동구 제봉로 42 (학동),권역응급의료센터,1899-0000,062-220-6801,35.141853,126.921587,8135
1,조선대학교병원,광주광역시 동구 필문대로 365 (서석동),권역응급의료센터,1811-7474,062-220-3280,35.138547,126.926839,19722
2,목포한국병원,전라남도 목포시 영산로 483 (상동),권역응급의료센터,061-270-5500,061-270-5666,34.809215,126.416339,69356


## **3. 파이프라인**

* 세부사항
    * [2. 단계별 테스트] 의 내용을 순차적으로 정리합니다.
        * 데이터 처리 전 준비작업 : 한번 실행하면 되는 영역
            * 키, 데이터로딩
            * 모델/토크나이저 로딩
        * 입력값이 들어 왔을 때 출력값까지 처리되는 영역

In [1]:
# 코랩에서 돌릴경우
from google.colab import drive
drive.mount('/content/drive')

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).


In [18]:
# 경로
path = '/content/drive/MyDrive/project6_2/'

# 필요한 라이브러리 설치
!pip install -r /content/drive/MyDrive/project6_2/requirements.txt --use-deprecated=legacy-resolver -q > /dev/null 2>&1

#필요한 라이브러리 설치 및 불러우기
import os
import requests
import xml.etree.ElementTree as ET
import pandas as pd
import openai
from openai import OpenAI
import json
import sys
sys.path.append(path)

# 새로 추가한 것
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
from warnings import filterwarnings
FutureWarning
filterwarnings('ignore')

# 조에서 생성한 모듈 불러오기 -------------
from emergency import load_key_file, audio2text, text_summary, model_prediction, predict, get_dist, recommendation

# 필요한 키 로딩
api_key, c_id, c_key = load_key_file(path)

# 임시로 만들어진 음성 데이터 사용
filename = input('음성파일 이름을 입력하세요: ') + '.mp3'
print('-' * 100)

text = audio2text(path, filename)

# 요약
answer = text_summary(text)

# 모델로드
model, tokenizer = model_prediction(path)

# 예측
predicted_class, probabilities = predict(answer, model, tokenizer)

# 예측등급에 맞는 기관 추천
grade = predicted_class+1
print(f'중증도 {grade}등급')
print('-' * 100)

if grade == 1:
    print("권역응급의료센터를 추천합니다.")
if grade == 2:
    print("권역응급의료센터 및 지역응급의료센터를 추천합니다.")
if grade == 3:
    print("지역응급의료센터를 추천합니다.")
if grade == 4 or grade == 5:
    print("지역응급의료기관 및 응급실운영신고기관을 추천합니다.")
print('-' * 100)

# 사용자 위치 임의로 지정
start_lat, start_lng = 35.159831727662414, 126.85177313374048

# 응급실 정보 데이터프레임
df = pd.read_csv(path+'응급실 정보.csv')

# 사용자 위치기반 응급실 정보 데이터 프레임
new_df = recommendation(start_lat, start_lng, df, c_id, c_key, predicted_class)
print('-' * 100)
new_df.head(3)

음성파일 이름을 입력하세요: audio5
----------------------------------------------------------------------------------------------------
중증도 1등급
----------------------------------------------------------------------------------------------------
권역응급의료센터를 추천합니다.
----------------------------------------------------------------------------------------------------
전남대학교병원 - 광주광역시 동구 제봉로 42 (학동) - 7861
조선대학교병원 - 광주광역시 동구 필문대로 365 (서석동) - 18205
목포한국병원 - 전라남도 목포시 영산로 483 (상동) - 69356
----------------------------------------------------------------------------------------------------


Unnamed: 0,병원이름,주소,응급의료기관 종류,전화번호 1,전화번호 3,위도,경도,거리
0,전남대학교병원,광주광역시 동구 제봉로 42 (학동),권역응급의료센터,1899-0000,062-220-6801,35.141853,126.921587,7861
1,조선대학교병원,광주광역시 동구 필문대로 365 (서석동),권역응급의료센터,1811-7474,062-220-3280,35.138547,126.926839,18205
2,목포한국병원,전라남도 목포시 영산로 483 (상동),권역응급의료센터,061-270-5500,061-270-5666,34.809215,126.416339,69356
