# Denoising

In [1]:
import denoising as den

In [2]:
# Load data
DATA_AUDIO = "./doc_and_pat_data/dhl_doctor_with_isb.wav"
data, fs = den.load_audio(DATA_AUDIO)

# Denoising dhl doctor audio
doctor_denoised_audio, doctor_sr = den.denoising(
    audio=data,
    sample_rate=fs,
    device="cuda",
    verbose=True,
)

[DSR_MODULE]2023-10-05 08:45:17,296 INFO Loading model...
[DSR_MODULE]2023-10-05 08:45:18,712 INFO Converting audio...
[DSR_MODULE]2023-10-05 08:45:18,774 INFO Inference...
[DSR_MODULE]2023-10-05 08:45:19,241 INFO Converting output...
[DSR_MODULE]2023-10-05 08:45:19,246 INFO Done!


In [3]:
DATA_AUDIO = "./doc_and_pat_data/isb_patient_with_dlh.wav"
data, fs = den.load_audio(DATA_AUDIO)

# Denoising isb patient audio
patient_denoised_audio, patient_sr = den.denoising(
    audio=data,
    sample_rate=fs,
    device="cuda",
    verbose=True,
)

[DSR_MODULE]2023-10-05 08:45:19,287 INFO Loading model...
[DSR_MODULE]2023-10-05 08:45:19,699 INFO Converting audio...
[DSR_MODULE]2023-10-05 08:45:19,818 INFO Inference...
[DSR_MODULE]2023-10-05 08:45:20,037 INFO Converting output...
[DSR_MODULE]2023-10-05 08:45:20,039 INFO Done!


# Speech To Text

In [4]:
import speech_to_text as stt

[DSR_MODULE]2023-10-05 08:45:21,345 INFO Created a temporary directory at /tmp/tmpfgjd2h6p
[DSR_MODULE]2023-10-05 08:45:21,350 INFO Writing /tmp/tmpfgjd2h6p/_remote_module_non_scriptable.py


## STT with fine-tunined Whisper

In [5]:
doctor_text_whisper = stt.speech_to_text_whisper(
    pretrained_model_name_or_path="byoussef/whisper-large-v2-Ko",
    audio=doctor_denoised_audio,
    audio_sample_rate=doctor_sr,
    verbose=True
)
print(doctor_text_whisper)

[DSR_MODULE]2023-10-05 08:45:23,129 INFO device argument is not provided. Using default value: cuda
[DSR_MODULE]2023-10-05 08:45:23,132 INFO batchsize argument is not provided. Using default value: 32
[DSR_MODULE]2023-10-05 08:45:23,133 INFO Loading model...
[DSR_MODULE]2023-10-05 08:45:40,652 INFO % [PROCESSOR] Converting audio...
[DSR_MODULE]2023-10-05 08:45:40,719 INFO % [PROCESSOR] Done.
[DSR_MODULE]2023-10-05 08:45:40,720 INFO Inference...
[DSR_MODULE]2023-10-05 08:45:43,487 INFO Decoding...


['안녕하세요 환자분 오늘 어떤 문제로 대언하셨나요 발열과 두통은 언제부터 시작되었나요 발열과 두통이 있을 때는 어떤 증상이 나타나나요 그 외에 다른 증상은 없나요']


In [6]:
patient_text_whisper = stt.speech_to_text_whisper(
    pretrained_model_name_or_path="byoussef/whisper-large-v2-Ko",
    audio=patient_denoised_audio,
    audio_sample_rate=patient_sr,
    verbose=True
)
print(patient_text_whisper)

[DSR_MODULE]2023-10-05 08:45:43,521 INFO device argument is not provided. Using default value: cuda
[DSR_MODULE]2023-10-05 08:45:43,524 INFO batchsize argument is not provided. Using default value: 32
[DSR_MODULE]2023-10-05 08:45:43,524 INFO Loading model...
[DSR_MODULE]2023-10-05 08:45:59,542 INFO % [PROCESSOR] Converting audio...
[DSR_MODULE]2023-10-05 08:45:59,618 INFO % [PROCESSOR] Done.
[DSR_MODULE]2023-10-05 08:45:59,619 INFO Inference...
[DSR_MODULE]2023-10-05 08:46:01,761 INFO Decoding...


['안녕하세요 의사 선생님 저는 요즘 발열과 두통이 심해서 맞습니다 며칠 전부터 시작되었는데 점점 심해지는 것 같아요 열이 나고 머리가 아프고 목이 아픕니다 콧물이 나고 기침이 납니다']


## Baseline STT Model

In [7]:
doctor_text = stt.speech_to_text(
    processor_pretrained_argument="kresnik/wav2vec2-large-xlsr-korean",
    audio=doctor_denoised_audio,
    audio_sample_rate=doctor_sr,
    device="cuda",
    verbose=True)
print(doctor_text)

[DSR_MODULE]2023-10-05 08:46:01,797 INFO Loading model...
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
[DSR_MODULE]2023-10-05 08:46:05,155 INFO Converting audio...
[DSR_MODULE]2023-10-05 08:46:05,167 INFO Inference...
[DSR_MODULE]2023-10-05 08:46:05,221 INFO Decoding...


['만냐 제 환자뿐는 오늘 어떤 문제로 태원하셨나버를 같 뜻 뿐을 얹제붙트 시작 때나어 을 가 트통이 있을 때는 어떤 증상이 나타나아그 에 른 생상을 없나내 알겠습니다 헌자분의 증상을 듣고 패려이 의심 됩니 하지만 비대이 진류이기 때문에 정확한 진단을 내리가 어렵습니다 혹시 가까운 병원에 방문하실 수 있나내 그렇다면 가까운 병원에 방문하셨서 진료를 받으시기 바랍니다 배려이 의심된다면 신부 액세레이를 치어 보면 정확한 진단을 내릴 수 있을 것입니내요']


In [8]:
patient_text = stt.speech_to_text(
    processor_pretrained_argument="kresnik/wav2vec2-large-xlsr-korean",
    audio=patient_denoised_audio,
    audio_sample_rate=patient_sr,
    device="cuda",
    verbose=True)
print(patient_text)

[DSR_MODULE]2023-10-05 08:46:05,461 INFO Loading model...
Special tokens have been added in the vocabulary, make sure the associated word embeddings are fine-tuned or trained.
[DSR_MODULE]2023-10-05 08:46:09,026 INFO Converting audio...
[DSR_MODULE]2023-10-05 08:46:09,036 INFO Inference...
[DSR_MODULE]2023-10-05 08:46:09,085 INFO Decoding...


['냐 세 의사상인 저는 요지 발월과 통의 심에서 왔습니매치제부터 시작되였는데 점점 시해 지는 것 같아요여린리 나고 머리가 부고 보기 아습니콧물이나고 기친이 합니내 방문하겠습니날겠습니다 한사니다다']


In [10]:
system_prompt = f"""
당신은 문서 정리를 하는 서기 입니다. 그 중에서도 두 사람의 대화 내용을 듣고 어떤 대화인지 정리 요약하는 서기 입니다. 두 사람의 대화 내용을 당신에게 전달할 것입니다. 한명은 의사, 한명은 환자입니다. 의사는 DOC:<TEXT HERE>로 드릴 것이며 환자는 PATIENT:<TEXT HERE>로 드릴 예정입니다. 대화 내용에서는 시간적 특성이 배제 되어 있습니다. 당신은 별 다른 시간 인덱스가 없더라도 내용을 파악하고 이해하셔야 합니다. 요약 정리는 Markdown 문서 형식으로 정리가 되어야합니다. 서론, 본론, 결론으로 정리를 해야합니다. 서론은 #서론, 본론은 #본론, 결론은 #결론으로 정리하시기 바랍니다. 
DOC:<{doctor_text}>. 
PATIENT:<{patient_text}>.
"""
print(system_prompt)


당신은 문서 정리를 하는 서기 입니다. 그 중에서도 두 사람의 대화 내용을 듣고 어떤 대화인지 정리 요약하는 서기 입니다. 두 사람의 대화 내용을 당신에게 전달할 것입니다. 한명은 의사, 한명은 환자입니다. 의사는 DOC:<TEXT HERE>로 드릴 것이며 환자는 PATIENT:<TEXT HERE>로 드릴 예정입니다. 대화 내용에서는 시간적 특성이 배제 되어 있습니다. 당신은 별 다른 시간 인덱스가 없더라도 내용을 파악하고 이해하셔야 합니다. 요약 정리는 Markdown 문서 형식으로 정리가 되어야합니다. 서론, 본론, 결론으로 정리를 해야합니다. 서론은 #서론, 본론은 #본론, 결론은 #결론으로 정리하시기 바랍니다. 
DOC:<['만냐 제 환자뿐는 오늘 어떤 문제로 태원하셨나버를 같 뜻 뿐을 얹제붙트 시작 때나어 을 가 트통이 있을 때는 어떤 증상이 나타나아그 에 른 생상을 없나내 알겠습니다 헌자분의 증상을 듣고 패려이 의심 됩니 하지만 비대이 진류이기 때문에 정확한 진단을 내리가 어렵습니다 혹시 가까운 병원에 방문하실 수 있나내 그렇다면 가까운 병원에 방문하셨서 진료를 받으시기 바랍니다 배려이 의심된다면 신부 액세레이를 치어 보면 정확한 진단을 내릴 수 있을 것입니내요']>. 
PATIENT:<['냐 세 의사상인 저는 요지 발월과 통의 심에서 왔습니매치제부터 시작되였는데 점점 시해 지는 것 같아요여린리 나고 머리가 부고 보기 아습니콧물이나고 기친이 합니내 방문하겠습니날겠습니다 한사니다다']>.



## OpenAI - Summarize

In [None]:
import openai

In [21]:
system_prompt = f"당신은 문서 정리를 하는 서기 입니다. 그 중에서도 두 사람의 대화 내용을 듣고 어떤 대화인지 정리 요약하는 서기 입니다. 두 사람의 대화 내용을 당신에게 전달할 것입니다. 한명은 의사, 한명은 환자입니다. 의사는 DOC:<TEXT HERE>로 드릴 것이며 환자는 PATIENT:<TEXT HERE>로 드릴 예정입니다. 대화 내용에서는 시간적 특성이 배제 되어 있습니다."
assistant_prompt = "당신은 별 다른 시간 인덱스가 없더라도 내용을 파악하고 이해하셔야 합니다. 요약 정리는 Markdown 문서 형식으로 정리가 되어야합니다. 서론, 본론, 결론으로 정리를 해야합니다. 서론은 #서론, 본론은 #본론, 결론은 #결론으로 정리하시기 바랍니다."
user_prompt = f"DOC:<{doctor_text[0]}>. PATIENT:<{patient_text[0]}>."

MODEL = "gpt-3.5-turbo"
message = [
    {"role": "system", "content": system_prompt},
    {"role": "user", "content": user_prompt},
    {"role": "assistant", "content": assistant_prompt},

]

In [25]:
response = openai.ChatCompletion.create(
    model=MODEL,
    messages=message,
    temperature=0.0,
    max_tokens=1024,
)

print(response)

{
  "id": "chatcmpl-86EpUgpvjiPxujcgkims83hr6KGVp",
  "object": "chat.completion",
  "created": 1696497664,
  "model": "gpt-3.5-turbo-0613",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "#\uc11c\ub860\n\uc758\uc0ac\uc640 \ud658\uc790 \uc0ac\uc774\uc758 \ub300\ud654 \ub0b4\uc6a9\uc744 \uc815\ub9ac\ud558\uace0 \uc694\uc57d\ud558\ub294 \ubb38\uc11c\uc785\ub2c8\ub2e4.\n\n#\ubcf8\ub860\n- \uc758\uc0ac: \ud658\uc790\uc758 \uc99d\uc0c1\uc744 \ub4e3\uace0 \ud328\ub834\uc774 \uc758\uc2ec\ub418\uc9c0\ub9cc, \uc815\ud655\ud55c \uc9c4\ub2e8\uc744 \ub0b4\ub9ac\uae30 \uc5b4\ub835\ub2e4\uace0 \uc5b8\uae09\ud569\ub2c8\ub2e4.\n- \uc758\uc0ac: \ud658\uc790\uc5d0\uac8c \uac00\uae4c\uc6b4 \ubcd1\uc6d0\uc744 \ubc29\ubb38\ud558\uc5ec \uc9c4\ub8cc\ub97c \ubc1b\uc744 \uac83\uc744 \uad8c\uc720\ud569\ub2c8\ub2e4.\n- \ud658\uc790: \uc99d\uc0c1\uc73c\ub85c\ub294 \uc694\uc9c0 \ubc1c\uc6d4\uacfc \ud1b5, \uc5ec\ub9b0\ub9ac, \uba38\ub9ac\uac00 \ubd80\uace0,

In [26]:
print(response['choices'][0]['message']['content'])

#서론
의사와 환자 사이의 대화 내용을 정리하고 요약하는 문서입니다.

#본론
- 의사: 환자의 증상을 듣고 패렴이 의심되지만, 정확한 진단을 내리기 어렵다고 언급합니다.
- 의사: 환자에게 가까운 병원을 방문하여 진료를 받을 것을 권유합니다.
- 환자: 증상으로는 요지 발월과 통, 여린리, 머리가 부고, 코물이나고 기친이 있다고 언급합니다.
- 환자: 병원 방문을 약속하고 감사의 말을 전합니다.

#결론
의사는 환자의 증상을 듣고 패렴을 의심하며, 정확한 진단을 내리기 어렵다고 언급합니다. 환자에게 가까운 병원을 방문하여 진료를 받을 것을 권유합니다. 환자는 병원 방문을 약속하고 감사의 말을 전합니다.
