![JohnSnowLabs](https://nlp.johnsnowlabs.com/assets/images/logo.png)

[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/JohnSnowLabs/spark-nlp-workshop/blob/master/tutorials/streamlit_notebooks/healthcare/CLINICAL_TEXT_SUMMARIZATION_ES.ipynb)

# Colab Setup

In [None]:
import json, os
from google.colab import files

if 'spark_jsl.json' not in os.listdir():
  license_keys = files.upload()
  os.rename(list(license_keys.keys())[0], 'spark_jsl.json')

with open('spark_jsl.json') as f:
    license_keys = json.load(f)

# Defining license key-value pairs as local variables
locals().update(license_keys)
os.environ.update(license_keys)

In [None]:
# Installing pyspark and spark-nlp
! pip install --upgrade -q pyspark==3.1.2  spark-nlp==$PUBLIC_VERSION

# Installing Spark NLP Healthcare
! pip install --upgrade -q spark-nlp-jsl==$JSL_VERSION  --extra-index-url https://pypi.johnsnowlabs.com/$SECRET

# Installing Spark NLP Display Library for visualization
! pip install -q spark-nlp-display

In [4]:
import json
import os

import sparknlp
import sparknlp_jsl

from sparknlp.base import *
from sparknlp.common import *
from sparknlp.training import *
from sparknlp.annotator import *

from sparknlp_jsl.base import *
from sparknlp_jsl.annotator import *

from pyspark.ml import Pipeline
import pyspark.sql.functions as F
import pyspark.sql.types as T

import functools 
import numpy as np
import pandas as pd
from scipy import spatial

spark = sparknlp_jsl.start(license_keys['SECRET']) 

print("Spark NLP Version :", sparknlp.version())
print("Spark NLP_JSL Version :", sparknlp_jsl.version())

spark

Spark NLP Version : 4.4.1
Spark NLP_JSL Version : 4.4.1


# summarizer_clinical_jsl_augmented

üìå This model is a modified version of Flan-T5 (LLM) based summarization model that is at first finetuned with natural instructions and then finetuned with clinical notes, encounters, critical care notes, discharge notes, reports, curated  by John Snow Labs. This model is further optimized by augmenting the training methodology, and dataset. It can generate summaries from clinical notes up to 512 tokens given the input text (max 1024 tokens).

‚õìÔ∏è https://nlp.johnsnowlabs.com/2023/03/30/summarizer_clinical_jsl_augmented_en.html

In [5]:
document = DocumentAssembler()\
    .setInputCol("text")\
    .setOutputCol("document")

summarizer = MedicalSummarizer()\
    .pretrained("summarizer_clinical_jsl_augmented", "en", "clinical/models")\
    .setInputCols("document")\
    .setOutputCol("english_summary")\
    .setMaxTextLength(512)\
    .setMaxNewTokens(512)

sentencerDL = SentenceDetectorDLModel.pretrained("sentence_detector_dl", "xx")\
    .setInputCols(["english_summary"])\
    .setOutputCol("sentences")

marian_transformer = MarianTransformer.pretrained("opus_mt_en_es", "xx")\
    .setInputCols(["sentences"])\
    .setOutputCol("spanish_summary")
    
pipeline_summary = Pipeline(stages=[document, 
                                    summarizer, 
                                    sentencerDL, 
                                    marian_transformer])

model_summary= pipeline_summary.fit(spark.createDataFrame([[""]]).toDF("text"))

light_model_summary = LightPipeline(model_summary)

summarizer_clinical_jsl_augmented download started this may take some time.
[OK!]
sentence_detector_dl download started this may take some time.
Approximate size to download 514.9 KB
[OK!]
opus_mt_en_es download started this may take some time.
Approximate size to download 398.8 MB
[OK!]


In [None]:
text = '''
Fecha: 5 de mayo de 2023

Paciente: Juan P√©rez

Edad: 45 a√±os

Motivo de consulta: Dolor abdominal

Antecedentes m√©dicos relevantes: El paciente tiene antecedentes de hipertensi√≥n arterial y diabetes tipo 2. Adem√°s, ha sido diagnosticado con enfermedad renal cr√≥nica en estadio 3.

Examen f√≠sico: El paciente se presenta con dolor abdominal difuso, leve sensibilidad a la palpaci√≥n en la regi√≥n epig√°strica y una presi√≥n arterial de 140/90 mmHg.

Resultados de los ex√°menes: Los resultados de la prueba de hemoglobina glicosilada (HbA1c) son de 7,2%, lo que indica un control adecuado de la diabetes. Sin embargo, se observa una elevaci√≥n de la creatinina s√©rica a 1,8 mg/dL, lo que indica un deterioro de la funci√≥n renal.

Diagn√≥stico: El paciente presenta dolor abdominal de origen desconocido, pero se debe tener en cuenta la posibilidad de una afecci√≥n gastrointestinal o renal. Adem√°s, el deterioro de la funci√≥n renal es un hallazgo preocupante que requiere seguimiento y posible ajuste en la terapia farmacol√≥gica.

Tratamiento: Se orden√≥ una ecograf√≠a abdominal para descartar una afecci√≥n gastrointestinal o renal. Adem√°s, se realizar√°n ajustes en la terapia farmacol√≥gica para mejorar el control de la presi√≥n arterial y el control de la diabetes. Se recomienda una dieta baja en sodio y una ingesta adecuada de l√≠quidos para mejorar la funci√≥n renal.

Plan de seguimiento: Se program√≥ una cita de seguimiento en dos semanas para revisar los resultados de la ecograf√≠a abdominal y evaluar la respuesta al tratamiento. Adem√°s, se monitorear√° la funci√≥n renal y se realizar√°n ajustes en la terapia farmacol√≥gica seg√∫n sea necesario.

Firma:
Dr. Juan Garc√≠a
'''

light_result = light_model_summary.annotate(text)
light_result


{'document': ['\nFecha: 5 de mayo de 2023\n\nPaciente: Juan P√©rez\n\nEdad: 45 a√±os\n\nMotivo de consulta: Dolor abdominal\n\nAntecedentes m√©dicos relevantes: El paciente tiene antecedentes de hipertensi√≥n arterial y diabetes tipo 2. Adem√°s, ha sido diagnosticado con enfermedad renal cr√≥nica en estadio 3.\n\nExamen f√≠sico: El paciente se presenta con dolor abdominal difuso, leve sensibilidad a la palpaci√≥n en la regi√≥n epig√°strica y una presi√≥n arterial de 140/90 mmHg.\n\nResultados de los ex√°menes: Los resultados de la prueba de hemoglobina glicosilada (HbA1c) son de 7,2%, lo que indica un control adecuado de la diabetes. Sin embargo, se observa una elevaci√≥n de la creatinina s√©rica a 1,8 mg/dL, lo que indica un deterioro de la funci√≥n renal.\n\nDiagn√≥stico: El paciente presenta dolor abdominal de origen desconocido, pero se debe tener en cuenta la posibilidad de una afecci√≥n gastrointestinal o renal. Adem√°s, el deterioro de la funci√≥n renal es un hallazgo preocupant

In [None]:
spanish_summary = "".join(light_result["spanish_summary"])
spanish_summary

'El paciente tiene 45 a√±os con antecedentes de hipertensi√≥n arterial y diabetes tipo 2.Se le ha diagnosticado cr√≥nica renal en el estado y tiene antecedentes de hipertensi√≥n arterial y de hipertensi√≥n arterial.El paciente presenta dolor abdominal, baja presi√≥n vascular perif√©rica y alta presi√≥n arterial.Los resultados de la prueba de hemoglobina glicosilada son de 7,2%, lo que indica un control adecuado de la diabetes.Sin embargo, una elevaci√≥n en los niveles de creatinina indica un determinoro de la funci√≥n renal.El tratamiento incluye una ecograf√≠a abdominal para descartar una adecci√≥n gastrointestinal o renal, ajustes en una terapia farmacol√≥gica para mejorar el control de la presi√≥n arterial ySe program√≥ una cita de seguimiento para revisar los resultados y evaluar la respuesta al tratamiento.'

In [None]:
text = '''
Paciente: Ana P√©rez
Edad: 10 meses
G√©nero: Femenino
Motivo de consulta: Fiebre y diarrea

Historia cl√≠nica:
La paciente Ana P√©rez fue llevada a la consulta m√©dica por su madre debido a que presentaba fiebre y diarrea desde hace dos d√≠as. La fiebre hab√≠a estado en torno a los 38¬∫C y se hab√≠a mantenido constante, mientras que la diarrea era acuosa y se produc√≠a con frecuencia. La paciente tambi√©n hab√≠a estado vomitando y no hab√≠a querido comer.

Antecedentes m√©dicos:
La paciente no tiene antecedentes m√©dicos significativos y estaba recibiendo alimentaci√≥n materna exclusiva hasta el momento.

Examen f√≠sico:
Al examen f√≠sico, se observ√≥ que la paciente ten√≠a una temperatura de 38.5¬∫C, y se evidenci√≥ deshidrataci√≥n moderada. El abdomen estaba distendido y sensible a la palpaci√≥n, y se observ√≥ una diarrea acuosa en el pa√±al.

Diagn√≥stico:
Bas√°ndonos en los s√≠ntomas y el examen f√≠sico, se sospecha una infecci√≥n gastrointestinal aguda. Se recomienda realizar un an√°lisis de heces para detectar la presencia de bacterias o par√°sitos causantes de la infecci√≥n.

Plan de tratamiento:
Se prescribir√° un tratamiento de rehidrataci√≥n oral con soluciones de sales y l√≠quidos, y se recomendar√° a la madre que contin√∫e alimentando a la paciente con leche materna. Se prescribir√° un medicamento antipir√©tico para controlar la fiebre y se indicar√° una dieta blanda, evitando alimentos que puedan empeorar la diarrea. Se tomar√°n muestras de heces para an√°lisis y se prescribir√° un tratamiento antibi√≥tico si se detecta la presencia de bacterias pat√≥genas. Se recomendar√° a la madre seguir de cerca la evoluci√≥n de la paciente y volver a la consulta si la fiebre persiste o si hay signos de empeoramiento.
'''

light_result = light_model_summary.annotate(text)
light_result

{'document': ['\nPaciente: Ana P√©rez\nEdad: 10 meses\nG√©nero: Femenino\nMotivo de consulta: Fiebre y diarrea\n\nHistoria cl√≠nica:\nLa paciente Ana P√©rez fue llevada a la consulta m√©dica por su madre debido a que presentaba fiebre y diarrea desde hace dos d√≠as. La fiebre hab√≠a estado en torno a los 38¬∫C y se hab√≠a mantenido constante, mientras que la diarrea era acuosa y se produc√≠a con frecuencia. La paciente tambi√©n hab√≠a estado vomitando y no hab√≠a querido comer.\n\nAntecedentes m√©dicos:\nLa paciente no tiene antecedentes m√©dicos significativos y estaba recibiendo alimentaci√≥n materna exclusiva hasta el momento.\n\nExamen f√≠sico:\nAl examen f√≠sico, se observ√≥ que la paciente ten√≠a una temperatura de 38.5¬∫C, y se evidenci√≥ deshidrataci√≥n moderada. El abdomen estaba distendido y sensible a la palpaci√≥n, y se observ√≥ una diarrea acuosa en el pa√±al.\n\nDiagn√≥stico:\nBas√°ndonos en los s√≠ntomas y el examen f√≠sico, se sospecha una infecci√≥n gastrointestinal ag

In [None]:
spanish_summary = "".join(light_result["spanish_summary"])
spanish_summary

'La paciente, Ana P√©rez, tuvo fiebre y diarrea durante 10 d√≠as.Llevaba dos d√≠as sufriendo fiebre y diarrea, que se manten√≠a constante mientras la diarrea era acuosa y se produc√≠a con frecuencia.El paciente no ten√≠a antecedentes m√©dicos significativos y s√≥lo recib√≠a alimentaci√≥n materna.El examen f√≠sico revel√≥ una moderaci√≥n deshidratante y se observ√≥ diarrea en el √°rea paulal.El plan de tratamiento inclu√≠a rehidrataci√≥n oral con medicamentos, un medicamento para el control bacteriano y una dieta suave, evitando alimentos que pudieran empeoorizar la diarrea.Se tomaron muestras de heces para su an√°lisis, y se prescribi√≥ un tratamiento antibi√≥tico si la fiebre persiste o si hay signos de empeooraci√≥n.Se aconsej√≥ a la madre que siguiera la evoluci√≥n del paciente y regresara si la fiebre persiste o si hay signos de empeooramiento.'