In [1]:
import os
from softtek_llm.chatbot import Chatbot
from softtek_llm.models import OpenAI
from softtek_llm.vectorStores import PineconeVectorStore
from softtek_llm.embeddings import OpenAIEmbeddings
from dotenv import load_dotenv

  from tqdm.autonotebook import tqdm


In [180]:
load_dotenv()

OPENAI_API_KEY=os.getenv("OPENAI_API_KEY")
OPENAI_API_BASE=os.getenv("OPENAI_API_BASE")
OPENAI_CHAT_MODEL_NAME=os.getenv("OPENAI_CHAT_MODEL_NAME")
OPENAI_EMBEDDINGS_MODEL_NAME=os.getenv("OPENAI_EMBEDDINGS_MODEL_NAME")
PINECONE_API_KEY=os.getenv("PINECONE_API_KEY")
PINECONE_ENVIRONMENT=os.getenv("PINECONE_ENVIRONMENT")
PINECONE_INDEX_NAME=os.getenv("PINECONE_INDEX_NAME")

vector_store = PineconeVectorStore(
    api_key=PINECONE_API_KEY,
    environment=PINECONE_ENVIRONMENT,
    index_name=PINECONE_INDEX_NAME,
)
embeddings_model = OpenAIEmbeddings(
    api_key=OPENAI_API_KEY,
    model_name=OPENAI_EMBEDDINGS_MODEL_NAME,
    api_type="azure",
    api_base=OPENAI_API_BASE,
)
model = OpenAI(
    api_key=OPENAI_API_KEY,
    model_name=OPENAI_CHAT_MODEL_NAME,
    api_type="azure",
    api_base=OPENAI_API_BASE,
    verbose=True,
)

chatbot = Chatbot(
    model=model,
    description="You are a doctor",
    verbose=True,
)

In [4]:
response = chatbot.chat(
    """Haz un ejemplo de diagnostico, ordenado, poniendo, Diagnostico: (el diagnostico), Evaluación: (el texto completo 
    de la evaluación) y Tratamiento: (el tratamiento utilizado)""",
)

response

Memory: [{'role': 'system', 'content': 'You are a doctor'}, {'role': 'user', 'content': 'Haz un ejemplo de diagnostico, ordenado, poniendo, Diagnostico: (el diagnostico), Evaluación: (el texto completo \n    de la evaluación) y Tratamiento: (el tratamiento utilizado)'}]


Response(message=Message(role='assistant', content='Diagnóstico: Neumonía bacteriana\nEvaluación: La paciente presenta fiebre alta, tos productiva, dificultad para respirar, dolor en el pecho y respiración rápida. Se observa en el examen físico ruidos respiratorios disminuidos en el lóbulo inferior izquierdo del pulmón y radiografía de tórax que muestra una consolidación pulmonar en dicha zona. Los resultados de los cultivos de esputo confirman la presencia de la bacteria Streptococcus pneumoniae. Basado en estos hallazgos, se concluye que la paciente presenta una neumonía bacteriana adquirida en la comunidad.\n\nTratamiento: Se inicia el tratamiento con antibióticos de amplio espectro, específicamente penicilina intravenosa, para cubrir adecuadamente la infección causada por Streptococcus pneumoniae. Se monitoriza su saturación de oxígeno y se suministra oxígeno suplementario si es necesario para mantener una saturación arterial de oxígeno por encima del 95%. Además, se administran an

In [5]:
responses = []

In [8]:
# Asks the chat for 50 responses that have the description of an evaluation and diagnosis
# of a certain disease in a patient.
for _ in range(0, 50):
    response = chatbot.chat(
        """Dame un ejemplo de diagnostico de gripe, con una evaluación diferente a las que me has dado, ordenado, poniendo, 
        Diagnostico: Gripe (la palabra literalmente), Evaluación: (el texto completo de la evaluación) y 
        Tratamiento: (el tratamiento utilizado)""",
    )
    responses.append(response)

Memory: [{'role': 'system', 'content': 'You are a doctor'}, {'role': 'user', 'content': 'Dame un ejemplo de diagnostico de gripe, con una evaluación diferente a las que me has dado, ordenado, poniendo, \n        Diagnostico: Gripe, Evaluación: (el texto completo de la evaluación) y \n        Tratamiento: (el tratamiento utilizado)'}, {'role': 'assistant', 'content': 'Diagnóstico: Gripe\nEvaluación: El paciente presenta fiebre moderada, dolor de garganta, cefalea y malestar general. Ha estado en contacto con personas con síntomas de gripe en los últimos días y ha experimentado un inicio gradual de los síntomas. En el examen físico, se pueden observar signos de inflamación de las amígdalas y posible congestión nasal. Aunque los síntomas respiratorios son leves, la fiebre y el malestar general son consistentes con una gripe. Basado en estos hallazgos clínicos y la temporada actual de influenza, se llega al diagnóstico de gripe.\n\nTratamiento: El tratamiento para la gripe se enfoca princi

In [9]:
responses

[Response(message=Message(role='assistant', content='Diagnóstico: Gripe (Influenza)\nEvaluación: El paciente presenta fiebre alta, malestar general, dolor de cabeza, congestión nasal, dolor de garganta y tos. Ha estado en contacto con personas enfermas de gripe en los últimos días y ha experimentado un inicio repentino de los síntomas. Se observa en el examen físico congestión nasal, faringe enrojecida y ganglios linfáticos cervicales inflamados. Basado en estos hallazgos clínicos y la temporada actual de influenza, se llega a la conclusión de que el paciente presenta una infección por el virus de la gripe.\n\nTratamiento: El tratamiento para la gripe se enfoca principalmente en aliviar los síntomas y reducir el riesgo de complicaciones. Se recomienda que el paciente descanse adecuadamente, tome líquidos en abundancia y se mantenga abrigado. Para el alivio del dolor de cabeza y la congestión nasal, se pueden usar analgésicos de venta libre y descongestionantes nasales, respectivamente.

In [12]:
response_content = []
for element in responses:
    response_content.append(element.message.content)

In [13]:
response_content

['Diagnóstico: Gripe (Influenza)\nEvaluación: El paciente presenta fiebre alta, malestar general, dolor de cabeza, congestión nasal, dolor de garganta y tos. Ha estado en contacto con personas enfermas de gripe en los últimos días y ha experimentado un inicio repentino de los síntomas. Se observa en el examen físico congestión nasal, faringe enrojecida y ganglios linfáticos cervicales inflamados. Basado en estos hallazgos clínicos y la temporada actual de influenza, se llega a la conclusión de que el paciente presenta una infección por el virus de la gripe.\n\nTratamiento: El tratamiento para la gripe se enfoca principalmente en aliviar los síntomas y reducir el riesgo de complicaciones. Se recomienda que el paciente descanse adecuadamente, tome líquidos en abundancia y se mantenga abrigado. Para el alivio del dolor de cabeza y la congestión nasal, se pueden usar analgésicos de venta libre y descongestionantes nasales, respectivamente. Además, se aconseja realizar gárgaras con agua sal

In [24]:
# Preprocess first type of disease to exclude additional 
# information in diagnosis
def preprocess(text):
    text = text.split('Evaluación: ')[1]
    text = text.replace("\n\n","\n")

    return "Evaluación: " + text

In [25]:
response_content = [preprocess(text) for text in response_content]
response_content

['Evaluación: El paciente presenta fiebre alta, malestar general, dolor de cabeza, congestión nasal, dolor de garganta y tos. Ha estado en contacto con personas enfermas de gripe en los últimos días y ha experimentado un inicio repentino de los síntomas. Se observa en el examen físico congestión nasal, faringe enrojecida y ganglios linfáticos cervicales inflamados. Basado en estos hallazgos clínicos y la temporada actual de influenza, se llega a la conclusión de que el paciente presenta una infección por el virus de la gripe.\nTratamiento: El tratamiento para la gripe se enfoca principalmente en aliviar los síntomas y reducir el riesgo de complicaciones. Se recomienda que el paciente descanse adecuadamente, tome líquidos en abundancia y se mantenga abrigado. Para el alivio del dolor de cabeza y la congestión nasal, se pueden usar analgésicos de venta libre y descongestionantes nasales, respectivamente. Además, se aconseja realizar gárgaras con agua salada tibia para aliviar el dolor de

In [26]:
response_content_final = ["Diagnóstico: Gripe\n" + text for text in response_content]
response_content_final[0]

'Diagnóstico: Gripe\nEvaluación: El paciente presenta fiebre alta, malestar general, dolor de cabeza, congestión nasal, dolor de garganta y tos. Ha estado en contacto con personas enfermas de gripe en los últimos días y ha experimentado un inicio repentino de los síntomas. Se observa en el examen físico congestión nasal, faringe enrojecida y ganglios linfáticos cervicales inflamados. Basado en estos hallazgos clínicos y la temporada actual de influenza, se llega a la conclusión de que el paciente presenta una infección por el virus de la gripe.\nTratamiento: El tratamiento para la gripe se enfoca principalmente en aliviar los síntomas y reducir el riesgo de complicaciones. Se recomienda que el paciente descanse adecuadamente, tome líquidos en abundancia y se mantenga abrigado. Para el alivio del dolor de cabeza y la congestión nasal, se pueden usar analgésicos de venta libre y descongestionantes nasales, respectivamente. Además, se aconseja realizar gárgaras con agua salada tibia para 

In [37]:
osteoartritis = []

new_chatbot = Chatbot(
    model=model,
    description="You are a doctor",
    verbose=True,
)

for _ in range(0, 50):
    response = new_chatbot.chat(
        """Dame un ejemplo de diagnostico de osteoartritis, con una evaluación diferente a las que me has dado, ordenado, poniendo, 
        Diagnostico: Osteoartritis, Evaluación: (el texto completo de la evaluación) y 
        Tratamiento: (el tratamiento utilizado)""",
    )
    osteoartritis.append(response)

Memory: [{'role': 'system', 'content': 'You are a doctor'}, {'role': 'user', 'content': 'Dame un ejemplo de diagnostico de osteoartritis, con una evaluación diferente a las que me has dado, ordenado, poniendo, \n        Diagnostico: Osteoartritis, Evaluación: (el texto completo de la evaluación) y \n        Tratamiento: (el tratamiento utilizado)'}, {'role': 'assistant', 'content': 'Diagnóstico: Osteoartritis\n\nEvaluación: Luego de una evaluación exhaustiva, se establece el diagnóstico de osteoartritis basado en los siguientes hallazgos clínicos. El paciente presenta dolor crónico en las articulaciones afectadas, principalmente en las caderas y las manos. El dolor se describe como una sensación de rigidez y molestia que empeora con la actividad física y mejora con el reposo. Durante el examen físico se observa inflamación localizada, hinchazón y sensibilidad en las articulaciones afectadas. Además, se encuentra una disminución en el rango de movimiento y una crepitación característica

In [40]:
asma = []

for _ in range(0, 50):
    response = new_chatbot.chat(
        """Dame un ejemplo de diagnostico de asma, con una evaluación diferente a las que me has dado, ordenado, poniendo, 
        Diagnostico: Asma, Evaluación: (el texto completo de la evaluación) y Tratamiento: (el tratamiento utilizado)""",
    )
    asma.append(response)

Memory: [{'role': 'system', 'content': 'You are a doctor'}, {'role': 'user', 'content': 'Dame un ejemplo de diagnostico de osteoartritis, con una evaluación diferente a las que me has dado, ordenado, poniendo, \n        Diagnostico: Osteoartritis, Evaluación: (el texto completo de la evaluación) y \n        Tratamiento: (el tratamiento utilizado)'}, {'role': 'assistant', 'content': 'Diagnóstico: Osteoartritis\n\nEvaluación: Tras realizar una evaluación clínica minuciosa, se establece el diagnóstico de osteoartritis basado en los siguientes hallazgos. El paciente presenta dolor crónico y rigidez en las articulaciones de las caderas y las rodillas, especialmente después de actividades físicas intensas. El dolor se describe como una sensación de molestia y rigidez matutina que mejora gradualmente con el movimiento. Durante el examen físico, se observa inflamación, sensibilidad y limitación en la amplitud de movimiento de las articulaciones afectadas. Además, las radiografías muestran sign

In [43]:
hepatitis = []

for _ in range(0, 50):
    response = new_chatbot.chat(
        """Dame un ejemplo de diagnostico de hepatitis, con una evaluación diferente a las que me has dado, ordenado, poniendo, 
        Diagnostico: Hepatitis, Evaluación: (el texto completo de la evaluación) y Tratamiento: (el tratamiento utilizado)""",
    )
    hepatitis.append(response)

Memory: [{'role': 'system', 'content': 'You are a doctor'}, {'role': 'user', 'content': 'Dame un ejemplo de diagnostico de hepatitis, con una evaluación diferente a las que me has dado, ordenado, poniendo, \n        Diagnostico: Hepatitis, Evaluación: (el texto completo de la evaluación) y Tratamiento: (el tratamiento utilizado)'}, {'role': 'assistant', 'content': 'Diagnóstico: Hepatitis\n\nEvaluación: Se establece el diagnóstico de hepatitis tras una evaluación clínica y pruebas de laboratorio. El paciente acude al consultorio con síntomas de dolor abdominal, náuseas, vómitos y fiebre. Durante la evaluación física, se observa ictericia en la piel y las mucosas, así como sensibilidad en el hipocondrio derecho. Además, se solicitan pruebas de laboratorio para confirmar el diagnóstico. Los análisis de sangre revelan un aumento en los niveles de transaminasas (ALT y AST), bilirrubina total y directa, así como la presencia de anticuerpos IgM contra el virus de la hepatitis B en la sangre, 

In [45]:
new_new_chatbot = Chatbot(
    model=model,
    description="You are a doctor",
)

cancer_piel = []

for _ in range(0, 50):
    response = new_new_chatbot.chat(
        """Dame un ejemplo de diagnostico de cáncer de piel, con una evaluación diferente a las que me has dado, ordenado, poniendo, 
        Diagnostico: Cáncer de piel, Evaluación: (el texto completo de la evaluación) y Tratamiento: (el tratamiento utilizado)""",
    )
    cancer_piel.append(response)

Memory: [{'role': 'system', 'content': 'You are a doctor'}, {'role': 'assistant', 'content': 'Diagnóstico: Hepatitis\n\nEvaluación: Se establece el diagnóstico de hepatitis tras una evaluación clínica y pruebas de laboratorio. El paciente acude al consultorio con síntomas de malestar general, dolor abdominal, náuseas y fiebre. Durante la evaluación física, se observa ictericia en la piel y las mucosas, así como hepatomegalia y sensibilidad en el hipocondrio derecho. Además, se solicitan pruebas de laboratorio para confirmar el diagnóstico. Los análisis de sangre revelan un aumento en los niveles de transaminasas (ALT y AST), bilirrubina total y directa. También se realiza una ecografía abdominal que muestra signos de inflamación hepática y confirma la presencia de una colelitiasis (cálculos biliares).\n\nTratamiento: El tratamiento de la hepatitis con colelitiasis se enfoca en el manejo de la infección viral y la resolución de la enfermedad de la vesícula biliar. El plan de tratamiento

In [49]:
diabetes = []

for _ in range(0, 50):
    response = new_new_chatbot.chat(
        """Dame un ejemplo de diagnostico de diabetes, con una evaluación diferente a las que me has dado, ordenado, poniendo, 
        Diagnostico: Diabetes, Evaluación: (el texto completo de la evaluación) y Tratamiento: (el tratamiento utilizado)""",
    )
    diabetes.append(response)

Memory: [{'role': 'system', 'content': 'You are a doctor'}, {'role': 'user', 'content': 'Dame un ejemplo de diagnostico de diabetes, con una evaluación diferente a las que me has dado, ordenado, poniendo, \n        Diagnostico: Diabetes, Evaluación: (el texto completo de la evaluación) y Tratamiento: (el tratamiento utilizado)'}, {'role': 'assistant', 'content': 'Diagnóstico: Diabetes\n\nEvaluación: Se establece el diagnóstico de diabetes tras una evaluación clínica y pruebas de diagnóstico. El paciente acude al consultorio con antecedentes familiares de diabetes y síntomas de aumento de la sed, pérdida de peso inexplicada y visión borrosa. Durante la evaluación física, se observa un índice de masa corporal elevado y signos de neuropatía periférica. Además, se solicita una prueba de glucemia en ayunas, que muestra una concentración de glucosa en sangre mayor o igual a 126 mg/dL, confirmando el diagnóstico de diabetes. Se complementa la evaluación con una prueba de hemoglobina A1c, que 

In [53]:
gripe_final = response_content_final
gripe_final

'Diagnóstico: Gripe\nEvaluación: El paciente presenta fiebre alta, malestar general, dolor de cabeza, congestión nasal, dolor de garganta y tos. Ha estado en contacto con personas enfermas de gripe en los últimos días y ha experimentado un inicio repentino de los síntomas. Se observa en el examen físico congestión nasal, faringe enrojecida y ganglios linfáticos cervicales inflamados. Basado en estos hallazgos clínicos y la temporada actual de influenza, se llega a la conclusión de que el paciente presenta una infección por el virus de la gripe.\nTratamiento: El tratamiento para la gripe se enfoca principalmente en aliviar los síntomas y reducir el riesgo de complicaciones. Se recomienda que el paciente descanse adecuadamente, tome líquidos en abundancia y se mantenga abrigado. Para el alivio del dolor de cabeza y la congestión nasal, se pueden usar analgésicos de venta libre y descongestionantes nasales, respectivamente. Además, se aconseja realizar gárgaras con agua salada tibia para 

In [57]:
sida = []

for _ in range(0, 50):
    response = new_new_chatbot.chat(
        """Dame un ejemplo de diagnostico de sida, con una evaluación diferente a las que me has dado, ordenado, poniendo, 
        Diagnostico: Sida, Evaluación: (el texto completo de la evaluación) y Tratamiento: (el tratamiento utilizado)""",
    )
    sida.append(response)

Memory: [{'role': 'system', 'content': 'You are a doctor'}, {'role': 'assistant', 'content': 'Diagnóstico: Diabetes\n\nEvaluación: Se establece el diagnóstico de diabetes tras una evaluación clínica y pruebas de diagnóstico. El paciente acude al consultorio con antecedentes de pérdida de peso inexplicada, cansancio frecuente y aumento de la sed. Durante la evaluación física, se observa un índice de masa corporal normal y signos de sequedad en la piel y mucosas. Se solicita una prueba de glucemia en ayunas, que muestra una concentración de glucosa en sangre mayor o igual a 126 mg/dL, confirmando el diagnóstico de diabetes. Además, se realizan pruebas adicionales, como una prueba de cetonas en orina que muestra niveles elevados de cetonas y una prueba de péptido C que indica una producción reducida de insulina por el páncreas, respaldando el diagnóstico de diabetes tipo 1.\n\nTratamiento: El tratamiento de la diabetes depende del tipo y la gravedad de la enfermedad. En este caso, el trat

In [60]:
def change_to_response_content(category):
    category_final = []
    for element in category:
        category_final.append(element.message.content)

    return category_final

In [61]:
import pickle

# Method to save to pickle file
def save_to_file(title, data):
    with open(f'{title}.pkl', 'wb') as file:
        pickle.dump(data, file)

In [64]:
# Obtain only the content of the response, the text that the chat gave
osteoartritis_final = change_to_response_content(osteoartritis)
asma_final = change_to_response_content(asma)
cancer_piel_final = change_to_response_content(cancer_piel)
hepatitis_final = change_to_response_content(hepatitis)
diabetes_final = change_to_response_content(diabetes)
sida_final = change_to_response_content(sida)

In [67]:
def replace_slash_n(text):
    return text.replace("\n\n", "\n")

In [81]:
import pandas as pd

# Replacing double \n to a single \n
osteoartritis_final = [replace_slash_n(text) for text in osteoartritis_final]
asma_final = [replace_slash_n(text) for text in asma_final]
cancer_piel_final = [replace_slash_n(text) for text in cancer_piel_final]
hepatitis_final = [replace_slash_n(text) for text in hepatitis_final]
diabetes_final = [replace_slash_n(text) for text in diabetes_final]
sida_final = [replace_slash_n(text) for text in sida_final]

In [96]:
# Method to determine the diagnostic part in the text
def diagnostic(text):
    text = text.split("Diagnóstico: ")[1]
    return text.split("Evaluación: ")[0]

In [97]:
# Method to determine the evaluation part in the text
def evaluation(text):
    text = text.split("Evaluación: ")[1]
    return text.split("Tratamiento: ")[0]

In [98]:
# Method to determine the treatment part in the text
def treatment(text):
    return text.split("Tratamiento: ")[1]

In [102]:
def dict_from_list(list_texts):
    dict_texts = {
        'diagnostic': [diagnostic(text) for text in list_texts],
        'evaluation': [evaluation(text) for text in list_texts],
        'treatment': [treatment(text) for text in list_texts]
    }
    return dict_texts

In [104]:
gripe_dict = dict_from_list(gripe_final)
gripe_dict

{'diagnostic': ['Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n',
  'Gripe\n'

In [105]:
# Convert lists to dictionaries
osteoartritis_dict = dict_from_list(osteoartritis_final)
asma_dict = dict_from_list(asma_final)
cancer_piel_dict = dict_from_list(cancer_piel_final)
hepatitis_dict = dict_from_list(hepatitis_final)
diabetes_dict = dict_from_list(diabetes_final)
sida_dict = dict_from_list(sida_final)

In [128]:
gripe_df = pd.DataFrame(gripe_dict)
gripe_df.head()

Unnamed: 0,diagnostic,evaluation,treatment
0,Gripe\n,"El paciente presenta fiebre alta, malestar gen...",El tratamiento para la gripe se enfoca princip...
1,Gripe\n,"El paciente presenta fiebre alta, malestar gen...",Dado que el paciente presenta una neumonía vir...
2,Gripe\n,"El paciente presenta fiebre moderada, congesti...",El tratamiento para la gripe con complicacione...
3,Gripe\n,"El paciente presenta fiebre moderada, malestar...",En el caso de la gripe con complicaciones gast...
4,Gripe\n,"El paciente presenta fiebre alta persistente, ...",El tratamiento para la gripe con complicacione...


In [110]:
# Convert dictionaries to dataframes
osteoartritis_df = pd.DataFrame(osteoartritis_dict)
asma_df = pd.DataFrame(asma_dict)
cancer_piel_df = pd.DataFrame(cancer_piel_dict)
hepatitis_df = pd.DataFrame(hepatitis_dict)
diabetes_df = pd.DataFrame(diabetes_dict)
sida_df = pd.DataFrame(sida_dict)

In [113]:
def get_first_word(text):
    return text.split(' ')[0]

In [116]:
sida_df['diagnostic'] = sida_df['diagnostic'].apply(get_first_word)

In [129]:
def remove_slash_n(text):
    return text.replace('\n', '')

In [130]:
gripe_df['diagnostic'] = gripe_df['diagnostic'].apply(remove_slash_n)
gripe_df.head()

Unnamed: 0,diagnostic,evaluation,treatment
0,Gripe,"El paciente presenta fiebre alta, malestar gen...",El tratamiento para la gripe se enfoca princip...
1,Gripe,"El paciente presenta fiebre alta, malestar gen...",Dado que el paciente presenta una neumonía vir...
2,Gripe,"El paciente presenta fiebre moderada, congesti...",El tratamiento para la gripe con complicacione...
3,Gripe,"El paciente presenta fiebre moderada, malestar...",En el caso de la gripe con complicaciones gast...
4,Gripe,"El paciente presenta fiebre alta persistente, ...",El tratamiento para la gripe con complicacione...


In [136]:
# Removes \n in diagnostics to clean them
osteoartritis_df['diagnostic'] = osteoartritis_df['diagnostic'].apply(remove_slash_n)
asma_df['diagnostic'] = asma_df['diagnostic'].apply(remove_slash_n)
cancer_piel_df['diagnostic'] = cancer_piel_df['diagnostic'].apply(remove_slash_n)
hepatitis_df['diagnostic'] = hepatitis_df['diagnostic'].apply(remove_slash_n)
diabetes_df['diagnostic'] = diabetes_df['diagnostic'].apply(remove_slash_n)

In [162]:
def strip_text(text):
    return text.strip()

In [163]:
# Applies strip to text because of some diagnostic words that had blanks
asma_df['diagnostic'] = asma_df['diagnostic'].apply(strip_text)

In [164]:
asma_df['diagnostic'].value_counts()

diagnostic
Asma    50
Name: count, dtype: int64

In [179]:
# Saving every disease to its own file
save_to_file("gripe_df", gripe_df)
save_to_file("osteoartritis_df", osteoartritis_df)
save_to_file("asma_df", asma_df)
save_to_file("cancer_piel_df", cancer_piel_df)
save_to_file("hepatitis_df", hepatitis_df)
save_to_file("diabetes_df", diabetes_df)
save_to_file("sida_df", sida_df)