#### Test sending text from pdfs to Asi One to find if the pacient has cancer 

In [1]:
from utils import extract_text_from_pdf
from asi_mini import call_asi_one_chatbot

In [None]:
pdf_path = "../medical_results/result_1.pdf"
pdf_text = extract_text_from_pdf(pdf_path)

In [19]:
INITIAL_PROMPT = {
    "role":"system",
    "content": """
    You are a medically-aware assistant that reviews and interprets pathology reports related to cancer, especially histopathology results.

Your primary goals are:

    Determine if the report indicates the presence or absence of cancer.

    Explain the findings in plain, compassionate language suitable for a patient with no medical background.

    Clearly state if the result is benign, malignant, or uncertain — but without making a medical diagnosis.

    Suggest the appropriate next steps, such as consulting a specialist, follow-up tests, or regular monitoring.

    Caution the user that only a licensed physician can make a definitive diagnosis and treatment plan.

You must:

    Make sure the answer is shorter than 1000 tokens

    Be clear, kind, and respectful in tone.

    Avoid technical jargon unless you explain it.

    Never give false reassurance or absolute conclusions.

    Never suggest or recommend specific treatments.

If the report is benign (e.g., fibroadenoma), reassure the user that it is non-cancerous and explain what that means.
If the report shows cancer, explain gently, and suggest seeing an oncologist.
If the results are unclear, guide the user to follow up with their doctor.
"""
}

In [20]:
print(
    call_asi_one_chatbot(
    [
        INITIAL_PROMPT,
        {"role": "user", "content": pdf_text}
    ], 1000
    )
)

Din buletinul histopatologic analizat, concluzia este că există un **carcinom mamar invaziv, NST (non-specific type), slab diferențiat**. Acesta este un tip de cancer de sân. 

În plus, profilul imunohistochimic arată următoarele:

- **RE (receptor de estrogeni)**: pozitiv doar în 20%, intensitate moderată
- **RP (receptor de progesteron)**: pozitiv în 2%, intensitate mare
- **Ki67**: în jur de 50%, ceea ce indică o activitate celulară mare (creștere rapidă)
- **HER2**: negativ

Acest tip de cancer este **slab diferențiat**, ceea ce înseamnă că celulele tumorale seamănă puțin cu celulele normale ale sânului și pot avea un comportament mai agresiv. Scorul Biologic Nottingham de 9 și scorul Grades Biologice de 3 confirmă acest lucru.

### Ce înseamnă asta pentru dumneavoastră?

Această analiză indică prezența unui **cancer de sân invaziv**, adică o tumoră care poate crește și se poate extinde în afara glandei mamare. Este important de reținut că **numai medicul dumneavoastră curant sau u

In [38]:
pdf_path = "../medical_results/result_1.pdf"
pdf_text = extract_text_from_pdf(pdf_path)

In [39]:
print(
    call_asi_one_chatbot(
    [
        INITIAL_PROMPT,
        {"role": "user", "content": pdf_text}
    ], 1000
    )
)

Din raportul de histopatologie analizat, rezultă următoarele:

### Concluzie principală:
**A fost identificat un fibroadenom mamar.**  
Aceasta este o **leziune benignă (necanceroasă)** a sânului, ceea ce înseamnă că nu este cancer și nu este o amenințare imediată pentru sănătate.

### Ce este un fibroadenom?
Fibroadenomul este un tip comun de tumoră benignă la nivelul sânilor, formată din țesut conjunctiv și glandular. Este de obicei:
- Rotunjor, bine delimitat,
- Mobil la palpare,
- De consistență fermă.

Este frecvent la femeile tinere (sub 35 de ani), poate varia în dimensiune și nu are, de regulă, potențial de a deveni canceros.

### Ce arată raportul?
- Fibroadenom *peri- și intracanalicular* – este o formă obișnuită, cu structuri atrase în jurul și în interiorul ductelor galactofore.
- Hiperplazie epitelială redusă – modificări minore la nivelul celulelor ductale, dar nu agresive.
- S-au observat și **mici chisturi mamare** și o **inflamație limitată**.
  
Toate acestea sunt con

### Testing with "knowledge base"

In [23]:
data_path_1 = "../data/stage_0_breast-patient.pdf"
data_1 = extract_text_from_pdf(data_path_1)

In [31]:
PROMPT_TO_ANSWER_FROM_PDF = {
    "role":"system", "content":
    """
    You are a medical assistant that interprets cancer-related pathology reports (such as histopathology results) provided to you as PDF content by the system.

    Your response must:

        Use only the information from the PDF — do not ask the user for more details or follow-up input.

        Briefly state whether the report suggests:

            a benign finding (e.g., fibroadenoma),

            a malignant (cancerous) finding, or

            an inconclusive or unclear result.

        Explain the meaning in plain, simple language (no unexplained jargon).

        Suggest appropriate next steps such as consulting a doctor or scheduling a follow-up — without giving medical advice or making a diagnosis.

        Remind the user that only a licensed physician can confirm the diagnosis and recommend treatment.

    Keep responses:

        Concise (under 200 words)

        Compassionate and professional

        Strictly based on the PDF report provided at all costs. If the user asks follow-up or related questions, respond only using the context and documents you were provided. If the answer is not available, reply:

“I’m sorry, I don’t have that information.”

Do not rely on user messages or questions — respond based solely on the content in the PDF.

""" + data_1
}

In [34]:
print(call_asi_one_chatbot(
    [
        PROMPT_TO_ANSWER_FROM_PDF,
        {"role": "user", "content": pdf_path},
    ] ,1000
))

Based on the PDF content provided:

- **Cancer Type**: Ductal Carcinoma In Situ (DCIS)
- **Nature of the Report**: Educational and guidance resource for patients diagnosed with DCIS, based on the NCCN Clinical Practice Guidelines in Oncology (NCCN Guidelines®) for Breast Cancer.
- **Focus**: Understanding DCIS, testing methods, treatment planning, surgical and other therapeutic options, and supportive care resources.

### Summary of Key Information:

**1. Benign, Malignant, or Inconclusive?**
- **Findings**: The document clearly outlines that DCIS is a **malignant** (cancerous) condition, albeit **noninvasive**.

**2. What is DCIS?**
- Ductal Carcinoma In Situ (DCIS) is a condition where abnormal cells are found in the lining of the breast ducts but have not spread outside these ducts into nearby breast tissue. It is described as stage 0 or noninvasive cancer.

**3. Explanation in Simple Language:**
- DCIS is a type of breast cancer that is in its earliest stage. The cells are abnormal