# Retrieval Augmented Generation


## Setup


In [1]:
%pip install -U llama-index
%pip install -U llama-index-embeddings-huggingface
%pip install -U pinecone
%pip install -U llama-index-vector-stores-pinecone
%pip install -U deepeval
%pip install -U llama-index-llms-anthropic
%pip install llama-index-llms-openai

Collecting llama-index
  Downloading llama_index-0.10.56-py3-none-any.whl (6.8 kB)
Collecting llama-index-agent-openai<0.3.0,>=0.1.4 (from llama-index)
  Downloading llama_index_agent_openai-0.2.9-py3-none-any.whl (13 kB)
Collecting llama-index-cli<0.2.0,>=0.1.2 (from llama-index)
  Downloading llama_index_cli-0.1.12-py3-none-any.whl (26 kB)
Collecting llama-index-core==0.10.56 (from llama-index)
  Downloading llama_index_core-0.10.56-py3-none-any.whl (15.5 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m15.5/15.5 MB[0m [31m29.9 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting llama-index-embeddings-openai<0.2.0,>=0.1.5 (from llama-index)
  Downloading llama_index_embeddings_openai-0.1.11-py3-none-any.whl (6.3 kB)
Collecting llama-index-indices-managed-llama-cloud>=0.2.0 (from llama-index)
  Downloading llama_index_indices_managed_llama_cloud-0.2.5-py3-none-any.whl (9.3 kB)
Collecting llama-index-legacy<0.10.0,>=0.9.48 (from llama-index)
  Downloading llama_index_le

In [2]:
import os

from llama_index.embeddings.huggingface import HuggingFaceEmbedding
from llama_index.llms.anthropic import Anthropic
from llama_index.core import VectorStoreIndex
import numpy as np
import json
from llama_index.core.schema import TextNode
from llama_index.core.retrievers import VectorIndexRetriever
from llama_index.vector_stores.pinecone import PineconeVectorStore
from pinecone import Pinecone, ServerlessSpec
from google.colab import userdata
from llama_index.llms.openai import OpenAI


PINECONE_API_KEY = userdata.get("PINECONE_API_KEY")
GITHUB_TOKEN = userdata.get('GITHUB_TOKEN')
ANTHROPIC_API_KEY = userdata.get("ANTHROPIC_API_KEY")
OPENAI_API_KEY = userdata.get("OPENAI_API_KEY")

In [3]:
!git clone https://$GITHUB_TOKEN@github.com/J-Gann/medfluencer.git

Cloning into 'medfluencer'...
remote: Enumerating objects: 98, done.[K
remote: Counting objects: 100% (98/98), done.[K
remote: Compressing objects: 100% (85/85), done.[K
remote: Total 98 (delta 35), reused 64 (delta 12), pack-reused 0[K
Receiving objects: 100% (98/98), 9.40 MiB | 6.71 MiB/s, done.
Resolving deltas: 100% (35/35), done.
Filtering content: 100% (27/27), 13.51 GiB | 39.67 MiB/s, done.


In [4]:
embed_model = HuggingFaceEmbedding(
    model_name="T-Systems-onsite/cross-en-de-roberta-sentence-transformer"
)



config.json:   0%|          | 0.00/541 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.11G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/188 [00:00<?, ?B/s]

sentencepiece.bpe.model:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/150 [00:00<?, ?B/s]

In [5]:
llm = Anthropic(
    model="claude-3-5-sonnet-20240620",
    api_key=ANTHROPIC_API_KEY,
    max_tokens=4096,
)

In [6]:
pc = Pinecone(api_key=PINECONE_API_KEY)

pinecone_index = pc.Index("medfluencer-videos-index-t-systems")
vector_store = PineconeVectorStore(pinecone_index=pinecone_index)
index_videos = VectorStoreIndex.from_vector_store(vector_store, embed_model=embed_model)

pinecone_index = pc.Index("medfluencer-comments-index-t-systems")
vector_store = PineconeVectorStore(pinecone_index=pinecone_index)
index_comments = VectorStoreIndex.from_vector_store(
    vector_store, embed_model=embed_model
)

#### Retriever


In [7]:
retriever_videos = VectorIndexRetriever(
    index=index_videos,
    similarity_top_k=20,
)

In [8]:
retriever_comments = VectorIndexRetriever(
    index=index_comments,
    similarity_top_k=20,
)

### Reranking


In [9]:
from llama_index.core.postprocessor import SentenceTransformerRerank

rerank = SentenceTransformerRerank(
    model="cross-encoder/msmarco-MiniLM-L6-en-de-v1", top_n=5
)

config.json:   0%|          | 0.00/840 [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/428M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/541 [00:00<?, ?B/s]

sentencepiece.bpe.model:   0%|          | 0.00/5.07M [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/9.10M [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/150 [00:00<?, ?B/s]

### Query Engine


In [10]:
from llama_index.core import get_response_synthesizer
from llama_index.core.query_engine import RetrieverQueryEngine

In [11]:
response_synthesizer = get_response_synthesizer(llm=llm)

query_engine_videos = RetrieverQueryEngine(
    retriever=retriever_videos,
    response_synthesizer=response_synthesizer,
    node_postprocessors=[rerank],
)

query_engine_comments = RetrieverQueryEngine(
    retriever=retriever_comments,
    response_synthesizer=response_synthesizer,
    node_postprocessors=[rerank],
)

# Evaluation


In [12]:
import json

#### Generate questions


In [13]:
with open("medfluencer/medical_fields.json", "r", encoding="UTF-8") as file:
    medical_fields = json.load(file)

In [14]:
from collections import defaultdict

In [None]:
# Generates questions for each medical field

# field_questions = defaultdict(list)
# num_questions = 5
# for field in medical_fields:
#    for _ in range(num_questions):
#        question = llm.complete(
#            f"Generiere eine medizinische Frage eines Laiens, die medizinischem Personal (Arthelferin, Arzt) typischerweise in folgenden Fachbereich gestellt wird: {field}\n Antworte ausschließlich mit der Frage!"
#        ).text
#        field_questions[field].append(question)
# with open("evaluation/questions_per_field.json", "w") as file:
#    json.dump(field_questions, file)

In [15]:
with open("medfluencer/evaluation/questions_per_field.json", "r") as file:
    field_questions = json.load(file)

In [None]:
# answers_per_field = defaultdict(list)
# for field, questions in field_questions.items():
#    for question in questions:
#        res = query_engine.query(question)
#        answer = res.response
#        context = [node.text for node in res.source_nodes]
#        answers_per_field[field].append((answer, context))
# with open("evaluation/answers_per_field.json", "w") as file:
#    json.dump(answers_per_field, file)

In [16]:
with open("medfluencer/evaluation/answers_per_field.json", "r") as file:
    answers_per_field = json.load(file)

#### DeepEval


In [17]:
from deepeval import evaluate
from deepeval.metrics import (
    AnswerRelevancyMetric,
    FaithfulnessMetric,
    ContextualRelevancyMetric,
    HallucinationMetric,
)
from deepeval.test_case import LLMTestCase

In [18]:
test_cases_per_field = defaultdict(list)

for field, questions in field_questions.items():
    for idx, question in enumerate(questions):
        actual_output, retrieval_context = answers_per_field[field][idx]
        test_case = LLMTestCase(
            input=question,
            actual_output=actual_output,
            retrieval_context=retrieval_context,
            context=retrieval_context,
        )

        test_cases_per_field[field].append(test_case)

In [19]:
len(list(test_cases_per_field.keys())) * 10 * 4

2520

In [24]:
from deepeval.models.base_model import DeepEvalBaseLLM

class Claude(DeepEvalBaseLLM):
    def __init__(
        self
    ):
        self.model = Anthropic(
            model="claude-3-5-sonnet-20240620",
            api_key=ANTHROPIC_API_KEY,
            max_tokens=4096,
        )

    def load_model(self):
        return self.model

    def generate(self, prompt: str) -> str:
        model = self.load_model()

        res = model.complete(prompt)
        return res.text

    async def a_generate(self, prompt: str) -> str:
        return self.generate(prompt)

    def get_model_name(self):
        return "claude-3-5-sonnet-20240620"


class GPT4mini(DeepEvalBaseLLM):
    def __init__(
        self
    ):
        self.model = OpenAI(temperature=0, model="gpt-4o-mini", api_key=OPENAI_API_KEY)


    def load_model(self):
        return self.model

    def generate(self, prompt: str) -> str:
        model = self.load_model()

        res = model.complete(prompt)
        return res.text

    async def a_generate(self, prompt: str) -> str:
        return self.generate(prompt)

    def get_model_name(self):
        return "claude-3-5-sonnet-20240620"

In [None]:
import pickle

model = GPT4mini()

answer_relevancy_metric = AnswerRelevancyMetric(
    threshold=0.6,
    model=model,
    include_reason=False
)

faithfulness_metric = FaithfulnessMetric(
    threshold=0.6,
    model=model,
    include_reason=False
)

contextual_relevancy_metric = ContextualRelevancyMetric(
    threshold=0.6,
    model=model,
    include_reason=False
)

hallucination_metric = HallucinationMetric(
    threshold=0.5,
    model=model,
    include_reason=False
)

evaluations = {}

for field, test_case in test_cases_per_field.items():

    evaluation = evaluate(
        test_case,
        [
            answer_relevancy_metric,
            faithfulness_metric,
            contextual_relevancy_metric,
            hallucination_metric,
        ],
    )

    evaluations[field] = evaluation

    with open("medfluencer/evaluation/evaluation_metrics_rag.pkl", "wb") as file:
        pickle.dump(evaluations, file)

Output()

Evaluating test cases...
Event loop is already running. Applying nest_asyncio patch to allow async execution...


Output()

Output()

Output()

Output()



Metrics Summary

  - ✅ Answer Relevancy (score: 1.0, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ✅ Faithfulness (score: 1.0, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ✅ Contextual Relevancy (score: 1.0, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ❌ Hallucination (score: 0.6, threshold: 0.5, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)

For test case:

  - input: Wie kann ich meine Rückenschmerzen lindern?
  - actual output: Es gibt mehrere Möglichkeiten, Rückenschmerzen zu lindern:

1. Bewegung: Bleiben Sie aktiv und vermeiden Sie längere Bettruhe. Regelmäßige Bewegung ist wichtig für einen gesunden Rücken.

2. Ausgewogene Belastung: Achten Sie auf ein gutes Verhältnis zwischen Belastung und Entlastung Ihres Rückens.

3. Schmerzmittel: Bei starken Sch

Output()

Evaluating test cases...
Event loop is already running. Applying nest_asyncio patch to allow async execution...


Output()

Output()

Output()

Output()



Metrics Summary

  - ❌ Answer Relevancy (score: 0.25, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ✅ Faithfulness (score: 1.0, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ❌ Contextual Relevancy (score: 0.0, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ❌ Hallucination (score: 1.0, threshold: 0.5, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)

For test case:

  - input: Was sind mögliche Nebenwirkungen der Vollnarkose?
  - actual output: Es tut mir leid, aber die gegebenen Informationen enthalten keine Angaben zu möglichen Nebenwirkungen einer Vollnarkose. Der Text behandelt hauptsächlich Themen wie obstruktive Schlafapnoe, Schlafstörungen und Schlafmittelabhängigkeit. Ohne zusätzliche relevante Informationen kann ich keine zuverlässige Antwort zu Nebenwirku

Output()

Evaluating test cases...
Event loop is already running. Applying nest_asyncio patch to allow async execution...


Output()



Output()

Output()

Output()



Metrics Summary

  - ✅ Answer Relevancy (score: 0.875, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ✅ Faithfulness (score: 0.8333333333333334, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ✅ Contextual Relevancy (score: 0.6, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ❌ Hallucination (score: 0.75, threshold: 0.5, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)

For test case:

  - input: Wo genau befindet sich die Bauchspeicheldrüse im Körper?
  - actual output: Die Bauchspeicheldrüse befindet sich tief im Zentrum des Bauches, kurz vor der Wirbelsäule. Sie ist von Blutgefäßen umgeben, die den Darm und die Leber mit Blut versorgen. Ihre genaue Position macht sie zu einem zentralen Verdauungsorgan, das jedoch nicht so leicht zu lokalisieren ist wie beispielswei

Output()

Evaluating test cases...
Event loop is already running. Applying nest_asyncio patch to allow async execution...


Output()

Output()

Output()

Output()



Metrics Summary

  - ✅ Answer Relevancy (score: 1.0, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ✅ Faithfulness (score: 1.0, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ✅ Contextual Relevancy (score: 0.8, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ✅ Hallucination (score: 0.0, threshold: 0.5, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)

For test case:

  - input: Kann langes Sitzen am Schreibtisch zu Rückenschmerzen führen und wie kann man dem vorbeugen?
  - actual output: Ja, langes Sitzen am Schreibtisch kann definitiv zu Rückenschmerzen führen. Dies ist besonders problematisch für Menschen, die viel am Computer arbeiten müssen. Häufig entstehen dadurch Verspannungen im Nacken- und Schulterbereich sowie eine eingeschränkte Beweglichkeit.

Um dem vorz

In [56]:
import pickle
with open("medfluencer/evaluation/evaluation_metrics_rag.pkl", "rb") as file:
    evaluation_ = pickle.load(file)

In [57]:
evaluation_

{'Allgemeinmedizin': [TestResult(success=False, metrics_metadata=[MetricMetadata(metric='Answer Relevancy', threshold=0.6, success=True, score=1.0, reason=None, strict_mode=False, evaluation_model='claude-3-5-sonnet-20240620', error=None, evaluation_cost=None, verbose_logs='Statements:\n[\n    "Es gibt mehrere Möglichkeiten, Rückenschmerzen zu lindern:",\n    "Bewegung: Bleiben Sie aktiv und vermeiden Sie längere Bettruhe.",\n    "Regelmäßige Bewegung ist wichtig für einen gesunden Rücken.",\n    "Ausgewogene Belastung: Achten Sie auf ein gutes Verhältnis zwischen Belastung und Entlastung Ihres Rückens.",\n    "Schmerzmittel: Bei starken Schmerzen können vorübergehend Medikamente helfen, um Alltagsaktivitäten zu erleichtern.",\n    "Wärmebehandlung: Wärmeanwendungen können zur Schmerzlinderung beitragen.",\n    "Akupunktur: Diese Methode kann für manche Menschen hilfreich sein.",\n    "Dehnübungen: Einfache Dehnübungen, wie das Strecken der Vorderseite für 1-1,5 Minuten, können Verspan

In [33]:

evaluation = evaluate(
    test_cases_per_field["Allgemeinmedizin"],
    [
        answer_relevancy_metric,
        faithfulness_metric,
        contextual_relevancy_metric,
        hallucination_metric,
    ],
)



Output()

Evaluating test cases...
Event loop is already running. Applying nest_asyncio patch to allow async execution...


Output()

Output()

Output()

Output()



Metrics Summary

  - ✅ Answer Relevancy (score: 1.0, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ✅ Faithfulness (score: 1.0, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ✅ Contextual Relevancy (score: 1.0, threshold: 0.6, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)
  - ❌ Hallucination (score: 0.8, threshold: 0.5, strict: False, evaluation model: claude-3-5-sonnet-20240620, reason: None, error: None)

For test case:

  - input: Wie kann ich meine Rückenschmerzen lindern?
  - actual output: Es gibt mehrere Möglichkeiten, Rückenschmerzen zu lindern:

1. Bewegung: Bleiben Sie aktiv und vermeiden Sie längere Bettruhe. Regelmäßige Bewegung ist wichtig für einen gesunden Rücken.

2. Ausgewogene Belastung: Achten Sie auf ein gutes Verhältnis zwischen Belastung und Entlastung Ihres Rückens.

3. Schmerzmittel: Bei starken Sch

AttributeError: 'list' object has no attribute 'success'

In [50]:
import pickle
with open("medfluencer/evaluation/evaluation_metrcis_rag.json", "wb") as file:
    pickle.dump(evaluation, file)

In [51]:
import pickle
with open("medfluencer/evaluation/evaluation_metrcis_rag.json", "rb") as file:
    evaluation_ = pickle.load(file)

In [52]:
evaluation_

[TestResult(success=False, metrics_metadata=[MetricMetadata(metric='Answer Relevancy', threshold=0.6, success=True, score=1.0, reason=None, strict_mode=False, evaluation_model='claude-3-5-sonnet-20240620', error=None, evaluation_cost=None, verbose_logs='Statements:\n[\n    "Es gibt mehrere Möglichkeiten, Rückenschmerzen zu lindern:",\n    "Bewegung: Bleiben Sie aktiv und vermeiden Sie längere Bettruhe.",\n    "Regelmäßige Bewegung ist wichtig für einen gesunden Rücken.",\n    "Ausgewogene Belastung: Achten Sie auf ein gutes Verhältnis zwischen Belastung und Entlastung Ihres Rückens.",\n    "Schmerzmittel: Bei starken Schmerzen können vorübergehend Medikamente helfen, um Alltagsaktivitäten zu erleichtern.",\n    "Wärmebehandlung: Wärmeanwendungen können zur Schmerzlinderung beitragen.",\n    "Akupunktur: Diese Methode kann für manche Menschen hilfreich sein.",\n    "Dehnübungen: Einfache Dehnübungen, wie das Strecken der Vorderseite für 1-1,5 Minuten, können Verspannungen lösen.",\n    

In [46]:
evaluations = defaultdict(list)

for sample in evaluation:
    for metric in sample.metrics_metadata:
        evaluations["Allgemeinmedizin"].append({"success": metric.success, "metric": metric.metric, "score": metric.score})

In [49]:
evaluation

[TestResult(success=False, metrics_metadata=[MetricMetadata(metric='Answer Relevancy', threshold=0.6, success=True, score=1.0, reason=None, strict_mode=False, evaluation_model='claude-3-5-sonnet-20240620', error=None, evaluation_cost=None, verbose_logs='Statements:\n[\n    "Es gibt mehrere Möglichkeiten, Rückenschmerzen zu lindern:",\n    "Bewegung: Bleiben Sie aktiv und vermeiden Sie längere Bettruhe.",\n    "Regelmäßige Bewegung ist wichtig für einen gesunden Rücken.",\n    "Ausgewogene Belastung: Achten Sie auf ein gutes Verhältnis zwischen Belastung und Entlastung Ihres Rückens.",\n    "Schmerzmittel: Bei starken Schmerzen können vorübergehend Medikamente helfen, um Alltagsaktivitäten zu erleichtern.",\n    "Wärmebehandlung: Wärmeanwendungen können zur Schmerzlinderung beitragen.",\n    "Akupunktur: Diese Methode kann für manche Menschen hilfreich sein.",\n    "Dehnübungen: Einfache Dehnübungen, wie das Strecken der Vorderseite für 1-1,5 Minuten, können Verspannungen lösen.",\n    

In [48]:
evaluations["Allgemeinmedizin"]

[{'success': True, 'metric': 'Answer Relevancy', 'score': 1.0},
 {'success': True, 'metric': 'Faithfulness', 'score': 1.0},
 {'success': True, 'metric': 'Contextual Relevancy', 'score': 1.0},
 {'success': False, 'metric': 'Hallucination', 'score': 0.8},
 {'success': True, 'metric': 'Answer Relevancy', 'score': 1.0},
 {'success': True, 'metric': 'Faithfulness', 'score': 1.0},
 {'success': True, 'metric': 'Contextual Relevancy', 'score': 0.6},
 {'success': True, 'metric': 'Hallucination', 'score': 0.0},
 {'success': True, 'metric': 'Answer Relevancy', 'score': 0.9375},
 {'success': True, 'metric': 'Faithfulness', 'score': 0.8461538461538461},
 {'success': False, 'metric': 'Contextual Relevancy', 'score': 0.4},
 {'success': True, 'metric': 'Hallucination', 'score': 0.2},
 {'success': True, 'metric': 'Answer Relevancy', 'score': 1.0},
 {'success': True, 'metric': 'Faithfulness', 'score': 1.0},
 {'success': False, 'metric': 'Contextual Relevancy', 'score': 0.2},
 {'success': False, 'metric'

In [32]:
evaluation[0].success

True

In [30]:
with open("medfluencer/evaluation/evaluation_metrcis_rag.json", "w") as file:
    json.dump(evaluation, file)

TypeError: Object of type TestResult is not JSON serializable

In [None]:
evaluation

[TestResult(success=False, metrics_metadata=[MetricMetadata(metric='Answer Relevancy', threshold=0.7, success=True, score=0.8571428571428571, reason='The score is 0.86 because while the answer is relevant and provides some helpful tips on dealing with anxiety disorders, there is a statement in the output that does not contribute any useful information to addressing the question.', strict_mode=False, evaluation_model='gpt-3.5-turbo', error=None, evaluation_cost=0.0014895), MetricMetadata(metric='Faithfulness', threshold=0.7, success=False, score=0.6, reason='The score is 0.60 because the actual output includes contradictions such as focusing on values and goals in life being more important than anxiety, and the idea that relying too much on coping strategies that provide short-term relief is not recommended.', strict_mode=False, evaluation_model='gpt-3.5-turbo', error=None, evaluation_cost=0.0031345), MetricMetadata(metric='Contextual Relevancy', threshold=0.7, success=True, score=0.8, 

TODO: Evaluate different answers for expert or layman (how relevant is the context in each case?)

TODO: Evaluate standard llm answers

TODO: Generate suitable test queries for comments

TODO: test video questions and comment questions on other datasets

TODO: evaluate cobined query engine on both questions


In [None]:
from llama_index.core import VectorStoreIndex
import numpy as np
import json
from llama_index.core.schema import TextNode

In [None]:
question = "Was hilft bei Ohrenentzündung?"

In [None]:
retrieved_nodes = retriever.retrieve(question)

In [None]:
for node in retrieved_nodes:
    print(node.text)

how do I get rid of pain in my ear pain
can be caused by things like an
infection a blockage in the ear canal or
an injury sometimes you can alleviate
the pain by applying a warm compress
such as putting a warm cloth over the
affected ear to help reduce pain
non-prescription drugs like
acetaminophen can help and even more so
when it comes to NSAID medications so
things like ibuprofen Advil Aleve
naproxen and the like just know that
every medication has the potential for
side effects sometimes ear drops can
help just remember to follow the
directions on the packaging it's best to
keep the hurt ear or the injured ear up
so when you're lying down try to keep
that injured ear facing up to relieve
pressure and swelling there are certain
red flags that you should be aware of
that indicate you may need to seek
urgent medical attention red flags
include severe pain if the pain lasts
for a long time or if it comes with
Associated discharge or hearing loss
antibiotics may be needed for example t

In [None]:
from llama_index.core.llms import ChatMessage

In [None]:
summaries = []
for node in retrieved_nodes[:5]:
    res = llm.chat(
        [
            ChatMessage(
                role="system",
                content=f"Summarize the content of the given document which is relevant for the question '{question}'",
            ),
            ChatMessage(role="user", content=node.text),
        ]
    )
    summaries.append(res.message.content)

In [None]:
summaries

['Hier sind die wichtigsten Punkte, die bei einer Ohrenentzündung helfen können:\n\n- Warme Kompressen auf dem betroffenen Ohr können die Schmerzen lindern.\n\n- Nicht-verschreibungspflichtige Schmerzmittel wie Acetaminophen oder NSAID-Medikamente (Ibuprofen, Naproxen etc.) können die Schmerzen reduzieren.\n\n- Ohrentropfen können ebenfalls hilfreich sein, aber die Anweisungen auf der Packung müssen beachtet werden.\n\n- Das betroffene Ohr nach oben halten, wenn man liegt, um Druck und Schwellungen zu verringern.\n\n- Bei starken anhaltenden Schmerzen, Ausfluss oder Hörverlust sollte dringend ein Arzt aufgesucht werden, da eventuell Antibiotika zur Behandlung einer bakteriellen Infektion nötig sind.\n\nDie Hauptempfehlungen sind also warme Kompressen, Schmerzmittel, Ohrentropfen und das Ohr nach oben halten. Bei Alarmsignalen wie starken Schmerzen oder Komplikationen ist ein Arztbesuch angeraten.',
 'Der gegebene Text behandelt nicht die Frage "Was hilft bei Ohrenentzündung?". Er besch