In [1]:
import os
import chromadb
from chromadb.config import Settings
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.vectorstores import Chroma
from langchain.chat_models import ChatOpenAI
from langchain.schema.runnable import RunnablePassthrough
from langchain.prompts import PromptTemplate
from langchain.schema import StrOutputParser
from langchain.schema.prompt_template import format_document
import json

In [2]:
DATA_LOCATION = os.environ.get("DATA_LOCATION")
OPENAI_API_KEY = os.environ.get("OPENAI_API_KEY")

## 1. Lade die collections

In [3]:
persistent_client = chromadb.PersistentClient(
    path=f"{DATA_LOCATION}/chroma_db", 
    settings=Settings(allow_reset=True)
)
embedding_function = OpenAIEmbeddings(
    api_key=OPENAI_API_KEY,
    model_name="text-embedding-ada-002"
)

teaser_db = Chroma(
    client=persistent_client,
    collection_name="story_teaser",
    embedding_function=embedding_function,
)
statement_db = Chroma(
    client=persistent_client,
    collection_name="story_statement",
    embedding_function=embedding_function,
)

                    api_key was transferred to model_kwargs.
                    Please confirm that api_key is what you intended.
                    model_name was transferred to model_kwargs.
                    Please confirm that model_name is what you intended.


In [4]:
print("Es gibt", teaser_db._collection.count(), "Dokumente in 'teaser_db' und", statement_db._collection.count(), "Dokumente in 'statement_db'. Dokumente sind in diesem Kontext Teile der Texte und keine vollständige Teaser oder Statements")

Es gibt 2635 Dokumente in 'teaser_db' und 16980 Dokumente in 'statement_db'. Dokumente sind in diesem Kontext Teile der Texte und keine vollständige Teaser oder Statements


## 2. Abfrage

In [5]:
query = "Was sind die Erklärungen fur den Insektenrückgang"
teaser_retriever = teaser_db.as_retriever()
statement_retriever = statement_db.as_retriever()

In [6]:
teaser_results = teaser_retriever.invoke(query)
statement_results = statement_retriever.invoke(query)

In [7]:
print("Es wurden", len(teaser_results), "Dokumente in 'teaser_db' zu der Query gefunden. Hier sind sie:")

Es wurden 4 Dokumente in 'teaser_db' zu der Query gefunden. Hier sind sie:


In [8]:
for i, r in enumerate(teaser_results):
    print(i)
    print('"', r.page_content, '"')
    print("")
    print("Die Metadaten dazu: ")
    print(r.metadata)
    print("---")

0
" Metastudie sucht nach Ursachen für Insektenrückgang "

Die Metadaten dazu: 
{'publication_date': '2023-08-23', 'ressort': 'Klima & Umwelt', 'source': '/workspace/data/story_teaser/23140.txt', 'start_index': 0, 'story_no': 23140, 'type': 'Research in Context', 'url': 'https://www.sciencemediacenter.de/alle-angebote/research-in-context/details/news/metastudie-sucht-nach-ursachen-fuer-insektenrueckgang/'}
---
1
" Auf der Suche nach möglichen Ursachen für den Rückgang der terrestrischen Insekten finden die Autoren eine Verbindung zur intensivierten Landnutzung und keinen Einfluss durch den Klimawandel. Als mögliche Erklärung für den global positiven Trend der Süßwasserinsekten sehen sie zum einen die häufig verbesserte Wasserqualität durch konsequentere Wasserschutzgesetze. Zum anderen spielten die durch den Klimawandel steigenden Temperaturen und ein Nährstoffüberangebot durch Einträge aus der Landwirtschaft eine mögliche Rolle.

Die Ergebnisse wurden im Fachjournal „Science“ publizie

In [9]:
print("Es wurden", len(statement_results), "Dokumente in 'statement_db' zu der Query gefunden. Hinweis: allen Statements wurde den Story-Titel hinzugefügt. Hier sind sie:")

Es wurden 4 Dokumente in 'statement_db' zu der Query gefunden. Hinweis: allen Statements wurde den Story-Titel hinzugefügt. Hier sind sie:


In [10]:
for i, r in enumerate(statement_results):
    print(i)
    print('"', r.page_content, '"')
    print("")
    print("Die Metadaten dazu: ")
    print(r.metadata)
    print("---")

0
" Erklärt das Wetter den Insektenrückgang?

Die aktuelle Studie befasst sich mit der Frage, wie der in der Krefeld-Studie [1] beobachtete Rückgang in der Biomasse an Insekten in Malaise-Fallenin Naturschutzgebietenzu erklären ist. Die Autoren kommen zu dem Schluss, dass das Wetter und damit letztlich der Klimawandel die Abnahme verursacht hat. Dabei unterschlagen sie, dass die Landwirtschaft in ihren eigenen Analysen einen ebenso großen Einfluss auf die Daten hat. Die Studie stützt also die Hypothese, dass Klimawandel und Landwirtschaft gleichermaßen den Rückgang der Insekten verursacht haben. Dies gilt allerdings nur, wenn man davon ausgeht, dass die Studie korrekt durchgeführt wurde, woran man auch Zweifel haben kann.

Methodik "

Die Metadaten dazu: 
{'expert_affiliation': 'Professor für Chemische Ökologie, Leiter Fachgebiet Chemische Ökologie, Institut für Biologie, Fakultät Naturwissenschaften, Universität Hohenheim, Stuttgart', 'expert_name': 'Prof. Dr. Johannes Steidle', 'publ

## 3. Textgenerierung

### 3.1 Zusammenfassung der Dokumente

In [13]:
doc_prompt = PromptTemplate.from_template("{page_content}")

chain = (
    {
        "content": lambda docs: "\n\n".join(
            format_document(doc, doc_prompt) for doc in docs
        )
    }
    | PromptTemplate.from_template("Summarize the following content:\n\n{content}. The information in content comes from different sources, so extract facts, and AVOID make affirmations about the study like 'die Metastudio zeigt' or 'eine Studie untersucht'. The summary MUST be in German!")
    | ChatOpenAI(temperature=0, model_name="gpt-3.5-turbo")
    | StrOutputParser()
)

In [14]:
teaser_summary = chain.invoke(teaser_results)
teaser_summary

'Eine Metastudie hat nach möglichen Ursachen für den Rückgang der terrestrischen Insekten gesucht. Dabei wurde festgestellt, dass die intensivierte Landnutzung einen Einfluss auf den Rückgang hat, während der Klimawandel keinen Einfluss hat. Bei Süßwasserinsekten wird der positive Trend auf verbesserte Wasserqualität und steigende Temperaturen durch den Klimawandel zurückgeführt. Eine andere Studie zeigt, dass das Wetter eine wichtige Rolle bei den Schwankungen der Insektenbiomasse spielt. Bis zu 75 Prozent der Trends können durch Wetter- und Wetteranomalien erklärt werden. Die Krefeld-Studie aus dem Jahr 2017 beobachtete einen Rückgang der Biomasse fliegender Insekten um 76 Prozent, konnte jedoch keine konkreten Ursachen dafür feststellen. Diskutiert werden vor allem intensive Landwirtschaft, Umweltbelastung, Fragmentierung der Lebensräume, Klimawandel und Lichtverschmutzung als mögliche Ursachen.'

In [15]:
statement_summary = chain.invoke(statement_results)
statement_summary

'Die vorliegende Studie untersucht den Rückgang der Insektenbiomasse in Naturschutzgebieten und stellt fest, dass das Wetter und der Klimawandel dafür verantwortlich sein könnten. Es wird jedoch darauf hingewiesen, dass die Landwirtschaft ebenfalls einen großen Einfluss auf die Daten hat. Die Studie unterstützt die Hypothese, dass sowohl der Klimawandel als auch die Landwirtschaft den Rückgang der Insekten verursacht haben könnten. Es wird jedoch darauf hingewiesen, dass Zweifel an der Korrektheit der Studie bestehen könnten. Es wird betont, dass die Biomasse keine direkte Aussage über die Veränderung der Artenvielfalt ermöglicht. Es wird darauf hingewiesen, dass das Wissen über die Ursachen des Insektenrückgangs begrenzt ist und dass in der Krefeld-Studie keine klare Ursache identifiziert werden konnte. Die vorliegende Studie zeigt einen Rückgang der Insektenbiomasse um über 75 Prozent in größeren Gebieten Nord- und Nordwestdeutschlands in den letzten 30 Jahren. Es werden Zusammenhäng

### 3.2 Generierung des Radiobeitrags 