In [None]:
# !pip install python-dotenv langchain-core langchain-openai langchain-community

# Setup the demo

In [27]:
import json
import os

from dotenv import load_dotenv

from langchain_openai.chat_models import ChatOpenAI
from langchain_core.prompts import ChatPromptTemplate


In [20]:
load_dotenv("../.env")

True

In [60]:
system_message = (
    "You are given HTML elements of a German news website."
    "The elements do not only contain the content of the news articles but also some additional elements "
    "such as menu items, tables, dates, authors, etc. "
    "The objective is to extract only the relevant news article content and ignore the rest. "
    "Return a single string containing the result and keep the result in German."
    "Limit your response to at most five paragraphs."
)


def extract_news_article_text(html_input, llm):
    prompt = ChatPromptTemplate.from_messages(
        [
            ("system", system_message),
            ("human", "{input}")
        ]
    )
    chain = prompt | llm
    response = chain.invoke({"input": html_input})
    return response


api_cost = {
    "gpt-4o": {
        "prompt_tokens": 0.01,
        "completion_tokens": 0.03,
    },
}

def calculate_cost(llm_response, model_name):
    token_usage = llm_response.response_metadata["token_usage"]
    prompt_tokens = token_usage["prompt_tokens"]
    prompt_tokens_cost = api_cost[model_name]["prompt_tokens"]
    completion_tokens = token_usage["completion_tokens"]
    completion_tokens_cost = api_cost[model_name]["completion_tokens"]
    
    total_cost = (prompt_tokens * prompt_tokens_cost + completion_tokens * completion_tokens_cost) / 1000
    return total_cost

In [51]:
llm = ChatOpenAI(model="gpt-4o", temperature=0, api_key=os.getenv("OPENAI_API_KEY"))

# Example 1

[Link](https://www.handelsblatt.com/finanzen/banken-versicherungen/banken/ukraine-krieg-grossbanken-im-euroraum-haben-russland-engagements-deutlich-verringert-01/100037514.html) to the news article.

In [52]:
html_content = json.load(open("../data/100037514.html"))
print(html_content)

<html>
 <body>
  <app-root>
   <div>
    <div>
     <span>
      Menü
     </span>
     <span>
      Anmelden
     </span>
    </div>
    <article>
     <app-story-detail-page-header>
      <div>
       <app-header-content-kicker>
        <span>
         Ukraine-Krieg
        </span>
       </app-header-content-kicker>
       <app-header-content-headline>
        <h2>
         Großbanken im Euroraum haben Russland-Engagements deutlich verringert
        </h2>
       </app-header-content-headline>
       <app-header-content-lead-text>
        Die Banken der Euro-Zone haben ihr Engagement in Russland stark gesenkt. Die Europäische Zentralbank hatte den Rückgang gefordert. Nun macht aber ein anderer Bereich Sorgen.
       </app-header-content-lead-text>
       <app-story-date>
        15.05.2024 - 11:30 Uhr
       </app-story-date>
      </div>
     </app-story-detail-page-header>
     <app-storyline-elements>
      <app-storyline-element>
       <p>
        <span>
         Frankfurt.
   

In [53]:
result = extract_news_article_text(html_content, llm)
print(result.content)

Ukraine-Krieg

Großbanken im Euroraum haben Russland-Engagements deutlich verringert

Die Banken der Euro-Zone haben ihr Engagement in Russland stark gesenkt. Die Europäische Zentralbank hatte den Rückgang gefordert. Nun macht aber ein anderer Bereich Sorgen.

Frankfurt. Große Geldhäuser aus Ländern der Euro-Zone haben ihre Engagements in Russland laut EZB um mehr als die Hälfte verringert. Die Europäische Zentralbank (EZB) habe die Präsenz der Großinstitute dort genau überwacht, erklärte EZB-Chefbankenaufseherin Claudia Buch am Montag in einer Mitteilung zu einem Treffen der Euro-Finanzminister in Brüssel.

„Die Engagements scheinen sich ziemlich in Grenzen zu halten, und die direkten Engagements sind zwischen Ende 2021 und Ende 2023 um 55 Prozent zurückgegangen“, führte sie aus. Einige Banken hätten sich vollständig aus dem russischen Markt zurückgezogen.


In [54]:
result.response_metadata["token_usage"]

{'completion_tokens': 196, 'prompt_tokens': 564, 'total_tokens': 760}

In [55]:
calculate_cost(result, "gpt-4o")

0.011519999999999999

# Example 2

[Link](https://www.handelsblatt.com/finanzen/banken-versicherungen/banken/immobilien-pbb-soll-riesenportfolio-verkauf-mit-blackstone-verhandeln-01/100037533.html) to the news article.

In [56]:
html_content = json.load(open("../data/100037533.html"))
print(html_content)

<html>
 <body>
  <app-root>
   <div>
    <div>
     <span>
      Menü
     </span>
     <span>
      Anmelden
     </span>
    </div>
    <article>
     <app-story-detail-page-header>
      <div>
       <app-header-content-kicker>
        <span>
         Immobilien
        </span>
       </app-header-content-kicker>
       <app-header-content-headline>
        <h2>
         PBB soll Riesenportfolio-Verkauf mit Blackstone verhandeln
        </h2>
       </app-header-content-headline>
       <app-header-content-lead-text>
        Die Bank verbucht im ersten Quartal trotz der Krise bei Büroimmobilien einen Gewinn. Sie steht kurz davor, ein großes Portfolio in den USA und Großbritannien zu verkaufen.
       </app-header-content-lead-text>
       <app-header-content-authors>
        <app-authors-section>
         <app-authors>
          <a>
           Elisabeth Atzler
          </a>
         </app-authors>
         <app-story-date>
          15.05.2024 - 10:30 Uhr
         </app-story-date>

In [61]:
result = extract_news_article_text(html_content, llm)
print(result.content)

PBB soll Riesenportfolio-Verkauf mit Blackstone verhandeln. Die Bank verbucht im ersten Quartal trotz der Krise bei Büroimmobilien einen Gewinn. Sie steht kurz davor, ein großes Portfolio in den USA und Großbritannien zu verkaufen.

Frankfurt. Kurz nach Amtsantritt des neuen Vorstandschefs erzielt der Immobilienfinanzierer Deutsche Pfandbriefbank (PBB) wieder einen Gewinn. Trotz der anhaltenden Krise bei Büro- und Gewerbeimmobilien verdiente die Bank im ersten Quartal 2024 vor Steuern 34 Millionen Euro, was leicht über dem Vorjahreswert liegt. „Wir sind trotz volatiler Märkte gut in das Jahr 2024 gestartet“, sagte PBB-Chef Kay Wolf am Dienstag.

Der frühere Manager der Deutschen Bank hat den Posten im März von Andreas Arndt übernommen. Der Wechsel war seit dem vergangenen Herbst bekannt gewesen. Das solide Ergebnis unterstreiche, „dass die PBB eine im Kern gesunde und nachhaltig profitable Bank ist“, sagte Wolf. Die PBB-Aktie stieg am Dienstagnachmittag um sieben Prozent und setzte dam

In [62]:
result.response_metadata["token_usage"]

{'completion_tokens': 246, 'prompt_tokens': 677, 'total_tokens': 923}

In [63]:
calculate_cost(result, "gpt-4o")

0.014150000000000001

# Example 3

[Link](https://www.handelsblatt.com/finanzen/banken-versicherungen/banken/finanzbranche-aareal-bank-muss-sich-neuen-finanzvorstand-suchen-ergebnis-steigt/100037723.html) to the news article.

In [64]:
html_content = json.load(open("../data/100037723.html"))
print(html_content)

<html>
 <body>
  <app-root>
   <div>
    <div>
     <span>
      Menü
     </span>
     <span>
      Anmelden
     </span>
    </div>
    <article>
     <app-story-detail-page-header>
      <div>
       <app-header-content-kicker>
        <span>
         Finanzbranche
        </span>
       </app-header-content-kicker>
       <app-header-content-headline>
        <h2>
         Aareal Bank muss sich neuen Finanzvorstand suchen – Ergebnis steigt
        </h2>
       </app-header-content-headline>
       <app-header-content-lead-text>
        Der Immobilienfinanzierer bekommt nach der Übernahme durch Investoren einen neuen Finanzvorstand. Risikokredite sortiert die Bank derweil weiter aus.
       </app-header-content-lead-text>
       <app-story-date>
        15.05.2024 - 09:29 Uhr
       </app-story-date>
      </div>
     </app-story-detail-page-header>
     <app-storyline-elements>
      <app-storyline-element>
       <p>
        <span>
         Frankfurt.
        </span>
        Nach 

In [65]:
result = extract_news_article_text(html_content, llm)
print(result.content)

Finanzbranche

Aareal Bank muss sich neuen Finanzvorstand suchen – Ergebnis steigt

Der Immobilienfinanzierer bekommt nach der Übernahme durch Investoren einen neuen Finanzvorstand. Risikokredite sortiert die Bank derweil weiter aus.

Frankfurt. Nach der Übernahme durch Finanzinvestoren bekommt der Immobilienfinanzierer Aareal Bank auch einen neuen Finanzvorstand. Marc Heß werde Ende des Jahres, wenn sein Vertrag auslaufe, aus dem Unternehmen ausscheiden, teilte das Wiesbadener Unternehmen am Mittwoch mit. Über seine Nachfolge werde zeitnah entschieden.

Ende Juli wechselt bereits der Vorstandschef: Jochen Klösges verlässt die Aareal Bank, sein Amt übernimmt Christian Ricken, bisher Vorstand bei der LBBW. Im vergangenen Jahr hatten die Finanzinvestoren Advent und Centerbridge sowie der kanadische Pensionsfonds CPPIB das Institut übernommen.


In [66]:
result.response_metadata["token_usage"]

{'completion_tokens': 186, 'prompt_tokens': 556, 'total_tokens': 742}

In [67]:
calculate_cost(result, "gpt-4o")

0.01114