GENERAL

In [106]:
import json
import asyncio
from agents import Agent, function_tool, Runner, trace, ModelSettings, handoff, WebSearchTool
from pydantic import BaseModel
from typing import Optional, List
from dotenv import load_dotenv
load_dotenv(override=True)

True

In [107]:
class ResearchResult(BaseModel):
    value: Optional[str]
    currency: Optional[str]
    url: str
    snippet: str
    year: str
    is_estimated: bool 

class ListElement(BaseModel):
    value: str
    year: str

class CompanyOverview(BaseModel):
    name: str
    industry: str
    website: str
    headquarter: str

class Financials(BaseModel):
    revenue_last_year: ResearchResult
    profit_last_year: ResearchResult
    employees: ResearchResult

class MarketSize(BaseModel):
    target_region: str
    tam: ResearchResult
    sam: ResearchResult
    comment: str

class MarketGrowth(BaseModel):
    values: List[ListElement]
    currency: Optional[str]
    url: str
    snippet: str
    year: str
    is_estimated: bool 
    comment: str

class Competitor(BaseModel):
    name: str
    type: str
    market_share: ResearchResult
    market_growth_rate: ResearchResult
    website: str

class CompetitorLandscape(BaseModel):
    competitors: List[Competitor]
    comment: str

class Risk(BaseModel):
    market: int
    competitive: int
    regulatory: int
    technology: int
    reputational: int
    comment: str

class Member(BaseModel):
    name: str
    position: str
    comment: str

class ManagementTeam(BaseModel):
    team: List[Member]
    comment: str

class InvestmentMemo(BaseModel):
    company_overview: CompanyOverview
    financials: Financials
    market_size: MarketSize
    market_growth: MarketGrowth
    competitor_landscape: CompetitorLandscape
    risks: Risk
    management_team: ManagementTeam


In [108]:
research_instructions = """
Du bist ein Research Agent. Deine Aufgabe ist es, mit **einer einzigen Websuche** mehrere Finanzwerte eines Unternehmens zu finden (z.‚ÄØB. Umsatz, Gewinn, Mitarbeiterzahl, Marktgr√∂√üen).

‚ñ∂Ô∏è Vorgehen:
- Nutze WebSearchTool **einmal**, finde eine seri√∂se Quelle mit m√∂glichst vielen relevanten Kennzahlen.
- Extrahiere daraus alle verf√ºgbaren Werte und weise jedem eine eigene `url`, `snippet` zu.

üìå Regeln:
- Entferne Tausendertrennzeichen, Einheiten und W√§hrungszeichen.
- Skaliere Zahlen bei Begriffen wie ‚ÄûMillionen‚Äú, ‚ÄûMilliarden‚Äú, ‚ÄûThousand‚Äú (z.‚ÄØB. 5.330 Millionen ‚Üí 5330000000).
- Gib alle Werte als **volle Ganzzahl** zur√ºck (z.‚ÄØB. "19732", "5330000000"), ohne Punkte oder Kommas.
- Keine Forecasts > 3 Jahre in der Zukunft.
- F√ºr Prozentwerte (`market_share`, `growth_rate`) ‚Üí `currency = "%"`, `value` nur Zahl.

üö´ Vermeide falsche Kennzahlen:
- Trage bei `sam` nur echte Marktgr√∂√üen (z.‚ÄØB. regionales Marktvolumen) ein ‚Äì keine Unternehmenskennzahlen wie Mitarbeiterzahl oder Umsatz.
- Trage bei `profit` keine EBITDA/EBIT-Werte direkt ein ‚Äì diese d√ºrfen nur gesch√§tzt werden.
- Wenn du keinen passenden Wert findest: setze `value = "0"`, `is_estimated = false`, und gib dennoch ein sinnvolles `snippet` (z.‚ÄØB. ‚Äûnot disclosed‚Äú).

‚úÖ Quellen-Priorit√§t:
1. Unternehmensberichte / Investor Relations
2. Offizielle Portale (Bloomberg, Statista, Reuters)
3. Beh√∂rden & Register
4. Seri√∂se Medien

üîí Vermeide Blogs, Foren, irrelevante Seiten.
üìÖ `year` = Berichtsjahr des Werts (nicht Ver√∂ffentlichungsdatum).
- Wenn im Snippet sowohl ein aktueller Marktwert (z.‚ÄØB. "was valued at USD 58.6 billion in 2024") als auch ein zuk√ºnftiger, prognostizierter Wert (z.‚ÄØB. "expected to reach USD 143.6 billion by 2034") vorkommt, darfst du **nur den aktuellen Wert √ºbernehmen**.
- Prognostizierte Werte ("expected to reach", "projected", "by 203x", "CAGR") **d√ºrfen niemals** in `value` √ºbernommen werden ‚Äì nur echte Marktgr√∂√üen aus einem abgeschlossenen Jahr (z.‚ÄØB. 2023 oder 2024).
- Forecasts k√∂nnen zur Einordnung im Kommentar verwendet werden ‚Äì  **nicht f√ºr den Zahlenwert**.
"""


In [109]:
research_agent = Agent(
    name="Research Agent",
    model="gpt-4o-mini",
    instructions=research_instructions,
    tools=[WebSearchTool(search_context_size="low")],
    output_type=ResearchResult,
    model_settings=ModelSettings(tool_choice="required", temperature=0.3, max_tokens=500),
)

research_tool = research_agent.as_tool(
    tool_name="research_agent",
    tool_description="Sucht gezielt nach einer Kennzahl eines Unternehmens im Internet, extrahiert einen passenden Wert, normalisiert ihn bei Bedarf in USD und gibt ein ResearchResult mit Quelle, Jahr, Original- und USD-Wert zur√ºck.",
)

In [110]:
financials_evaluator_instructions = """
Du bist ein Evaluator f√ºr Finanzkennzahlen wie Umsatz, Gewinn und Mitarbeiterzahl. Deine Aufgabe ist es, extrahierte Werte zu pr√ºfen, zu korrigieren oder grob zu sch√§tzen, falls n√∂tig.

‚ñ∂Ô∏è Aufgaben:
1. **Inhaltliche Pr√ºfung**:
   - Pr√ºfe, ob der extrahierte Wert (`value`) zur Zielgr√∂√üe passt (z.‚ÄØB. `profit_last_year`).
   - Wenn im `snippet` z.‚ÄØB. ‚ÄûUmsatz‚Äú steht, aber `profit` erwartet wird ‚Üí `value = "0"`, `currency = ""`, `is_estimated = false`.
   - Erkenne und korrigiere **Skalierungsfehler** (z.‚ÄØB. `"53651"` ‚Üí `"53651000"`).

2. **EBIT/EBITDA-Sch√§tzung**:
   - Wenn der Wert auf EBIT, EBITDA oder Operating Income basiert:
     - Verwende ihn **nicht direkt**.
     - Sch√§tze den Gewinn durch pauschalen Abzug von 30‚Äì50‚ÄØ%.
     - Gib den gesch√§tzten `value` als **volle Ganzzahl** an (z.‚ÄØB. `"65000000"`).
     - Setze `is_estimated = true`.

3. **Kontextbasierte Sch√§tzung**:
   - Wenn keine Zahl extrahierbar ist, aber der Kontext eine Sch√§tzung erlaubt ‚Üí sch√§tze realistisch, setze `is_estimated = true`.

4. **Standardfall**:
   - Wenn keine Zahl und keine Sch√§tzung m√∂glich ‚Üí `value = "0"`, `currency = ""`, `is_estimated = false`.

üìå Hinweise:
- Gib `value` immer als **volle Ganzzahl ohne Trennzeichen** zur√ºck.
- Prozentwerte nur bei Wachstumsraten ‚Üí dann `currency = "%"`, `value` nur Zahl.
- Wenn `is_estimated = true`, darf `value` **niemals "0"** sein.
"""


In [111]:
financials_evaluator_agent = Agent(
    name="Evaluator Agent",
    model="gpt-4o-mini",
    instructions=financials_evaluator_instructions,
    output_type=Financials,
    model_settings=ModelSettings(temperature=0.3, max_tokens=500),
)

financials_evaluator_tool = financials_evaluator_agent.as_tool(
    tool_name="financials_evaluator_agent",
    tool_description="√úberpr√ºft die Richtigkeit von extrahierten Werten in einem strukturierten JSON-Objekt, indem gepr√ºft wird, ob die gefundenen Inhalte (z.‚ÄØB. Snippets) zur Bedeutung der Feldnamen passen. Setzt fehlerhafte Werte auf '0', wenn sie nicht zur erwarteten Kennzahl geh√∂ren.",
)

In [112]:
market_size_evaluator_instructions = """
Du bist ein Evaluator f√ºr Marktgr√∂√üen (TAM & SAM). Deine Aufgabe ist es, extrahierte Werte zu pr√ºfen, zu normalisieren und ggf. realistisch zu sch√§tzen ‚Äì aber niemals auf Basis von Prognosen.

‚ñ∂Ô∏è Pr√ºfregeln:
1. **Nur abgeschlossene Jahre zul√§ssig** (z.‚ÄØB. 2022‚Äì2024). Prognosen (‚Äûexpected‚Äú, ‚Äûprojected‚Äú, ‚Äûby 203x‚Äú) d√ºrfen **nicht √ºbernommen** werden ‚Äì auch nicht gesch√§tzt.
2. Wenn im Snippet ein aktueller und ein Forecast vorkommen: **immer nur den aktuellen √ºbernehmen**.
3. Erkenne & korrigiere Skalierungsfehler (z.‚ÄØB. Millionen ‚Üí `"9762360000"`).

‚ñ∂Ô∏è F√ºr `sam`:
- Wenn Umsatz oder Mitarbeiterzahl eines Unternehmens genutzt wurde ‚Üí verwerfen.
- Wenn kein Wert extrahierbar ist, aber Kontext vorhanden (z.‚ÄØB. TAM, Branche, Player):
  - Sch√§tze SAM mit 10‚Äì30‚ÄØ% des TAM,
  - Gib eine sinnvolle Ganzzahl an, `is_estimated = true`.

üåç Sprachpr√ºfung (`comment`):
- Der `comment` muss in **derselben Sprache wie der Nutzerinput** geschrieben sein.
- Wenn der Nutzer auf Deutsch kommuniziert hat (z.‚ÄØB. Eingabe oder Regionenname ist Deutsch), dann muss der Kommentar vollst√§ndig in professionellem, deutschsprachigem Business-Stil formuliert sein.
- √úbersetze den Kommentar ggf. automatisch, ohne den Inhalt zu ver√§ndern.
- Verwende keinen englischen Kommentar bei deutschen Eingaben ‚Äì auch nicht in Teilen.

üß† Konsistenzpr√ºfung:
- `SAM ‚â§ TAM`
- `TAM ‚â• SAM` muss immer erf√ºllt sein

üìå Format:
- `value`: Ganzzahl ohne Trennzeichen,
- `currency`: `"USD"` oder `"EUR"` laut Quelle.
"""


In [113]:
market_size_evaluator_agent = Agent(
    name="Evaluator Agent",
    model="gpt-4o-mini",
    instructions=market_size_evaluator_instructions,
    model_settings=ModelSettings(temperature=0.3 , max_tokens=1000),
)

market_size_evaluator_tool = market_size_evaluator_agent.as_tool(
    tool_name="market_size_evaluator_agent",
    tool_description="√úberpr√ºft die Richtigkeit von extrahierten Werten in einem strukturierten JSON-Objekt, indem gepr√ºft wird, ob die gefundenen Inhalte (z.‚ÄØB. Snippets) zur Bedeutung der Feldnamen passen. Setzt fehlerhafte Werte auf '0', wenn sie nicht zur erwarteten Kennzahl geh√∂ren."
)

In [114]:
competitor_landscape_evaluator_instructions = """
Du bist ein Evaluator-Agent f√ºr Wettbewerbslandschaften. Deine Aufgabe ist es, ein `CompetitorLandscape`-Objekt zu √ºberpr√ºfen, zu bereinigen und ‚Äì falls sinnvoll ‚Äì zu erg√§nzen.

üéØ Ziel:
Ein plausibles, realit√§tsnahes `CompetitorLandscape`-Objekt mit maximal vier relevanten Wettbewerbern ‚Äì jeweils mit passenden, ggf. gesch√§tzten Werten.

‚ñ∂Ô∏è Aufgaben:

1. **Plausibilit√§tspr√ºfung pro Wettbewerber**:
   - Entferne jeden `competitor`, der offensichtlich **nicht zur Branche** des analysierten Unternehmens passt.
   - Beispiel: Wenn der Zielkontext ‚ÄûOutdoor Power Equipment‚Äú ist, darf z.‚ÄØB. ‚ÄûAmazon Echo‚Äú **nicht** in der Liste stehen.
   - Achte auf Branchenschl√ºsselw√∂rter in `type` und `snippet`.

2. **Datenkorrektur**:
   - Falls `market_share.value = "0"` oder fehlt:
     - Ermittle anhand von Kontext (z.‚ÄØB. Marktgr√∂√üe, andere Marktanteile) eine **grobe Sch√§tzung** (z.‚ÄØB. `"7.5"`)
     - Setze `is_estimated = true`
   - Gleiches gilt f√ºr `market_growth_rate`, wenn `"0"` oder kein Wert vorhanden ist.
   - Sch√§tzungen m√ºssen **realistisch und konservativ** sein ‚Äì orientiere dich an typischen Bandbreiten:
     - Marktanteile: meist zwischen 1 % und 40 %
     - Marktwachstum: meist zwischen 1 % und 15 %

3. **Datenvalidierung**:
   - √úberpr√ºfe, ob `value` numerisch korrekt skaliert ist (z.‚ÄØB. `"12.5"` statt `"12,5"` oder `"12%"`)
   - `currency` muss bei Prozentwerten `"%"` sein.
   - `year` soll sich auf ein **abgeschlossenes Jahr** (idealerweise 2022‚Äì2024) beziehen.
   - `url`, `snippet`, `year` m√ºssen vorhanden sein, sonst entferne den Wert oder den ganzen Wettbewerber.

4. **Gesamtstruktur**:
   - Das finale `CompetitorLandscape`-Objekt darf **maximal 4 g√ºltige Wettbewerber** enthalten.
   - Falls am Ende nur 2‚Äì3 valide √ºbrig bleiben ‚Üí akzeptabel.
   - Falls **keine** g√ºltigen Wettbewerber vorhanden sind ‚Üí gib ein leeres Array und einen passenden Kommentar zur√ºck.

üìå Formatregeln:
- `value`: Nur numerische Zeichen als String (z.‚ÄØB. `"8.5"`)
- `currency`: `"%"` bei Marktanteilen und Wachstumsraten
- `is_estimated = true`, wenn der Wert gesch√§tzt wurde

üìù Kommentar:
- Passe den bestehenden `comment` ggf. leicht an, wenn ein Wettbewerber entfernt wurde oder neue Insights aus den Sch√§tzungen entstehen.
- Behalte den Stil bei: sachlich, strategisch, VC-/PE-kompatibel.

"""


In [115]:
competitor_landscape_evaluator_agent = Agent(
    name="Competitor Landscape Evaluator Agent",
    model="gpt-4o-mini",
    instructions=competitor_landscape_evaluator_instructions,
    output_type=CompetitorLandscape,
    model_settings=ModelSettings(temperature=0.3, max_tokens=2000),
)

competitor_landscape_evaluator_tool = competitor_landscape_evaluator_agent.as_tool(
    tool_name="competitor_landscape_evaluator_agent",
    tool_description=(
        "√úberpr√ºft ein CompetitorLandscape-Objekt auf Plausibilit√§t, Branchentreue und Vollst√§ndigkeit. "
        "Korrigiert fehlende oder ung√ºltige Werte (z.‚ÄØB. '0') durch realistische Sch√§tzungen und entfernt "
        "Wettbewerber, die thematisch nicht zur Zielbranche passen. Ziel ist eine bereinigte, investorenrelevante "
        "Wettbewerbsanalyse mit maximal vier relevanten Competitor-Eintr√§gen."
    )
)

FINANCIALS

In [116]:
financials_instructions = """
Du bist ein Finanzanalyse-Agent. Deine Aufgabe ist es, drei zentrale Kennzahlen eines Unternehmens zu ermitteln:

1. Umsatz
2. Gewinn
3. Anzahl der Mitarbeitenden

‚ñ∂Ô∏è Vorgehen:
- Verwende **einmalig** das Tool `research_agent`, um alle drei Werte gemeinsam zu ermitteln.
- Formuliere die Abfrage so, dass alle drei Begriffe enthalten sind (z.‚ÄØB. "STIHL revenue, profit and employee count 2024").
- Die Begriffe in der Anfrage sollen **auf Englisch** formuliert sein: "Revenue", "Profit", "Employee count".
- Nutze die aktuell verf√ºgbaren Daten (z.‚ÄØB. aus dem Jahr 2024).

üìå Hinweise:
- Wenn einzelne Werte fehlen, akzeptiere sie wie sie sind.
- Nach dem Aufruf des `research_agent`: √ºbergib das vollst√§ndige Ergebnis an `financials_evaluator_agent`, um Werte auf Richtigkeit zu pr√ºfen (z.‚ÄØB. falsch zugeordnete Kennzahlen oder Skalierungsfehler).

üéØ Ziel: Ein vollst√§ndiges, gepr√ºftes Financials-Objekt mit einzelnen Quellen pro Wert.
"""


In [117]:
financials_agent = Agent(
    name="Financials Agent",
    instructions=financials_instructions,
    model="gpt-4o-mini",
    tools=[research_tool, financials_evaluator_tool],
    output_type=Financials,
    model_settings=ModelSettings(tool_choice="required", temperature=0.3 , max_tokens=500),
)

In [118]:
# Financials 0.03$ 30sek
"""messages = [{"role": "user", "content": "Erstelle die Financials von Knauf"}]

with trace("Financials Run"):
    result = await Runner.run(financials_agent, messages, max_turns=6)


formatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)
print(formatted)"""

'messages = [{"role": "user", "content": "Erstelle die Financials von Knauf"}]\n\nwith trace("Financials Run"):\n    result = await Runner.run(financials_agent, messages, max_turns=6)\n\n\nformatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)\nprint(formatted)'

COMPANY OVERVIEW

In [119]:
company_overview_instructions = """
Du bist ein Company Analyse Agent. Deine Aufgabe ist es zentrale Informationen eines Unternehmens zu ermitteln:

1. Vollst√§ndiger rechtlicher Name des Unternehmens mit Rechtszusatz
2. Industrie des Unternehmens
3. Website des Unternehmens
4. Headquarter des Unternehmens

Wichtig:
- Wenn ein Ergebnis unvollst√§ndig oder leer ist, akzeptiere es wie es ist.
- Nutze immer das **aktuellste verf√ºgbare Jahr** (z.‚ÄØB. 2024).
"""

In [120]:
company_overview_agent = Agent(
    name="Company Overview Agent",
    model="gpt-4o-mini",
    instructions=company_overview_instructions,
    output_type=CompanyOverview,
    model_settings=ModelSettings(max_tokens=500),
)

In [121]:
# Company Overview < 0.01$ 1sek
"""messages = [{"role": "user", "content": "Erstelle die Company Overview von STIHL"}]

with trace("Company Run"):
    result = await Runner.run(company_overview_agent, messages, max_turns=8)

formatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)
print(formatted)"""

'messages = [{"role": "user", "content": "Erstelle die Company Overview von STIHL"}]\n\nwith trace("Company Run"):\n    result = await Runner.run(company_overview_agent, messages, max_turns=8)\n\nformatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)\nprint(formatted)'

MARKET SIZE

In [122]:
market_size_instructions = """
Du bist ein Marktanalyse-Agent. Deine Aufgabe ist es, zwei Marktkennzahlen f√ºr eine Branche zu ermitteln:

1. TAM (Total Addressable Market): globale Marktgr√∂√üe in USD oder EUR.
2. SAM (Serviceable Available Market): adressierbare Marktgr√∂√üe in einer sinnvollen Zielregion.

üìñ Definition:
TAM und SAM sind **Branchenums√§tze**, nicht Unternehmensums√§tze.
- TAM = Gesamtumsatz aller Anbieter weltweit.
- SAM = Marktumsatz in einer bestimmten Region.
- Verwende **keine** Ums√§tze, Mitarbeiterzahlen oder KPIs einzelner Unternehmen.

‚ñ∂Ô∏è Vorgehen:
- Leite `target_region` logisch aus dem Kontext ab (z.‚ÄØB. Europa, USA), ohne Tool.
- Formuliere zwei englische Anfragen:
  - "Global TAM for [industry] market"
  - "SAM for [industry] in [target_region]"

üîí Tool-Regel:
- Verwende das Tool `research_agent` **insgesamt genau zweimal**:
  - **einmal f√ºr TAM**
  - **einmal f√ºr SAM**
- Keine weiteren Aufrufe, keine Wiederholungen, kein Retry.

üì¶ Evaluator-Regel:
- Verwende `market_size_evaluator_agent` **genau einmal**, und zwar **ausschlie√ülich am Ende** der Ausf√ºhrung.
- F√ºhre alle Recherchen und eventuelle Sch√§tzungen zuerst vollst√§ndig durch.
- √úbergib erst danach das strukturierte Ergebnis an `market_size_evaluator_agent`.

üìå Regeln:
- Verwende nur Marktwerte aus **abgeschlossenen Jahren** (z.‚ÄØB. 2022‚Äì2024).
- Wenn im Snippet ein aktueller und ein zuk√ºnftiger Wert vorkommen, √ºbernimm **nur den aktuellen**.
- Prognosen ("expected to reach", "by 203x", "projected") **nicht √ºbernehmen** ‚Äì nur im Kommentar erw√§hnen.
- Wenn keine exakte Zahl extrahierbar ist, darf SAM gesch√§tzt werden:
  - 10‚Äì30‚ÄØ% des TAM,
  - `value` als Ganzzahl, `is_estimated = true`, niemals `"0"`.

üìù Kommentarstil (`comment`):
- Gib eine strategische Einsch√§tzung zu TAM & SAM.
- Der Stil soll dem eines erfahrenen McKinsey-Partners entsprechen ‚Äì pr√§zise, faktenbasiert, investorenorientiert.
- Zielgruppe: Private Equity Investor (mit Interesse an Deal Size, Entry Potential, Expansion Room)
- Fokus auf:
  - Datenquelle und methodischer Kontext
  - Relevanz f√ºr Marktattraktivit√§t
  - Regionaler Fokus und Marktsegmente
  - Prognosen ggf. erw√§hnen, aber nicht einbeziehen
- L√§nge: ca. 5 pr√§gnante S√§tze.
- Formuliere den gesamten Kommentar in der Sprache des Prompts. Wenn die Eingabe auf Deutsch erfolgt, schreibe den Kommentar auf Deutsch im professionellen Stil eines Investment Memos.


üß† Logik:
- `SAM ‚â§ TAM`
- `TAM ‚â• SAM`

üìê Format:
Gib am Ende folgendes JSON-Objekt zur√ºck ‚Äì **vollst√§ndig, valide und maschinenlesbar**:

{
  "input": {
    "target_region": "Europe",
    "tam": {
      "value": "1320010000000",
      "currency": "USD",
      "is_estimated": false,
      "source": "https://...",
      "year": 2023
    },
    "sam": {
      "value": "53300000000",
      "currency": "USD",
      "is_estimated": false,
      "source": "https://...",
      "year": 2023
    },
    "comment": "..."
  }
}

"""


In [123]:
market_size_agent = Agent(
    name="Market Size Agent",
    model="gpt-4o-mini",
    instructions=market_size_instructions,
    tools=[research_tool, market_size_evaluator_tool],
    output_type=MarketSize,
    model_settings=ModelSettings(tool_choice="required", temperature=0.3, max_tokens=500),
)

In [124]:
# Market Size 0.05$ 15sek
messages = [{"role": "user", "content": "Erstelle die Market Size von Knauf"}]

with trace("Market Size Run"):
    result = await Runner.run(market_size_agent, messages, max_turns=6)

formatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)
print(formatted)

{
  "target_region": "Europe",
  "tam": {
    "value": "1320010000000",
    "currency": "USD",
    "url": "https://www.fortunebusinessinsights.com/construction-materials-market-107415",
    "snippet": "The global construction materials market was valued at USD 1,320.01 billion in 2023 and is projected to reach USD 1,867.16 billion by 2032, exhibiting a CAGR of 3.9% during the forecast period.",
    "year": "2023",
    "is_estimated": false
  },
  "sam": {
    "value": "132000000000",
    "currency": "USD",
    "url": "https://www.samoter.it/en/construction-europe",
    "snippet": "SAMoter is a magazine for Europe's construction industry, providing insights and information relevant to the sector.",
    "year": "2025",
    "is_estimated": true
  },
  "comment": "Der globale Markt f√ºr Baumaterialien wird im Jahr 2023 auf etwa 1,32 Billionen USD gesch√§tzt, was auf eine robuste Wachstumsdynamik hinweist. Der SAM f√ºr Europa wird auf etwa 10-30 % des TAM gesch√§tzt, was die signifikante Na

MARKET GROWTH

In [125]:
market_growth_instructions = """
Du bist ein Research Agent f√ºr Marktanalysen. Deine Aufgabe ist es, eine Liste von historischen Marktgr√∂√üen (z.‚ÄØB. Jahresums√§tze in USD oder EUR) zu extrahieren. Ziel ist ein Liniendiagramm mit mindestens 3‚Äì4 realen Werten aus abgeschlossenen Jahren.

‚ñ∂Ô∏è Vorgehen:
- Verwende `WebSearchTool` **genau einmal**, um eine Quelle mit mehreren **abgeschlossenen Jahreswerten** zu finden (idealerweise 2018‚Äì2024).
- Bevorzuge **Statista**, offizielle Reports oder anerkannte Marktforschungsseiten mit klaren Datenreihen.
- Extrahiere die Umsatz- oder Marktvolumenwerte pro Jahr und skaliere korrekt.

üì¶ Format (ResearchResultList):
- `values`: Liste mit mindestens 3 Objekten:
  - `year`: Jahr als Text (z.‚ÄØB. `"2021"`)
  - `value`: Umsatzwert als Ganzzahl (z.‚ÄØB. `"53300000000"`)
- `currency`: `"USD"` oder `"EUR"` (niemals `"%"`)
- `url`: Quelle der Daten
- `snippet`: Kurztext mit den genannten Werten
- `year`: das **aktuellste Jahr** in der Liste
- `is_estimated`: `false`, wenn die Werte genannt sind, sonst `true`

üìå Regeln:
- Extrahiere **nur absolute Marktgr√∂√üen** (kein Wachstum in %).
- Keine Prognosen oder Forecasts √ºbernehmen (‚Äûexpected‚Äú, ‚Äûby 2030‚Äú, ‚ÄûCAGR‚Äú etc.).
- Entferne Einheiten und formatiere korrekt:
  - ‚Äû5.705,6 Mio. USD‚Äú ‚Üí `"5705600000"`, `currency = "USD"`
  - ‚Äû3,2 Mrd. EUR‚Äú ‚Üí `"3200000000"`, `currency = "EUR"`

üîí Einschr√§nkungen:
- Jeder Wert muss zu einem konkreten Jahr geh√∂ren.
- Wenn keine Zahlen extrahiert werden k√∂nnen, darf gesch√§tzt werden (`is_estimated = true`), aber **niemals `value = "0"`**.
- Sch√§tzungen d√ºrfen nur erfolgen, wenn du mindestens **2 reale Werte** hast.

üéØ Ziel:
Ein vollst√§ndig nutzbares `ResearchResultList`-Objekt mit Marktgr√∂√üen pro Jahr f√ºr ein aussagekr√§ftiges Liniendiagramm im Investment Memo.
"""


In [126]:
market_growth_agent = Agent(
    name="Market Growth Agent",
    model="gpt-4o-mini",
    instructions=market_growth_instructions,
    tools=[WebSearchTool(search_context_size="low")],
    output_type=MarketGrowth,
    model_settings=ModelSettings(tool_choice="required", temperature=0.3, max_tokens=600),
)

In [127]:
# Market Growth 0.03$ 3sek
"""messages = [{
  "role": "user",
  "content": "Wie hat sich das Marktvolumen im europ√§ischen Markt f√ºr Motors√§gen oder Gartenwerkzeuge von 2018 bis 2023 entwickelt? Gib absolute Marktums√§tze pro Jahr an."
}]

with trace("Research list Run"):
    result = await Runner.run(market_growth_agent, messages, max_turns=6)


formatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)
print(formatted)"""

'messages = [{\n  "role": "user",\n  "content": "Wie hat sich das Marktvolumen im europ√§ischen Markt f√ºr Motors√§gen oder Gartenwerkzeuge von 2018 bis 2023 entwickelt? Gib absolute Marktums√§tze pro Jahr an."\n}]\n\nwith trace("Research list Run"):\n    result = await Runner.run(market_growth_agent, messages, max_turns=6)\n\n\nformatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)\nprint(formatted)'

COMPETITORS

In [128]:
competitor_instructions = """
Du bist ein Wettbewerbsanalyse-Agent. Deine Aufgabe ist es, ein bestimmtes Unternehmen strukturiert zu analysieren, damit es als Wettbewerberprofil in einem Investment Memo dargestellt werden kann.

‚ñ∂Ô∏è Zielstruktur (Competitor-Objekt):
- `name`: Vollst√§ndiger rechtlicher Name des Unternehmens
- `type`: Kurzbeschreibung der T√§tigkeit (z.‚ÄØB. "Power tool manufacturer")
- `market_share`: Marktanteil in Prozent ‚Äì als `ResearchResult`
- `market_growth_rate`: Wachstumsrate des relevanten Zielmarkts ‚Äì als `ResearchResult`
- `website`: Offizielle Website-URL

üîç Tool-Nutzung:
- Verwende das Tool `research_agent` **jeweils genau einmal** f√ºr:
  - `market_share`
  - `market_growth_rate`
- Verwende es **nicht mehrfach**, kein Retry, keine Schleifen.

üìå Recherche-Regeln:
- Nutze nur Werte aus **abgeschlossenen Jahren** (z.‚ÄØB. 2022‚Äì2024).
- Forecasts (‚Äûexpected‚Äú, ‚Äûprojected‚Äú, ‚ÄûCAGR‚Äú, ‚Äûby 203x‚Äú) **d√ºrfen nicht** als `value` verwendet werden.
- Entferne Einheiten:
  - ‚Äû12,4‚ÄØ%‚Äú ‚Üí `"12.4"`, `currency = "%"`, `value` als String

üìâ Wenn kein exakter Wert gefunden wird:
- Lass das Feld **einfach leer** (also kein Eintrag oder `None` im finalen JSON),
- Gib **keine Sch√§tzung** ab,
- `value` darf **nicht "0"** sein.

üåê Website:
- Gib die offizielle Unternehmens-Website an ‚Äì kein LinkedIn, kein H√§ndler.

üéØ Ziel:
Ein einzelnes, valides `Competitor`-Objekt f√ºr das √ºbergebene Unternehmen ‚Äì mit maximal zwei ResearchResulten, geeignet f√ºr den Einsatz in Wettbewerbsanalysen (VC/PE).
"""

In [129]:
competitor_agent = Agent(
    name="Competitor Agent",
    model="gpt-4o-mini",
    instructions=competitor_instructions,
    tools=[research_tool],
    output_type=Competitor,
    model_settings=ModelSettings(tool_choice="required", temperature=0.3, max_tokens=500),
)

In [130]:
# Competitors 0.05$ 15sek
"""messages = [{"role": "user", "content": "Analysiere den Wettbewerber Apple Inc."}]

with trace("Competitor Run"):
    result = await Runner.run(competitor_agent, messages, max_turns=6)

formatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)
print(formatted)"""

'messages = [{"role": "user", "content": "Analysiere den Wettbewerber Apple Inc."}]\n\nwith trace("Competitor Run"):\n    result = await Runner.run(competitor_agent, messages, max_turns=6)\n\nformatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)\nprint(formatted)'

In [131]:
@function_tool
async def run_competitor_analysis(queries: List[str]) -> List[Competitor]:
    """
    F√ºhrt parallele Wettbewerbsanalysen durch. Jeder Eintrag in `queries` sollte ein Wettbewerbername sein.
    Gibt eine Liste mit erfolgreichen Competitor-Objekten zur√ºck.
    """

    async def safe_run(query: str):
        try:
            result = await Runner.run(competitor_agent, [{"role": "user", "content": query}], max_turns=6)
            return result.final_output
        except Exception:
            return None  # Ignoriere fehlgeschlagene Runs

    # Starte alle parallel
    results = await asyncio.gather(*[safe_run(q) for q in queries])

    # Filtere fehlgeschlagene Ergebnisse raus
    return [r for r in results if r is not None]


In [132]:
competitor_landscape_instructions = """
Du bist ein Wettbewerbslandschafts-Agent. Deine Aufgabe ist es, f√ºr ein gegebenes Unternehmen ca. 4 relevante Wettbewerber zu identifizieren und strukturiert als `CompetitorLandscape`-Objekt darzustellen.

‚ñ∂Ô∏è Zielstruktur (`CompetitorLandscape`):
- `competitors`: Liste mit ca. 4 vollst√§ndigen `Competitor`-Objekten
- `comment`: Strategische Zusammenfassung der Wettbewerbssituation

üîß Tool-Nutzung:
1. Verwende das Tool `run_competitor_analysis`, um **genau vier Wettbewerber gleichzeitig** zu analysieren.
   - √úbergib dem Tool eine Liste mit vier Wettbewerbsnamen (z.‚ÄØB. `["Makita", "Bosch", "Stiga", "Husqvarna"]`).
   - Das Tool gibt automatisch bis zu vier `Competitor`-Objekte zur√ºck.
2. Verwende am Ende das Tool `competitor_landscape_evaluator_agent`, um:
   - ung√ºltige oder branchenfremde Eintr√§ge zu entfernen,
   - fehlende Werte realistisch zu sch√§tzen (mit `is_estimated = true`),
   - das finale `CompetitorLandscape`-Objekt zu validieren und bereinigt zur√ºckzugeben.

üìå Anforderungen an die Wettbewerber:
- Relevante Konkurrenzunternehmen derselben Branche oder angrenzender M√§rkte
- Bevorzugt internationale Marken oder regionale Marktf√ºhrer
- Keine Tochterunternehmen des Zielunternehmens
- Keine branchenfremden Namensdopplungen ‚Äì z.‚ÄØB. nicht "Echo" von Amazon, wenn "ECHO Incorporated" aus dem Power-Equipment-Bereich gemeint ist
- Verwende ausschlie√ülich Wettbewerber, die **in der gleichen Industrie wie das Zielunternehmen aktiv sind** (z.‚ÄØB. Outdoor Power Tools bei STIHL)

üìâ Validit√§t:
- Jeder `Competitor` muss zwei ResearchResult-Felder enthalten: `market_share` und `market_growth_rate`
- Keine Duplikate
- Kein `"value": "0"` ‚Äì ggf. Sch√§tzungen mit `is_estimated = true`

üìù Kommentar (Feld `comment`):
- Verfasse eine fundierte Wettbewerbsanalyse in max. 5 S√§tzen:
  - Marktstruktur, Fragmentierung oder Konzentration
  - Positionierung des Zielunternehmens
  - Gemeinsamkeiten/Unterschiede bei Gesch√§ftsmodellen oder Marktstrategien
- Stil: pr√§zise, faktenbasiert, geeignet f√ºr ein PE- oder VC-Investment Memo

üéØ Ziel:
Ein vollst√§ndiges, bereinigtes `CompetitorLandscape`-Objekt mit relevanten Wettbewerbern und einem strategisch relevanten Kommentar f√ºr Investoren.
"""


In [133]:
competitor_landscape_agent = Agent(
    name="Competitor Landscape Agent",
    model="gpt-4o-mini",
    instructions=competitor_landscape_instructions,
    tools=[run_competitor_analysis, competitor_landscape_evaluator_tool],
    output_type=CompetitorLandscape,
    model_settings=ModelSettings(tool_choice="required", temperature=0.3, max_tokens=2000),
)

In [134]:
# Competitor Landscape 0.25$ 50sek
"""messages = [{"role": "user", "content": "Erstelle die Competitors Landscape von STIHL"}]

with trace("Competitors Run"):
    result = await Runner.run(competitor_landscape_agent, messages, max_turns=8)

formatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)
print(formatted)"""

'messages = [{"role": "user", "content": "Erstelle die Competitors Landscape von STIHL"}]\n\nwith trace("Competitors Run"):\n    result = await Runner.run(competitor_landscape_agent, messages, max_turns=8)\n\nformatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)\nprint(formatted)'

RISKS

In [135]:
risk_instructions = """
Du bist ein Risikoanalyse-Agent f√ºr Private-Equity-Investoren. Deine Aufgabe ist es, f√ºr das genannte Unternehmen f√ºnf zentrale Risikodimensionen auf einer Skala von 1 (sehr gering) bis 5 (sehr hoch) einzusch√§tzen.

F√ºhre zu jeder Dimension eine kurze Recherche durch und gib deine Bewertung ausschlie√ülich auf Basis seri√∂ser, √∂ffentlich verf√ºgbarer Quellen ab. Verwende nur Quellen wie offizielle Websites, bekannte Medien (z.‚ÄØB. Handelsblatt, FAZ, Reuters), Marktanalysen (z.‚ÄØB. Statista, McKinsey) und relevante Berichte.

Folgende f√ºnf Risiko-Kategorien sind zu bewerten:

1. **market** ‚Äì Wie volatil oder begrenzt ist das Marktwachstum? Gibt es strukturelle Risiken im Zielmarkt (z.‚ÄØB. schrumpfende Nachfrage)?
2. **competitive** ‚Äì Wie stark ist der Wettbewerb? Existieren dominante Marktteilnehmer oder hoher Preisdruck?
3. **regulatory** ‚Äì Gibt es regulatorische Unsicherheiten oder branchenspezifische Compliance-Risiken?
4. **technology** ‚Äì Ist das Unternehmen technologisch r√ºckst√§ndig oder durch neue Technologien bedroht?
5. **reputational** ‚Äì Gab es in den letzten Jahren negative Schlagzeilen oder Imagesch√§den?

üìä Gib f√ºr jede Kategorie eine **ganze Zahl von 1 bis 5** an. Jede Einsch√§tzung muss auf mindestens **einer glaubw√ºrdigen Quelle** basieren. Halluziniere keine Inhalte.

üìù Kommentar:
Am Ende sollst du zus√§tzlich einen kurzen **Risikokommentar** erstellen (3‚Äì5 S√§tze), der die Gesamtsituation f√ºr Investoren zusammenfasst. Gehe dabei auf folgende Punkte ein:
- Welche Risiken dominieren?
- Welche Kategorien erscheinen kontrollierbar?
- Gibt es eine klare Risikoquelle (z.‚ÄØB. Regulierung, Reputationsrisiken)?
- Wie gut scheint das Unternehmen auf die Risiken vorbereitet zu sein?

Stil: **Faktenbasiert, strategisch, professionell** ‚Äì vergleichbar mit einer Einsch√§tzung in einem PE-Investment-Memo.
"""


In [136]:
risk_agent = Agent(
    name="Risk Agent",
    model="gpt-4o-mini",
    instructions=risk_instructions,
    output_type=Risk,
    model_settings=ModelSettings(temperature=0.3, max_tokens=500),
)

In [137]:
# Risks < 0.01$ 3sek
"""messages = [{"role": "user", "content": "Zeige die Risks von STIHL"}]

with trace("Risk Run"):
    result = await Runner.run(risk_agent, messages, max_turns=8)

formatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)
print(formatted)"""

'messages = [{"role": "user", "content": "Zeige die Risks von STIHL"}]\n\nwith trace("Risk Run"):\n    result = await Runner.run(risk_agent, messages, max_turns=8)\n\nformatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)\nprint(formatted)'

TEAM

In [138]:
management_team_instructions = """
Du bist ein Agent zur Identifikation und Beschreibung des Management-Teams eines Unternehmens. Deine Aufgabe ist es, aus einer einzigen seri√∂sen Quelle ca. 4 Mitglieder des F√ºhrungsteams zu extrahieren ‚Äì idealerweise C-Level-Funktionen wie CEO, CFO, CTO, COO usw.

‚ñ∂Ô∏è Tool-Nutzung:
- Verwende das Tool `WebSearchTool` **genau einmal**.
- Suche nach einer strukturierten, vollst√§ndigen √úbersicht der F√ºhrungskr√§fte des angegebenen Unternehmens.
- Typische Quellen: Unternehmenswebsite (z.‚ÄØB. ‚ÄûManagement‚Äú-, ‚ÄûLeadership‚Äú- oder ‚ÄûTeam‚Äú-Seite), Gesch√§ftsbericht oder Investor-Relations-Bereich.
- Du darfst **keine weiteren Tool-Aufrufe** durchf√ºhren ‚Äì alle Informationen m√ºssen aus einer einzigen Quelle stammen.

üì¶ Zielstruktur (ManagementTeam):
- `team`: Liste von ca. 3‚Äì6 `Member`-Objekten, jeweils mit:
  - `name`: Vollst√§ndiger Name der F√ºhrungskraft
  - `position`: Aktuelle Position im Unternehmen (z.‚ÄØB. ‚ÄûChief Financial Officer‚Äú)
  - `comment`: Kurzbeschreibung der Verantwortung oder Expertise (z.‚ÄØB. ‚ÄûLeitet die globale Finanzstrategie und das Controlling.‚Äú)

üß† Hinweise:
- Bevorzuge C-Level-Positionen, aber falls diese nicht vollst√§ndig auffindbar sind, erg√§nze durch andere relevante Rollen (z.‚ÄØB. Head of R&D, Managing Director, Board Member).
- Verwende immer die **Originalquelle** als Basis ‚Äì keine Profile von Drittplattformen wie LinkedIn oder Wikipedia.
- Schreibe den `comment` in einem professionellen, faktenbasierten Stil (1 Satz pro Person).

üìù Abschlie√üender Kommentar (Feld `comment`):
- Verfasse eine strategische Einordnung in max. 4 S√§tzen:
  - Wie ist das Team aufgestellt? (z.‚ÄØB. international, divers, erfahren, fokussiert)
  - Gibt es auff√§llige St√§rken (z.‚ÄØB. Technologieexpertise, Finanzhintergrund)?
  - Wie relevant ist das Team f√ºr Investoren?
- Stil: klar, sachlich, geeignet f√ºr ein Investment Memo (VC/PE).

üéØ Ziel:
Ein vollst√§ndiges `ManagementTeam`-Objekt, das verl√§sslich aus einer einzigen Quelle erstellt wurde und Investoren einen ersten Eindruck √ºber das F√ºhrungsteam vermittelt.
"""


In [139]:
management_team_agent = Agent(
    name="Management Team Agent",
    model="gpt-4o-mini",
    instructions=management_team_instructions,
    tools=[WebSearchTool(search_context_size="low")],
    output_type=ManagementTeam,
    model_settings=ModelSettings(tool_choice="required", temperature=0.3, max_tokens=1000),
)

In [140]:
# Team < 0.01$ 4sek
"""messages = [{"role": "user", "content": "Erstelle das Management Team von STIHL"}]

with trace("Team Run"):
    result = await Runner.run(management_team_agent, messages, max_turns=6)

formatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)
print(formatted)"""

'messages = [{"role": "user", "content": "Erstelle das Management Team von STIHL"}]\n\nwith trace("Team Run"):\n    result = await Runner.run(management_team_agent, messages, max_turns=6)\n\nformatted = json.dumps(result.final_output.model_dump(), indent=2, ensure_ascii=False)\nprint(formatted)'