# 2.2 Planzeichnung OCR – (GPT4o)

* Zero-Shot
* Chain-Of-Thought

In [25]:
from utils.image2base64 import image2base64
from utils.getImageSize import getImageSize
from dotenv import load_dotenv, find_dotenv
import os
from langchain_openai import ChatOpenAI
from langchain.schema.messages import AIMessage, HumanMessage

load_dotenv(find_dotenv())

model = ChatOpenAI(
    openai_api_key=os.getenv("OPENAI_API_KEY"),
    model_name="gpt-4o",
    model_kwargs={"top_p": 0, "seed": 42},
    temperature=0,
)

In [17]:
# PZ (FULL SIZE, RAW)

pze_path = "../data/processed/bpläne/2_zeichnung_textteil_getrennt/F11-01-PZ-raw.png"
base64_pze = image2base64(pze_path)
print(getImageSize(pze_path))

msg1 = model.invoke([
    AIMessage(
        content=[
            {
                "type": "text",
                "text": "Du bist ein Assistent um Textinformationen aus einer Planzeichnung eines Bebauungsplans zu extrahieren."
            },
            # Output_1_PZE (best-case-scenario)
            {
                "type": "text",
                "text": "Hier ist die extrahierte Struktur der Nutzungsschablone in ASCII-Tabellenform: +---------------------+---------------------+| Art der Nutzung     | Gebäudehöhe         |+---------------------+---------------------+| Grundflächenzahl    | Nutzungsschablone   || Geschossflächenzahl | (§ 9 (1) 1 BauGB)   |+---------------------+---------------------+| Bauweise            |                     |+---------------------+---------------------+"
            },
            # Output_2_PZE (best-case-scenario)
            {
                "type": "text",
                 "text": 'Erklärung der Begriffe der Nutzungsschablone im JSON-Format: {"Art der Nutzung": {"Definition": "Gibt die Art der Nutzung des Grundstücks an, z.B. Gewerbegebiet.","Beispiel": "GE (Gewerbegebiet)"},"Gebäudehöhe": {"Definition": "Maximal zulässige Gebäudehöhe über Erdgeschossfußbodenhöhe.","Beispiel": "GH=max.12,00"},"Grundflächenzahl": {"Definition": "Gibt das Verhältnis der bebauten Fläche zur Grundstücksfläche an.","Beispiel": "0,6"},"Geschossflächenzahl": {"Definition": "Gibt das Verhältnis der gesamten Geschossfläche zur Grundstücksfläche an.","Beispiel": "1,2"},"Bauweise": {"Definition": "Gibt die Art und Weise der Bebauung an, z.B. abweichende Bauweise.","Beispiel": "a (abweichende Bauweise)"}}'
            },
        ]
    ),
    HumanMessage(
        content=[
        {
            "type": "text",
            "text": 'Gehe Schritt für Schritt vor: 1. Finde die Nutzungsschablonen in der vorliegenden Planzeichnung. 2. Gebe die Nutzungsschablone jeweils im JSON-Format aus.'
        },
        {
            "type": "image_url",
            "image_url": {
                "url": f"data:image/jpeg;base64,{base64_pze}",
                "detail": "high"
            }
        },
        ]
    ),
])

print(msg1.content)



[11118, 8208]


In [8]:
# PZ (SCALED)

pze_path = "../data/processed/bpläne/2_zeichnung_textteil_getrennt/F11-01-PZ.png"
base64_pze = image2base64(pze_path)
print(getImageSize(pze_path))

msg2 = model.invoke([
    AIMessage(
        content=[
            {
                "type": "text",
                "text": "Du bist ein Assistent um Textinformationen aus einer Planzeichnung eines Bebauungsplans zu extrahieren."
            },
            # Output_1_PZE (best-case-scenario)
            {
                "type": "text",
                "text": "Struktur der Nutzungsschablone in ASCII-Tabellenform: +---------------------+---------------------+| Art der Nutzung     | Gebäudehöhe         |+---------------------+---------------------+| Grundflächenzahl    | Nutzungsschablone   || Geschossflächenzahl | (§ 9 (1) 1 BauGB)   |+---------------------+---------------------+| Bauweise            |                     |+---------------------+---------------------+"
            },
            # Output_2_PZE (best-case-scenario)
            {
                "type": "text",
                "text": 'Erklärung der Begriffe der Nutzungsschablone im JSON-Format: {"Art der Nutzung": {"Definition": "Gewerbegebiete (GE) gemäß § 8 BauNVO und eingeschränkte Gewerbegebiete (GEE) gemäß § 8 BauNVO","Beispiel": "GE, GEE"},"Gebäudehöhe": {"Definition": "Maximal zulässige Gebäudehöhe über Erdgeschossfußbodenhöhe","Beispiel": "GH=max.12,00"},"Grundflächenzahl": {"Definition": "Grundflächenzahl (GRZ) gemäß § 16 BauNVO","Beispiel": "0,6"},"Geschossflächenzahl": {"Definition": "Geschossflächenzahl (GFZ) gemäß § 16 BauNVO","Beispiel": "1,2"},"Bauweise": {"Definition": "Abweichende Bauweise gemäß § 22 BauNVO","Beispiel": "a"}}'
            },
        ]
    ),
    HumanMessage(
        content=[
        {
            "type": "text",
            "text": 'Gehe Schritt für Schritt vor: 1. Finde alle Nutzungsschablonen in der vorliegenden Planzeichnung. 2. Gebe die Nutzungsschablonen jeweils im JSON-Format aus: {<Parameter>:<Wert>}'
        },
        {
            "type": "image_url",
            "image_url": {
                "url": f"data:image/jpeg;base64,{base64_pze}",
                "detail": "high"
            }
        },
        ]
    ),
])

print(msg2.content)

[1040, 768]
1. Finde alle Nutzungsschablonen in der vorliegenden Planzeichnung:

In der Planzeichnung sind mehrere Nutzungsschablonen zu erkennen. Diese sind durch die Beschriftungen "GE", "GEE", "GH=max.12,00", "0,6", "1,2" gekennzeichnet.

2. Gebe die Nutzungsschablonen jeweils im JSON-Format aus:

### Nutzungsschablone 1:
```json
{
  "Art der Nutzung": "GEE",
  "Gebäudehöhe": "GH=max.12,00",
  "Grundflächenzahl": "0,6",
  "Geschossflächenzahl": "1,2",
  "Bauweise": ""
}
```

### Nutzungsschablone 2:
```json
{
  "Art der Nutzung": "GE",
  "Gebäudehöhe": "GH=max.12,00",
  "Grundflächenzahl": "0,6",
  "Geschossflächenzahl": "1,2",
  "Bauweise": ""
}
```

### Nutzungsschablone 3:
```json
{
  "Art der Nutzung": "GE",
  "Gebäudehöhe": "GH=max.12,00",
  "Grundflächenzahl": "0,6",
  "Geschossflächenzahl": "1,2",
  "Bauweise": ""
}
```

### Nutzungsschablone 4:
```json
{
  "Art der Nutzung": "GE",
  "Gebäudehöhe": "GH=max.12,00",
  "Grundflächenzahl": "0,6",
  "Geschossflächenzahl": "1,2",
 

In [19]:
# PZ (SCALED, CROPPED)

pze_path = "../data/processed/bpläne/2_zeichnung_textteil_getrennt/F11-01-PZ-crop.png"
base64_pze = image2base64(pze_path)
print(getImageSize(pze_path))

msg3 = model.invoke([
    AIMessage(
        content=[
            {
                "type": "text",
                "text": "Du bist ein Assistent um Textinformationen aus einer Planzeichnung eines Bebauungsplans zu extrahieren."
            },
            # Output_1_PZE (best-case-scenario)
            {
                "type": "text",
                "text": "Struktur der Nutzungsschablone in ASCII-Tabellenform: +---------------------+---------------------+| Art der Nutzung     | Gebäudehöhe         |+---------------------+---------------------+| Grundflächenzahl    | Nutzungsschablone   || Geschossflächenzahl | (§ 9 (1) 1 BauGB)   |+---------------------+---------------------+| Bauweise            |                     |+---------------------+---------------------+"
            },
            # Output_2_PZE (best-case-scenario)
            {
                "type": "text",
                "text": 'Erklärung der Begriffe der Nutzungsschablone im JSON-Format: {"Art der Nutzung": {"Definition": "Gewerbegebiete (GE) gemäß § 8 BauNVO und eingeschränkte Gewerbegebiete (GEE) gemäß § 8 BauNVO","Beispiel": "GE, GEE"},"Gebäudehöhe": {"Definition": "Maximal zulässige Gebäudehöhe über Erdgeschossfußbodenhöhe","Beispiel": "GH=max.12,00"},"Grundflächenzahl": {"Definition": "Grundflächenzahl (GRZ) gemäß § 16 BauNVO","Beispiel": "0,6"},"Geschossflächenzahl": {"Definition": "Geschossflächenzahl (GFZ) gemäß § 16 BauNVO","Beispiel": "1,2"},"Bauweise": {"Definition": "Abweichende Bauweise gemäß § 22 BauNVO","Beispiel": "a"}}'
            },
        ]
    ),
    HumanMessage(
        content=[
        {
            "type": "text",
            "text": 'Gehe Schritt für Schritt vor: 1. Finde alle Nutzungsschablonen in der vorliegenden Planzeichnung. 2. Gebe die Nutzungsschablonen jeweils im JSON-Format aus: {<Parameter>:<Wert>}'
        },
        {
            "type": "image_url",
            "image_url": {
                "url": f"data:image/jpeg;base64,{base64_pze}",
                "detail": "high"
            }
        },
        ]
    ),
])

print(msg3.content)

[1359, 768]
Schritt 1: Finde alle Nutzungsschablonen in der vorliegenden Planzeichnung.

In der Planzeichnung sind folgende Nutzungsschablonen zu finden:

1. Nutzungsschablone 1:
   - Art der Nutzung: GEE
   - Gebäudehöhe: max. 12,00
   - Grundflächenzahl: 0,6
   - Geschossflächenzahl: 1,2
   - Bauweise: a

2. Nutzungsschablone 2:
   - Art der Nutzung: GE
   - Gebäudehöhe: max. 12,00
   - Grundflächenzahl: 0,6
   - Geschossflächenzahl: 1,2
   - Bauweise: -

Schritt 2: Gebe die Nutzungsschablonen jeweils im JSON-Format aus:

Nutzungsschablone 1:
```json
{
  "Art der Nutzung": "GEE",
  "Gebäudehöhe": "max. 12,00",
  "Grundflächenzahl": "0,6",
  "Geschossflächenzahl": "1,2",
  "Bauweise": "a"
}
```

Nutzungsschablone 2:
```json
{
  "Art der Nutzung": "GE",
  "Gebäudehöhe": "max. 12,00",
  "Grundflächenzahl": "0,6",
  "Geschossflächenzahl": "1,2",
  "Bauweise": "-"
}
```


In [24]:
# PZ (SCALED, CROPPED, BOUNDING-BOX)

pze_path = "../data/processed/bpläne/2_zeichnung_textteil_getrennt/F11-01-PZ-bb-crop.png"
base64_pze = image2base64(pze_path)
print(getImageSize(pze_path))

msg4 = model.invoke([
    AIMessage(
        content=[
            {
                "type": "text",
                "text": "Du bist ein Assistent um Textinformationen aus einer Planzeichnung eines Bebauungsplans zu extrahieren."
            },
            # Output_1_PZE (best-case-scenario)
            {
                "type": "text",
                "text": "Struktur der Nutzungsschablone in ASCII-Tabellenform: +---------------------+---------------------+| Art der Nutzung     | Gebäudehöhe         |+---------------------+---------------------+| Grundflächenzahl    | Nutzungsschablone   || Geschossflächenzahl | (§ 9 (1) 1 BauGB)   |+---------------------+---------------------+| Bauweise            |                     |+---------------------+---------------------+"
            },
            # Output_2_PZE (best-case-scenario)
            {
                "type": "text",
                "text": 'Erklärung der Begriffe der Nutzungsschablone im JSON-Format: {"Art der Nutzung": {"Definition": "Gewerbegebiete (GE) gemäß § 8 BauNVO und eingeschränkte Gewerbegebiete (GEE) gemäß § 8 BauNVO","Beispiel": "GE, GEE"},"Gebäudehöhe": {"Definition": "Maximal zulässige Gebäudehöhe über Erdgeschossfußbodenhöhe","Beispiel": "GH=max.12,00"},"Grundflächenzahl": {"Definition": "Grundflächenzahl (GRZ) gemäß § 16 BauNVO","Beispiel": "0,6"},"Geschossflächenzahl": {"Definition": "Geschossflächenzahl (GFZ) gemäß § 16 BauNVO","Beispiel": "1,2"},"Bauweise": {"Definition": "Abweichende Bauweise gemäß § 22 BauNVO","Beispiel": "a"}}'
            },
        ]
    ),
    HumanMessage(
        content=[
        {
            "type": "text",
            "text": 'Gehe Schritt für Schritt vor: 1. Finde alle rot umrandeten Nutzungsschablonen in der vorliegenden Planzeichnung. 2. Gebe die Nutzungsschablonen jeweils im JSON-Format aus: {<Parameter>:<Wert>}'
        },
        {
            "type": "image_url",
            "image_url": {
                "url": f"data:image/jpeg;base64,{base64_pze}",
                "detail": "high"
            }
        },
        ]
    ),
])

print(msg4.content)

[1359, 768]
Hier sind die Nutzungsschablonen aus der Planzeichnung im JSON-Format:

1. Nutzungsschablone oben links:
```json
{
  "Art der Nutzung": "GEE",
  "Gebäudehöhe": "GH=max.12,00",
  "Grundflächenzahl": "0,6",
  "Geschossflächenzahl": "1,2",
  "Bauweise": "-"
}
```

2. Nutzungsschablone oben rechts:
```json
{
  "Art der Nutzung": "GE",
  "Gebäudehöhe": "GH=max.12,00",
  "Grundflächenzahl": "0,6",
  "Geschossflächenzahl": "1,2",
  "Bauweise": "-"
}
```

3. Nutzungsschablone unten links:
```json
{
  "Art der Nutzung": "GEE",
  "Gebäudehöhe": "GH=max.12,00",
  "Grundflächenzahl": "0,6",
  "Geschossflächenzahl": "1,2",
  "Bauweise": "-"
}
```

4. Nutzungsschablone unten rechts:
```json
{
  "Art der Nutzung": "GE",
  "Gebäudehöhe": "GH=max.12,00",
  "Grundflächenzahl": "0,6",
  "Geschossflächenzahl": "1,2",
  "Bauweise": "-"
}
```
