In [None]:

import base64
import os
from mistralai import Mistral
from src.utils.config import get_config_value

mistral_token = get_config_value("mistral")
api_key = mistral_token.get("token") 

def encode_image(image_path):
    """Encode the image to base64."""
    try:
        with open(image_path, "rb") as image_file:
            return base64.b64encode(image_file.read()).decode('utf-8')
    except FileNotFoundError:
        print(f"Error: The file {image_path} was not found.")
        return None
    except Exception as e:  # Added general exception handling
        print(f"Error: {e}")
        return None

def main(): 
    client = Mistral(api_key=api_key)
    ocr_response = client.ocr.process(
        model="mistral-ocr-latest",
        document={
            "type": "image_url",
            "image_url": f"data:image/jpeg;base64,{encode_image("/Users/pawarison/dev/DocuFlow/data/synthetic_data/credit_notes/credit_note_1.png")}" 
        },
        include_image_base64=True
    )
    return ocr_response
    # with open("test.md", "w") as f:
    #     f.write(ocr_response.pages[0].markdown)

if __name__ == "__main__":
    ocr_response = main()

In [8]:
print(ocr_response.pages[0].markdown)

# บริษัท โกลบอล โลจิสติกส์ โซลูชั่นส์

999/9 อาคารคี ออฟฟิศเคส แอท เซ็นทรัลเวิลด์ ชั้น 40 ถ.พระราม 1 แขวงปทุมวัน เขตปทุมวัน กรุงเทพฯ 10330 โทร: 02-123-4567 เลขประจำตัวผู้เสียภาษี: 0879189666478

ลูกค้า: หจก. สยามการพิมพ์ ที่อยู่: 101 อาคารทรู ศิริทัล พารค ชั้น 7 ถ.สุขุมวิท แขวงบางจาก เขตพระพุทธ กรุงเทพฯ 103984/2025

เรียน: คุณสุนีย์ โทร: 02-123-4567 เลขประจำตัวผู้เสียภาษี: 0560437188559

|  ลำดับ รายการ | จำนวน | ราคา/หน่วย | จำนวนเงิน  |
| --- | --- | --- | --- |
|  1 บริการที่ปรึกษาคำแถวรดลาดศิริทัล (เดือน มี.ย.) | 1 | 30,000.00 | 30,000.00  |
|  2 คาบำรุงรักษาระบบรายปี | 1 | 20,000.00 | 20,000.00  |
|  3 คาเขา Cloud Server - Business Package | 3 | 2,500.00 | 7,500.00  |
|  4 พัฒนาและออกแบบเว็บไซต์ (E-commerce) | 1 | 75,000.00 | 75,000.00  |
|  เรียนโขการข้าระเงิน: ข้าระพันทิเมื่อโต่วันเอกสาร ข้อมูลการโอนเงิน: ธ.กติกริไทย บัญชีออมทรัพย์ 012-3-45678-9 | ยอดรวม (Subtotal) | 132,500.00 |   |
|   | ภาษีมูลค่าเพิ่ม (VAT 7%) | 9,275.00 |   |
|   | ยอดข้าระทั้งสิ้น | 141,775.00 |   |

ผู้อน

In [12]:
# !pip install typhoon-ocr 
# brew install poppler
from typhoon_ocr import ocr_document

# Or with image
markdown = ocr_document(
    pdf_or_image_path="/Users/pawarison/dev/DocuFlow/data/synthetic_data/credit_notes/credit_note_1.png",  # Works with PDFs or images
    task_type="structure",    # Choose between "default" or "structure"
    page_num=1,
    api_key="sk-6UqhbIzqwx3SlQBy12ufkIoMSkILFZWWPgbdvRjxb9RtJbQ1"
)

In [13]:
from IPython.display import Markdown, display

display(Markdown(markdown))

บริษัท โกลบอล เลสิติกส์ โซลูชั่นส์

ใบสดหนี้
99/9 อาคารดี ออฟฟิศเตค แอนด์ พื้นที่จัดแสดง สัง 40 ถ.พระราม 1 แขวงปทุมวัน เขตปทุมวัน กรุงเทพฯ 10330
โทร. 02-123-4567 เลขประจำตัวผู้เสียภาษี 0379189666478

ลูกค้า: พกง.สยามการพิมพ์
เลขที่
AC-2025-4837

ที่อยู่: 101 อาคารกรุงธน ซีเน็คทาวร์ ฟาร์ค ชั้น 7 กรุงธนิเวศน์ แขวงบางจาก เขตบางกะปิ กรุงเทพฯ 10250/4,2025
เป็นต. กบุญยืน โทร. 02-123-4567
เลขประจำตัวผู้เสียภาษี 0360437188559
<table>
<tr>
<th colspan="2">ลำดับรายการ</th>
<th>จำนวน</th>
<th>ราคา/หน่วย</th>
<th>จำนวนเงิน</th>
</tr>
<tr>
<td>1</td>
<td>บริการให้เช่าพื้นที่สำหรับจัดงานประชุม (เดือน มิ.ย.)</td>
<td>1</td>
<td>30,000.00</td>
<td>30,000.00</td>
</tr>
<tr>
<td>2</td>
<td>ดำเนินกิจการระบบรายปี</td>
<td>1</td>
<td>20,000.00</td>
<td>20,000.00</td>
</tr>
<tr>
<td>3</td>
<td>อาเซา Cloud Server - Business Package</td>
<td>3</td>
<td>2,500.00</td>
<td>7,500.00</td>
</tr>
<tr>
<td>4</td>
<td>พัฒนาและออกแบบเว็บไซต์ (E-commerce)</td>
<td>1</td>
<td>75,000.00</td>
<td>75,000.00</td>
</tr>
</table>
เรื่องใช้การชำระเงิน : ชำระทันทีเมื่อได้รับเอกสาร
ข้อมูลการโอนเงิน: ธ.กสิกรไทย บัญชีออมทรัพย์ 012-3-45678-9

ยอดรวม (Subtotal)
132,500.00

ภาษีมูลค่าเพิ่ม (VAT 7%)
9,275.00

ยอดชำระทั้งสิ้น
141,775.00

ผู้อนุมัติ

ผู้รับเงิน / ผู้ดำรง

In [42]:
# !uv pip install agentic-doc 

[2mAudited [1m1 package[0m [2min 1ms[0m[0m


In [39]:
import os
  
os.environ["VISION_AGENT_API_KEY"] = "ZTVrc2JiamN0MDA5ZGprbHh6MmdtOlFSdTZhVlFKcGo2cDBuYjBOYm1uZWY2QlQzd21nZ1Zo"
os.environ["GOOGLE_API_KEY"] = "AIzaSyA_cJAOFVHZ8npAP_zHP3yQmfIj6tiOrcE"

In [44]:
from agentic_doc.parse import parse

# Parse a local file
result = parse("/Users/pawarison/dev/DocuFlow/data/synthetic_data/credit_notes/credit_note_1.png")
 

ModuleNotFoundError: No module named 'google.api_core'

In [51]:
!pip install google-api-core


[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m A new release of pip is available: [0m[31;49m24.0[0m[39;49m -> [0m[32;49m25.1.1[0m
[1m[[0m[34;49mnotice[0m[1;39;49m][0m[39;49m To update, run: [0m[32;49mpip install --upgrade pip[0m


In [53]:
from agentic_doc.parse import parse
from agentic_doc.connectors import LocalConnectorConfig

config = LocalConnectorConfig()

# Parse all supported documents in a directory
results = parse(config, connector_path="/Users/pawarison/dev/DocuFlow/data/synthetic_data/credit_notes")

# Parse with pattern filtering
results = parse(config, connector_path="/Users/pawarison/dev/DocuFlow/data/synthetic_data/credit_notes", connector_pattern="*.pdf")

# Parse all supported documents in a directory recursively (search subdirectories as well)
config = LocalConnectorConfig(recursive=True)
results = parse(config, connector_path="/path/to/documents")

ModuleNotFoundError: No module named 'google.api_core'

In [None]:
from vision_agent.agent import VisionAgentCoderV2
from vision_agent.models import AgentMessage

# Enable verbose output 
agent = VisionAgentCoderV2(verbose=True)

# Add your prompt (content) and image file (media)
code_context = agent.generate_code(
    [
        AgentMessage(
            role="user",
            content="Describe the image",
            media=["/Users/pawarison/dev/DocuFlow/data/synthetic_data/credit_notes/credit_note_1.png"]
        )
    ]
)

# Write the output to a file
with open("generated_code.py", "w") as f:
    f.write(code_context.code + "\n" + code_context.test)

TypeError: "Could not resolve authentication method. Expected either api_key or auth_token to be set. Or for one of the `X-Api-Key` or `Authorization` headers to be explicitly omitted"