In [1]:
from langchain_openai import ChatOpenAI
from langchain_core.messages import AIMessage, HumanMessage, SystemMessage
import os
import streamlit as st
import docx
import json

# Set up the OpenAI API key from Streamlit secrets
os.environ["OPENAI_API_KEY"] = st.secrets["openai_api_key"]

In [2]:
llm = ChatOpenAI(
    model="gpt-4.1-mini",
    temperature=0.7,
    max_tokens=10000,
    openai_api_key=os.getenv("OPENAI_API_KEY"),
)

In [3]:
llm.invoke("What is the capital of France?")  # Example invocation

AIMessage(content='The capital of France is Paris.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 7, 'prompt_tokens': 14, 'total_tokens': 21, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-4.1-mini-2025-04-14', 'system_fingerprint': None, 'id': 'chatcmpl-Bwc6Mp9clRSV1kHRG0TBieLnRxD4e', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--93a3804a-339f-42a5-b933-43d54490c774-0', usage_metadata={'input_tokens': 14, 'output_tokens': 7, 'total_tokens': 21, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

In [4]:
# Function to read text from a DOCX file
def getText(filename):
    doc = docx.Document(filename)
    fullText = []
    for para in doc.paragraphs:
        fullText.append(para.text)
    return '\n'.join(fullText)

In [5]:
talimat = r"src/data/1- Talimat Dosyası.docx"
talimat = getText(talimat)
talimat[:1000]  # Display the first 1000 characters of the document

'Dharma-Sutra Çeviri Asistanı – Talimat Dosyası\n\nBu GPT, Buddha Siddhārtha Gautama\'nın öğretilerini Tripiṭaka\'dan (özellikle Pali kanonundaki Majjhimanikāya, Saṁyuttanikāya, Aṅguttaranikāya ve Dīghanikāya) referans alarak Sutra-sutta çevirileri yapar.\nKullanıcıya \'hakikati arayan soylu dost\' diye hitap eder ve sadece Buddha\'nın zamanında var olan kavramlardan bahseder.\nKendisine yüklenen veya sorulan Palice-İngilizce ve Palice-Türkçe sutraların çevirilerini, kütüphanesinde yüklü olan "SN 56 Dharma Çarkını Döndürme Vaazı-Terminolojik Analiz" belgesindeki terimleri, "Türkçe Sutta Kitabı"nda kullanılan terimleri, "temel terimler sözlüğü", "detaylı palice sözlük" ve "Cem Şen Çeviri Üslubu Rehberi" adlı belgelerde belirtilen üslup ve terminolojiye sadık kalarak yapar. Bulamadığı terimler olursa da terimlerin karşılıklarını internette arar.  \nModern yorumlardan kaçınır; doğrudan Pali metinlerine ve onların Türkçe ya da İngilizce karşılıklarına sadık kalır. Çeviri yaptığı zaman, hem

In [6]:
uslup = r"src/data/2-Cem Şen Çeviri Üslubu Rehberi.docx"
uslup = getText(uslup)
uslup[:150]

'Cem Şen Çeviri Üslubu Rehberi\n1. Cümle Yapısı ve Dil Kullanımı\nCem Şen orta uzunlukta, kurallı ve sade cümleler kurar. Devrik yapılar kullanılmaz, dil'

In [7]:
with open("src/data/sozluk.json", "r", encoding="utf-8") as f:
    sozluk_dict = json.load(f)
sozluk_dict[:2]

[{'pali': 'aísa',
  'turkish_translation': 'Hastalık',
  'explanation': 'Hastalık, özellikle hemoroid veya Catubhánavára’ya göre fimozis (A V 110).'},
 {'pali': 'akiñcana',
  'turkish_translation': 'Sahipsizlik, engelsizlik',
  'explanation': 'Engellenmeme durumu veya hiçbir şeye sahip olmama hali; “hiçbir şey” anlamında kullanılır.'}]

In [8]:
example_path = r"src/data/ceviri_ornek.txt"

with open(example_path, "r", encoding="utf-8") as f:
    example_text = f.read()

example_text[:1000]  # Display the first 1000 characters of the example text

'ANATTALAKKHAṆA SUTTA PALİ ORJİNAL:\n\nEkaṁ samayaṁ bhagavā bārāṇasiyaṁ viharati isipatane migadāye. Tatra kho bhagavā pañcavaggiye bhikkhū āmantesi:\n\n“bhikkhavo”ti.\n\n“Bhadante”ti te bhikkhū bhagavato paccassosuṁ. Bhagavā etadavoca:\n\n“Rūpaṁ, bhikkhave, anattā. Rūpañca hidaṁ, bhikkhave, attā abhavissa, nayidaṁ rūpaṁ ābādhāya saṁvatteyya, labbhetha ca rūpe: ‘evaṁ me rūpaṁ hotu, evaṁ me rūpaṁ mā ahosī’ti. Yasmā ca kho, bhikkhave, rūpaṁ anattā, tasmā rūpaṁ ābādhāya saṁvattati, na ca labbhati rūpe: ‘evaṁ me rūpaṁ hotu, evaṁ me rūpaṁ mā ahosī’ti.\n\nVedanā anattā. Vedanā ca hidaṁ, bhikkhave, attā abhavissa, nayidaṁ vedanā ābādhāya saṁvatteyya, labbhetha ca vedanāya: ‘evaṁ me vedanā hotu, evaṁ me vedanā mā ahosī’ti. Yasmā ca kho, bhikkhave, vedanā anattā, tasmā vedanā ābādhāya saṁvattati, na ca labbhati vedanāya: ‘evaṁ me vedanā hotu, evaṁ me vedanā mā ahosī’ti.\n\nSaññā anattā …pe…\n\nsaṅkhārā anattā. Saṅkhārā ca hidaṁ, bhikkhave, attā abhavissaṁsu, nayidaṁ saṅkhārā ābādhāya saṁvatteyy

In [9]:
prompt = """ 
Talimat, üslup ve sözlük bilgilerini kullanarak verilen Pali dilindeki metni Türkçeye çevir. Çeviri tarzını benimsemek için aşağıdaki örnek çeviriyi incele.
Örnek Çeviri:
{example_text}

Şimdi, kullanıcının verdiği Pali metni Türkçeye çevir. Çıktında sadece çeviri metnini ver, başka hiçbir şey ekleme. Çeviri metni Türkçe dil kurallarına uygun olmalıdır. Çevirilerinde anlaşılır ve akıcı bir dil kullanmalısın. 
Amacın Türkçe'ye çeviri yaparken Pali metninin anlamını doğru bir şekilde anlam kaybına uğratmadan yansıtmaktır. 

Orjinal Metin:
"""

In [10]:
system_prompt = talimat + "\n\n" + uslup + "\n\n"  + json.dumps(sozluk_dict, ensure_ascii=False) + "\n\n" + prompt.format(example_text=example_text)
len(system_prompt)

279688

In [11]:
def translate_text(llm, text, system_prompt):
    messages = [
        SystemMessage(content=system_prompt),
        HumanMessage(content=text)
    ]
    response = llm.invoke(messages)
    return response.content, response.response_metadata.get("token_usage", {}).get("completion_tokens", 0), response.response_metadata.get("token_usage", {}).get("prompt_tokens", 0)


In [12]:
sutta_path = r"src/data/Devadahasutta.txt"

with open(sutta_path, "r", encoding="utf-8") as f:
    sutta_text = f.read()

sutta_text[:1000]  # Display the first 1000 characters of the sutta text

'Devadahasutta\nEvaṁ me sutaṁ—ekaṁ samayaṁ bhagavā sakkesu viharati devadahaṁ nāma sakyānaṁ nigamo. Tatra kho bhagavā bhikkhū āmantesi: “bhikkhavo”ti.\n\n“Bhadante”ti te bhikkhū bhagavato paccassosuṁ. Bhagavā etadavoca:\n\n“santi, bhikkhave, eke samaṇabrāhmaṇā evaṁvādino evaṁdiṭṭhino: ‘yaṁ kiñcāyaṁ purisapuggalo paṭisaṁvedeti sukhaṁ vā dukkhaṁ vā adukkhamasukhaṁ vā, sabbaṁ taṁ pubbekatahetu. Iti purāṇānaṁ kammānaṁ tapasā byantībhāvā, navānaṁ kammānaṁ akaraṇā, āyatiṁ anavassavo; āyatiṁ anavassavā kammakkhayo; kammakkhayā dukkhakkhayo; dukkhakkhayā vedanākkhayo; vedanākkhayā sabbaṁ dukkhaṁ nijjiṇṇaṁ bhavissatī’ti. Evaṁvādino, bhikkhave, nigaṇṭhā.\n\nEvaṁvādāhaṁ, bhikkhave, nigaṇṭhe upasaṅkamitvā evaṁ vadāmi: ‘saccaṁ kira tumhe, āvuso nigaṇṭhā, evaṁvādino evaṁdiṭṭhino—yaṁ kiñcāyaṁ purisapuggalo paṭisaṁvedeti sukhaṁ vā dukkhaṁ vā adukkhamasukhaṁ vā, sabbaṁ taṁ pubbekatahetu. Iti purāṇānaṁ kammānaṁ tapasā byantībhāvā, navānaṁ kammānaṁ akaraṇā, āyatiṁ anavassavo; āyatiṁ anavassavā kammakkhay

In [13]:
translated_text, completion_tokens, prompt_tokens = translate_text(llm, sutta_text, system_prompt)
print(f"Translated Text:\n{translated_text}\n")
print(f"Completion Tokens: {completion_tokens}")
print(f"Prompt Tokens: {prompt_tokens}")

Translated Text:
Devadaha Sutta

Duydum ki bir zamanlar Kutlu Kişi, Sakya kabilesinin Devadaha adlı kasabasında konaklıyordu. Orada Kutlu Kişi keşişlere hitap etti:

“Keşişler!”

“Saygıdeğer Efendimiz!” diye yanıtladılar keşişler. Kutlu Kişi şöyle dedi:

“İzdeşler, bazı samanabrāhmaṇalar (yani keşişler ve brahmanlar) şöyle görüş sahibidir: ‘Bir insanın deneyimlediği her türlü mutluluk, ıstırap ya da ne acı ne zevk hali, hepsi geçmişte yapılan eylemlerin (karmaların) sonucudur. Eski karmalarla yapılan çile tamamlanmıştır, yeni karmalar yapılmamaktadır, bu yüzden sonsuzdur ve yok olmaz; sonsuz olan yok olur; yok olanın yerine ıstırap gelir; ıstırap sona erdiğinde hislerin sona ermesi olur; hislerin sona ermesiyle tüm ıstırap söner.’ Böyle düşünenler nigaṇṭhālardır (yani Jainlerdir).

Ben de, keşişler, nigaṇṭhālara gelerek şöyle diyorum: ‘Gerçekten dostlarım nigaṇṭhālar, böyle görüş sahibisiniz: “Bir insanın deneyimlediği her türlü mutluluk, ıstırap ya da ne acı ne zevk hali, hepsi geçmiş

In [14]:
talimat

'Dharma-Sutra Çeviri Asistanı – Talimat Dosyası\n\nBu GPT, Buddha Siddhārtha Gautama\'nın öğretilerini Tripiṭaka\'dan (özellikle Pali kanonundaki Majjhimanikāya, Saṁyuttanikāya, Aṅguttaranikāya ve Dīghanikāya) referans alarak Sutra-sutta çevirileri yapar.\nKullanıcıya \'hakikati arayan soylu dost\' diye hitap eder ve sadece Buddha\'nın zamanında var olan kavramlardan bahseder.\nKendisine yüklenen veya sorulan Palice-İngilizce ve Palice-Türkçe sutraların çevirilerini, kütüphanesinde yüklü olan "SN 56 Dharma Çarkını Döndürme Vaazı-Terminolojik Analiz" belgesindeki terimleri, "Türkçe Sutta Kitabı"nda kullanılan terimleri, "temel terimler sözlüğü", "detaylı palice sözlük" ve "Cem Şen Çeviri Üslubu Rehberi" adlı belgelerde belirtilen üslup ve terminolojiye sadık kalarak yapar. Bulamadığı terimler olursa da terimlerin karşılıklarını internette arar.  \nModern yorumlardan kaçınır; doğrudan Pali metinlerine ve onların Türkçe ya da İngilizce karşılıklarına sadık kalır. Çeviri yaptığı zaman, hem

In [15]:
uslup

'Cem Şen Çeviri Üslubu Rehberi\n1. Cümle Yapısı ve Dil Kullanımı\nCem Şen orta uzunlukta, kurallı ve sade cümleler kurar. Devrik yapılar kullanılmaz, dil Türkçenin doğal akışına uygundur.\nKarmaşık gramer yapılarına yönelmez; her cümlede netlik ve anlamın doğrudan aktarımı esastır.\nDuygusal ya da metaforik ifadelerden çok, açıklayıcı ve doğrudan anlatım tercih edilir.\nMetin açık, sade ve doğal Türkçeyle çevrilmelidir.\nGereksiz süsleme, şiirsellik, atmosfer yaratımı veya çağdaş yorumlardan kaçınılmalıdır.\nCümleler kısa ve öz tutulmalı, anlam karmaşasından kaçınılmalıdır.\nTürkçeye uygun fiil zamanları kullanılmalı, anlam kaymasına neden olunmamalıdır.\n2. Terminolojik Sadakat\n“Tathāgata”, “Nibbāna”, “dukkha” (ızdırap), “taṇhā” (arzu) gibi terimler daima tutarlılıkla ve sabit biçimde kullanılır. Bu sabitlik anlam derinliğini korur.\nBudist kavramlar, açıklayıcı parantez veya doğrudan çevrilen Türkçeleştirme yöntemleriyle dengeli bir şekilde verilir.\nÖrnek: “Orta Yol” (Majjhimā Paṭi