In [11]:
from groq import Groq
import easyocr
from PIL import Image
import dotenv
import os

# Load environment variables
dotenv.load_dotenv()
GROQ_API_KEY = os.getenv("GROQ_API_KEY")
# Initialize EasyOCR reader for Arabic
reader = easyocr.Reader(['ar'])  # 'ar' for Arabic

# Function to extract text from image using EasyOCR
def extract_text_from_image(image_path):
    # Read the image
    result = reader.readtext(image_path)
    # Combine all detected text into one string
    extracted_text = " ".join([text[1] for text in result])
    return extracted_text

# Initialize Groq client with your API key
client = Groq(api_key=GROQ_API_KEY)  # Replace with your actual key

# Path to your image containing Arabic text
image_path = "data\pic_8.jpeg"  # Replace with your image path

# Extract Arabic text from image
arabic_text = extract_text_from_image(image_path)

print("Extracted Arabic Text:", arabic_text)

# Prepare the translation prompt
translation_prompt = f"""
Translate the following Arabic text to English accurately.
Provide only the English translation, without additional notes.

Arabic text:
{arabic_text}
"""

# Get translation from Groq model
print("\nEnglish Translation:")
completion = client.chat.completions.create(
    model="meta-llama/llama-4-scout-17b-16e-instruct",
    messages=[{"role": "user", "content": translation_prompt}],
    temperature=0.3,  # Lower for more accurate translations
    max_completion_tokens=1024,
    top_p=1,
    stream=True,
    stop=None,
)

for chunk in completion:
    print(chunk.choices[0].delta.content or "", end="")

Extracted Arabic Text: بحمد اللا وتوفيقه انطلقت حملة فريق سمدالشأن لخبري ولجنة الزكاة بسمد الشأن يوم الجمعه غرة ربيع الأول ٤٤٢ ه ^٨١٠7 ١< <م لمساعدة [هالينا المنضررين من إعصارشا هبن ، فيالباطنة ، وقداشترك في الحملة )٢٥٠( فردآ تقريبآ مصحوبه معها وقبلها ) يوي الثلاخاء والخميس ( با ا( شاحنات منالمساعدات المننوعت كا لماء والغذاء والاثاتء وذلك معدات الننظيف ا لمثنوعة خاصه خاتلات ومزيلات الأتربة والأوساخ ) اشبول حماتميزت به لحملآ الصغبر ( وعلاها)0( مع صهريج للماء ، اضافت إلى وجود لجلة نسائيه توزع | لأعراض |لخاصه باللساء طفال ب فلله الحمد والمنة علىتوفيفه لنجاح الحمله في تء وتموى بالأثاث وامواد تحقيق أهدا فهامن تنظيف المخنلفة < ومساعرة ثي نقلالسيارات العالفة بعر توفيق الله _ لولا ذلكم النجاح للحملة أذ ومن من أهالي سمد السان وقراها ب بل الدعم المجممى وأخص با لذكر ، جزيل الشكر والنقدير حا رجها أيضا   فلهم والشكر المنبرعين بأموالهم ومعداتهم _سمد  ولذلك نبج | خبر بعض |اطوسسات وفي محدمتها , ٢ وهزا والاء للبيو وماكان تحتقق الكبير جمعً صفور

English Translation:
With praise and facilitation from All

In [13]:
from groq import Groq
import easyocr
from PIL import Image
import dotenv
import os

# Load environment variables
dotenv.load_dotenv()
GROQ_API_KEY = os.getenv("GROQ_API_KEY")

# Initialize EasyOCR reader for Arabic
reader = easyocr.Reader(['ar'])  # 'ar' for Arabic

# Function to extract text from image using EasyOCR
def extract_text_from_image(image_path):
    # Read the image
    result = reader.readtext(image_path)
    # Combine all detected text into one string
    extracted_text = " ".join([text[1] for text in result])
    return extracted_text

# Initialize Groq client
client = Groq(api_key=GROQ_API_KEY)

def get_translation(text, direction):
    if direction == "to_english":
        prompt = f"""
        Translate the following Arabic text to English accurately.
        Provide only the English translation, without additional notes.

        Arabic text:
        {text}
        """
    else:
        prompt = f"""
        Translate the following English text back to Arabic accurately.
        Provide only the Arabic translation, without additional notes.

        English text:
        {text}
        """
    
    completion = client.chat.completions.create(
        model="meta-llama/llama-4-scout-17b-16e-instruct",
        messages=[{"role": "user", "content": prompt}],
        temperature=0.3,
        max_completion_tokens=1024,
        top_p=1,
        stop=None,
    )
    return completion.choices[0].message.content

def calculate_similarity(original, back_translation):
    # This is a simple similarity check - you could implement a more sophisticated one
    original_words = set(original.split())
    back_words = set(back_translation.split())
    common_words = original_words.intersection(back_words)
    similarity = len(common_words) / len(original_words) * 100
    return similarity

# Path to your image containing Arabic text
image_path = "data\pic_1.jpeg"  # Replace with your image path

# Extract Arabic text from image
original_arabic = extract_text_from_image(image_path)
print("Original Arabic Text:", original_arabic)

# First translation to English
print("\nFirst Translation to English:")
english_translation = get_translation(original_arabic, "to_english")
print(english_translation)

# Back-translation to Arabic for verification
print("\nBack-translation to Arabic for verification:")
arabic_back_translation = get_translation(english_translation, "to_arabic")
print(arabic_back_translation)

# Calculate similarity between original and back-translated text
similarity_score = calculate_similarity(original_arabic, arabic_back_translation)
print(f"\nSimilarity between original and back-translated text: {similarity_score:.2f}%")

# Decide whether to retranslate based on similarity threshold
if similarity_score < 80:  # Adjust threshold as needed
    print("\nLow similarity detected. Retranslating...")
    refined_english = get_translation(original_arabic, "to_english")
    print("\nRefined English Translation:")
    print(refined_english)
else:
    print("\nTranslation accuracy is acceptable.")

Original Arabic Text: م^3  [٤2 @ 4٥ ٠١١١ ١١١ ٥ ٣د^ى3  ى3طء 2 م[{ ى9هىى 5 ٨0١ متطعمع@ىعز٨هز[  ٨أ8ن_ .ىأ[طس @٥٢٣  ٨ ٧طئ3طئ  ع3ع :طىس نط٧[  سم الل الرعمن امرملكى بتحويلاسم المملكة الحجازية النجدية وملحتاتها الصاسم المملحتالعتبية السعودبة بدالاعتادعاء امه , وتدتائتارن منالرفبات منكانة رعامكانا واللكةالتبازعة رن دوماحتاتما , وننولاغتان دغبة الرأيالمام ذبلادنًا رباج تسند ابزاءمد الملحد المجت . امكا بكاموآت : المادةلاء : بعوذام) اللحة المجازمة انبدتة داحقا تنا ( الاسم ) املحةالمكن السودبة (, رببع لنبا الآندل ملحة المبة السمردية ( المادة الثانهة : املامنه ببري منا تذا النموجل اعتبانامنتاربخ 1 لمادةالذااثة وذلتداالنموبل أب ننمتىالنامل اتوالانانات والالزامات , الدولب ذالب ننعاءذنبا , دمذمولكا ء وحذلد لابعوءلة تانبتل التاولات رالسن الاض ادت- تبلللعان : اسادقاا اتن : تازالطامات والقجات رلارامرانانذ راماون مننبانا ت ماءلناضن: اان تذاالمويل ٠ للادةالخاكة : نظلات بات عدونا المانن سواء نذالمبان رنبدن امتاها تائ مالها الحاضر متقذاال انم دف نبلان ديدة لامملك : كلماعل اخاىاللبلالبدد. للادةالناتنة عدجلن ن

In [14]:
from groq import Groq
import easyocr
import json
import dotenv
import os

# Load environment variables
dotenv.load_dotenv()
GROQ_API_KEY = os.getenv("GROQ_API_KEY")

# Initialize EasyOCR reader for Arabic
reader = easyocr.Reader(['ar'])

def extract_text_from_image(image_path):
    """Extract Arabic text from image using EasyOCR"""
    result = reader.readtext(image_path)
    return " ".join([text[1] for text in result])

def get_translation(text, direction, temperature=0.3):
    """Get translation using Groq's model with adjustable temperature"""
    client = Groq(api_key=GROQ_API_KEY)
    
    if direction == "to_english":
        prompt = f"""
        Translate this Arabic text to English with perfect accuracy:
        {text}
        
        Rules:
        1. Preserve all meaning
        2. Maintain cultural context
        3. Keep formal tone
        4. Output ONLY the translation
        """
    else:
        prompt = f"""
        Translate this English text to Arabic with perfect accuracy:
        {text}
        
        Rules:
        1. Preserve all meaning
        2. Maintain cultural context
        3. Keep formal tone
        4. Output ONLY the translation
        """
    
    completion = client.chat.completions.create(
        model="meta-llama/llama-4-scout-17b-16e-instruct",
        messages=[{"role": "user", "content": prompt}],
        temperature=temperature,
        max_tokens=1024,
        top_p=1
    )
    return completion.choices[0].message.content.strip()

def verify_translation(original_arabic, english_translation):
    """Comprehensive translation verification"""
    client = Groq(api_key=GROQ_API_KEY)
    
    # Back-translation
    back_translated = get_translation(english_translation, "to_arabic", temperature=0)
    
    # Semantic evaluation
    semantic_eval = client.chat.completions.create(
        model="meta-llama/llama-4-scout-17b-16e-instruct",
        messages=[{
            "role": "user",
            "content": f"""
            Evaluate how well this back-translation matches the original:
            
            Original Arabic: {original_arabic}
            Back-Translated Arabic: {back_translated}
            
            Consider:
            1. Meaning preservation (50%)
            2. Term accuracy (30%)
            3. Flow/naturalness (20%)
            
            Return a JSON object with:
            - "score" (0-100)
            - "analysis" (brief explanation)
            - "critical_errors" (list of major discrepancies)
            """
        }],
        response_format={"type": "json_object"},
        temperature=0
    )
    semantic_result = json.loads(semantic_eval.choices[0].message.content)
    
    # Key term verification
    term_check = client.chat.completions.create(
        model="meta-llama/llama-4-scout-17b-16e-instruct",
        messages=[{
            "role": "user",
            "content": f"""
            Verify these key terms were translated correctly:
            
            Arabic: {original_arabic}
            English: {english_translation}
            
            Return JSON with:
            - "verified_terms" (list of objects with "arabic", "english", "status")
            - "term_accuracy_score" (0-100)
            """
        }],
        response_format={"type": "json_object"},
        temperature=0
    )
    term_result = json.loads(term_check.choices[0].message.content)
    
    return {
        "back_translation": back_translated,
        "semantic_evaluation": semantic_result,
        "term_verification": term_result,
        "composite_score": (semantic_result["score"] * 0.6 + term_result["term_accuracy_score"] * 0.4)
    }

def get_quality_translation(original_arabic, max_retries=2):
    """Get translation with automatic quality verification"""
    best_result = None
    
    for attempt in range(max_retries):
        # First attempt with creative temperature
        english_translation = get_translation(original_arabic, "to_english", temperature=0.7)
        
        # Second attempt with conservative temperature if needed
        if attempt == 1:
            english_translation = get_translation(original_arabic, "to_english", temperature=0.3)
        
        verification = verify_translation(original_arabic, english_translation)
        
        if not best_result or verification["composite_score"] > best_result["composite_score"]:
            best_result = {
                "translation": english_translation,
                "verification": verification,
                "attempt": attempt + 1
            }
            
        if verification["composite_score"] >= 85:
            break
    
    return best_result

def main():
    # Path to your image
    image_path = "data/pic_8.jpeg"
    
    # Extract text
    original_arabic = extract_text_from_image(image_path)
    print("Original Arabic Text:\n", original_arabic)
    
    # Get quality translation
    result = get_quality_translation(original_arabic)
    
    # Display results
    print("\nFinal English Translation:")
    print(result["translation"])
    
    print(f"\nTranslation Quality Score: {result['verification']['composite_score']:.1f}/100")
    print(f"Attempts: {result['attempt']}")
    
    print("\nSemantic Evaluation:")
    print(f"Score: {result['verification']['semantic_evaluation']['score']}")
    print("Analysis:", result["verification"]["semantic_evaluation"]["analysis"])
    
    print("\nTerm Verification:")
    for term in result["verification"]["term_verification"]["verified_terms"]:
        print(f"{term['arabic']} → {term['english']} ({term['status']})")

if __name__ == "__main__":
    main()

Original Arabic Text:
 بحمد اللا وتوفيقه انطلقت حملة فريق سمدالشأن لخبري ولجنة الزكاة بسمد الشأن يوم الجمعه غرة ربيع الأول ٤٤٢ ه ^٨١٠7 ١< <م لمساعدة [هالينا المنضررين من إعصارشا هبن ، فيالباطنة ، وقداشترك في الحملة )٢٥٠( فردآ تقريبآ مصحوبه معها وقبلها ) يوي الثلاخاء والخميس ( با ا( شاحنات منالمساعدات المننوعت كا لماء والغذاء والاثاتء وذلك معدات الننظيف ا لمثنوعة خاصه خاتلات ومزيلات الأتربة والأوساخ ) اشبول حماتميزت به لحملآ الصغبر ( وعلاها)0( مع صهريج للماء ، اضافت إلى وجود لجلة نسائيه توزع | لأعراض |لخاصه باللساء طفال ب فلله الحمد والمنة علىتوفيفه لنجاح الحمله في تء وتموى بالأثاث وامواد تحقيق أهدا فهامن تنظيف المخنلفة < ومساعرة ثي نقلالسيارات العالفة بعر توفيق الله _ لولا ذلكم النجاح للحملة أذ ومن من أهالي سمد السان وقراها ب بل الدعم المجممى وأخص با لذكر ، جزيل الشكر والنقدير حا رجها أيضا   فلهم والشكر المنبرعين بأموالهم ومعداتهم _سمد  ولذلك نبج | خبر بعض |اطوسسات وفي محدمتها , ٢ وهزا والاء للبيو وماكان تحتقق الكبير جمعً صفور

Final English Translation:
By the praise and facilitation 