In [None]:
import pytesseract
from PIL import Image
import re
from pathlib import Path
import cv2
import pandas as pd
import google.generativeai as genai
import json

In [4]:
# Ganti path di bawah sesuai lokasi tesseract.exe di komputer Anda
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'

# Prepare LLM

In [14]:
GOOGLE_API_KEY = "AIzaSyAI2xJCQy4jWH_rBhFLSgfW-oqUsTuJnnk"
genai.configure(api_key=GOOGLE_API_KEY)

In [20]:
model = genai.GenerativeModel('gemini-1.5-flash-002')

# Komposisi

In [5]:
KAMUS_BAHAN_MERAH_ID = {
    'GULA_DAN_PEMANIS': ['gula', 'sirup fruktosa', 'sirup jagung', 'dekstrosa', 'maltodekstrin', 'pemanis buatan', 'aspartam', 'sakarin', 'sukralosa', 'asesulfam-k'],
    'LEMAK_JAHAT': ['lemak trans', 'minyak terhidrogenasi', 'lemak terhidrogenasi', 'shortening', 'minyak nabati terhidrogenasi'],
    'GARAM_TINGGI': ['garam', 'natrium', 'sodium'],
    'ADITIF_KONTROVERSIAL': ['mononatrium glutamat', 'msg', 'penguat rasa', 'perisa sintetik', 'pewarna buatan', 'tartrazin', 'kuning fcf', 'ponceau', 'karmoisin', 'pengawet', 'natrium benzoat', 'kalium sorbat', 'bht', 'bha']
}
KAMUS_BAHAN_HIJAU_ID = {
    'SERAT_DAN_GANDUM_UTUH': ['gandum utuh', 'whole wheat', 'serat pangan', 'oat', 'bekatul', 'serat larut'],
    'SUMBER_BAIK': ['protein', 'kalsium', 'vitamin', 'mineral', 'ekstrak buah', 'sayuran kering'],
    'KLAIM_POSITIF': ['tanpa tambahan gula', 'tanpa pengawet', 'tanpa pewarna', 'sumber serat']
}

In [6]:
KAMUS_BAHAN_MERAH_EN = {
    'SUGAR_AND_SWEETENERS': ['sugar', 'fructose syrup', 'corn syrup', 'dextrose', 'maltodextrin', 'artificial sweetener', 'aspartame', 'saccharin', 'sucralose', 'acesulfame-k'],
    'BAD_FATS': ['trans fat', 'hydrogenated oil', 'partially hydrogenated oil', 'shortening'],
    'HIGH_SALT': ['salt', 'sodium'],
    'CONTROVERSIAL_ADDITIVES': ['monosodium glutamate', 'msg', 'flavor enhancer', 'artificial flavor', 'artificial color', 'tartrazine', 'sunset yellow', 'carmine', 'preservative', 'sodium benzoate', 'potassium sorbate', 'bht', 'bha']
}
KAMUS_BAHAN_HIJAU_EN = {
    'FIBER_AND_WHOLE_GRAINS': ['whole wheat', 'whole grain', 'dietary fiber', 'oat', 'bran', 'soluble fiber'],
    'GOOD_SOURCES': ['protein', 'calcium', 'vitamin', 'mineral', 'fruit extract', 'dried vegetables'],
    'POSITIVE_CLAIMS': ['no added sugar', 'no preservatives', 'no artificial colors', 'source of fiber']
}

In [7]:
def ekstrak_teks_dari_gambar(path_gambar):
    """
    Fungsi 'Mata AI' versi UPGRADE:
    Melakukan pre-processing gambar untuk meningkatkan akurasi OCR.
    """
    try:
        # 1. Baca gambar menggunakan OpenCV
        gambar = cv2.imread(path_gambar)
        
        # 2. Ubah ke Grayscale (skala abu-abu)
        gray = cv2.cvtColor(gambar, cv2.COLOR_BGR2GRAY)
        
        # 3. Terapkan Thresholding untuk membuat gambar menjadi hitam-putih
        # Ini membantu mempertajam teks dan menghilangkan noise latar belakang.
        _, processed_img = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY | cv2.THRESH_OTSU)
        
        # 4. Kirim gambar yang sudah diproses ke Tesseract
        teks = pytesseract.image_to_string(processed_img, lang='ind')
        return teks
        
    except FileNotFoundError:
        return "ERROR: File gambar tidak ditemukan."
    except Exception as e:
        return f"ERROR: Terjadi kesalahan saat memproses gambar: {e}"

In [8]:
def analisis_komposisi(teks_komposisi, bahasa='ID'):
    """
    Fungsi 'Otak AI': Menganalisis teks komposisi dan memberikan skor serta alasan.
    """
    # Pilih kamus berdasarkan bahasa yang terdeteksi
    if bahasa == 'EN':
        kamus_merah_aktif = KAMUS_BAHAN_MERAH_EN
        kamus_hijau_aktif = KAMUS_BAHAN_HIJAU_EN
        kata_kunci_penalti = ['sugar', 'salt', 'sodium']
    else: # Default ke ID
        kamus_merah_aktif = KAMUS_BAHAN_MERAH_ID
        kamus_hijau_aktif = KAMUS_BAHAN_HIJAU_ID
        kata_kunci_penalti = ['gula', 'garam', 'natrium']

    skor_kesehatan, alasan = (0, [])
    teks_bersih = teks_komposisi.lower()
    daftar_bahan = [bahan.strip() for bahan in re.split(r'[,\.]', teks_bersih) if bahan.strip()]

    if not daftar_bahan: return 0, ["Tidak dapat mendeteksi daftar bahan."]

    # Aturan Penalti berdasarkan bahasa
    for bahan in daftar_bahan[:3]:
        for kata_kunci in kata_kunci_penalti:
            if kata_kunci in bahan:
                skor_kesehatan -= 5
                alasan.append(f"PENALTI: '{bahan.capitalize()}' ada di 3 bahan teratas.")
                break
        else: continue
        break

    # Looping kamus aktif (merah dan hijau)
    for kategori, daftar_merah in kamus_merah_aktif.items():
        for bahan_merah in daftar_merah:
            if bahan_merah in teks_bersih:
                skor_kesehatan -= 1
                alasan.append(f"TERDETEKSI BAHAN 'MERAH': {bahan_merah.capitalize()}.")
    for kategori, daftar_hijau in kamus_hijau_aktif.items():
        for bahan_hijau in daftar_hijau:
            if bahan_hijau in teks_bersih:
                skor_kesehatan += 1
                alasan.append(f"TERDETEKSI BAHAN 'HIJAU': {bahan_hijau.capitalize()}.")
    return skor_kesehatan, alasan

In [9]:
def berikan_kesimpulan(skor):
    """Memberikan vonis akhir berdasarkan skor kesehatan."""
    if skor >= 2:
        return "SEHAT 👍", "Pilihan yang baik. Mengandung lebih banyak bahan positif."
    elif skor > -3 and skor < 2:
        return "CUKUP SEHAT 🤔", "Tidak buruk, tapi perhatikan konsumsinya. Cek komposisi lebih detail."
    else:
        return "TIDAK SEHAT 👎", "Sebaiknya dihindari. Terdeteksi banyak bahan 'merah' atau tinggi gula/garam."


In [10]:
def temukan_dan_pangkas_komposisi(path_gambar):
    """
    Mencari kata 'komposisi' (ID) atau 'ingredients' (EN) di gambar, 
    lalu memangkas gambar secara otomatis untuk hanya menyisakan area di bawah kata tersebut.
    Prioritas pada Bahasa Indonesia.
    """
    try:
        gambar = cv2.imread(path_gambar)
        # Gunakan image_to_data untuk mendapatkan lokasi dan confidence score setiap kata
        data = pytesseract.image_to_data(gambar, lang='ind+eng', output_type=pytesseract.Output.DATAFRAME)
        
        # Hapus data yang tidak terdeteksi dengan baik (confidence score rendah)
        data = data[data.conf > 0]
        data['text'] = data['text'].str.lower()

        baris_komposisi = data[data['text'].str.contains('komposisi')]
        baris_ingredients = data[data['text'].str.contains('ingredients')]
        baris_terpilih, kata_ditemukan, bahasa = (None, "", 'ID') # Default bahasa ke ID

        # baris_terpilih = None
        # kata_ditemukan = ""

        # Aturan Prioritas dan Fallback
        if not baris_komposisi.empty and not baris_ingredients.empty:
            conf_id, conf_en = baris_komposisi.iloc[0]['conf'], baris_ingredients.iloc[0]['conf']
            if conf_id > 70 or conf_id >= conf_en:
                baris_terpilih, kata_ditemukan, bahasa = (baris_komposisi, "Komposisi", 'ID')
            else:
                baris_terpilih, kata_ditemukan, bahasa = (baris_ingredients, "Ingredients", 'EN')
        elif not baris_komposisi.empty:
            baris_terpilih, kata_ditemukan, bahasa = (baris_komposisi, "Komposisi", 'ID')
        elif not baris_ingredients.empty:
            baris_terpilih, kata_ditemukan, bahasa = (baris_ingredients, "Ingredients", 'EN')

        if baris_terpilih is not None:
            print(f"INFO: Kata '{kata_ditemukan}' ditemukan! Melakukan pangkas otomatis...")
            y_pos = baris_terpilih.iloc[0]['top']
            x_pos = baris_terpilih.iloc[0]['left']
            height =  baris_terpilih.iloc[0]['height']
            posisi_awal_crop = y_pos  # Tambahkan sedikit margin di atas
            # posisi_awal_crop = y_pos
            gambar_terpangkas = gambar[posisi_awal_crop : gambar.shape[0], 0 : gambar.shape[1]]
            return gambar_terpangkas, bahasa
        else:
            print("INFO: Kata kunci tidak ditemukan. Menganalisis seluruh gambar dalam Bahasa Indonesia.")
            return gambar, 'ID'
    except Exception as e:
        print(f"ERROR saat auto-crop: {e}")
        return cv2.imread(path_gambar), 'ID'
        # ---------------------------

        # if baris_terpilih is not None:
        #     print(f"INFO: Kata '{kata_ditemukan}' ditemukan! Melakukan pangkas otomatis...")
        #     # Ambil koordinat y dari kata yang terpilih
        #     y_pos = baris_terpilih.iloc[0]['top']
        #     height = baris_terpilih.iloc[0]['height']
            
        #     # Ambil koordinat x dari kata yang terpilih
        #     x_pos = baris_terpilih.iloc[0]['left']
            
        #     # Tentukan area pangkas (beri sedikit margin di atas)
        #     margin_atas = 5
        #     posisi_awal_crop = y_pos + height + margin_atas
        #     # posisi_samping_crop = x_pos - 3
            
        #     tinggi_gambar = gambar.shape[0]
        #     lebar_gambar = gambar.shape[1]
            
        #     # Crop gambar menggunakan OpenCV
        #     gambar_terpangkas = gambar[posisi_awal_crop : tinggi_gambar, 0 : lebar_gambar]
            
        #     return gambar_terpangkas
        # else:
        #     print("INFO: Kata 'Komposisi' atau 'Ingredients' tidak ditemukan. Menganalisis seluruh gambar.")
        #     return gambar # Kembalikan gambar asli jika tidak ketemu

# Gizi

In [11]:
TARGET_NUTRIENTS = {
    'ID': ['gula', 'natrium', 'lemak total', 'serat pangan', 'protein'],
    'EN': ['sugar', 'sodium', 'total fat', 'dietary fiber', 'protein']
}

In [12]:
def pangkas_tabel_gizi_otomatis(path_gambar):
    """
    Mendeteksi bingkai kotak pada gambar dan memangkas area di dalamnya.
    """
    try:
        gambar_asli = cv2.imread(path_gambar)
        # 1. Ubah ke grayscale dan berikan sedikit blur untuk mengurangi noise
        gray = cv2.cvtColor(gambar_asli, cv2.COLOR_BGR2GRAY)
        blur = cv2.GaussianBlur(gray, (5, 5), 0)

        # 2. Deteksi garis tepi menggunakan Canny
        edges = cv2.Canny(blur, 50, 150)

        # 3. Temukan semua kontur (outline bentuk)
        contours, _ = cv2.findContours(edges, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

        # Simpan semua kandidat kotak yang kita temukan
        kandidat_kotak = []

        for c in contours:
            # 4. Aproksimasi kontur menjadi bentuk yang lebih sederhana
            perimeter = cv2.arcLength(c, True)
            approx = cv2.approxPolyDP(c, 0.02 * perimeter, True)

            # 5. Jika bentuknya punya 4 sudut, kita anggap itu kandidat
            if len(approx) == 4:
                kandidat_kotak.append(c)

        if kandidat_kotak:
            # 6. Jika ada kandidat, urutkan berdasarkan area dari terbesar ke terkecil
            # dan ambil yang paling besar
            kotak_terbesar = max(kandidat_kotak, key=cv2.contourArea)
            
            # Ambil koordinat bounding box dari kotak terbesar itu
            x, y, w, h = cv2.boundingRect(kotak_terbesar)
            
            # 7. Pangkas gambar asli menggunakan koordinat tersebut
            # Beri sedikit margin agar tidak terlalu mepet
            margin = 5
            gambar_terpangkas = gambar_asli[y-margin:y+h+margin, x-margin:x+w+margin]
            
            print("INFO: Bingkai tabel gizi terdeteksi! Memangkas otomatis...")
            cv2.imwrite("hasil_terpangkas.jpg", gambar_terpangkas)
            return gambar_terpangkas
        else:
            print("INFO: Tidak ada bingkai kotak yang terdeteksi, menggunakan gambar penuh.")
            return gambar_asli

    except Exception as e:
        print(f"ERROR saat pangkas tabel gizi: {e}")
        return cv2.imread(path_gambar)

In [13]:
def bersihkan_nilai(teks_nilai):
    """Fungsi kecil untuk membersihkan teks nilai (misal: '13g' -> 13.0)"""
    if not isinstance(teks_nilai, str):
        return 0.0
    # Hanya ambil angka dan titik desimal
    angka_saja = re.sub(r'[^0-9.]', '', teks_nilai)
    try:
        return float(angka_saja)
    except (ValueError, TypeError):
        return 0.0

def analisis_kuantitatif_lengkap(path_gambar):
    """
    Fungsi all-in-one: Mendeteksi bahasa tabel gizi, memangkasnya, 
    lalu menganalisis isinya secara kuantitatif.
    """
    hasil_nutrisi = {}
    gambar_asli = cv2.imread(path_gambar)
    if gambar_asli is None: return {}, "Gambar tidak ditemukan."

    # --- Tahap 1: Deteksi Bahasa ---
    bahasa = 'ID' # Default
    data_awal = pytesseract.image_to_data(gambar_asli, lang='ind+eng', output_type=pytesseract.Output.DATAFRAME)
    teks_awal = " ".join(data_awal['text'].dropna().str.lower())
    if 'nutrition facts' in teks_awal:
        bahasa = 'EN'
    print(f"INFO: Tabel gizi terdeteksi dalam bahasa: {bahasa}")
    
    # --- Tahap 2: Pangkas Otomatis Berdasarkan Border ---
    gray = cv2.cvtColor(gambar_asli, cv2.COLOR_BGR2GRAY)
    blur = cv2.GaussianBlur(gray, (5, 5), 0)
    edges = cv2.Canny(blur, 50, 150)
    contours, _ = cv2.findContours(edges, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    
    kandidat_kotak = [c for c in contours if len(cv2.approxPolyDP(c, 0.02 * cv2.arcLength(c, True), True)) == 4]
    
    gambar_untuk_dianalisis = gambar_asli
    if kandidat_kotak:
        kotak_terbesar = max(kandidat_kotak, key=cv2.contourArea)
        x, y, w, h = cv2.boundingRect(kotak_terbesar)
        margin = 3
        gambar_untuk_dianalisis = gambar_asli[y-margin:y+h+margin, x-margin:x+w+margin]
        print("INFO: Bingkai tabel gizi terdeteksi! Memangkas otomatis...")

    # --- Tahap 3: Analisis Teks pada Gambar (yang mungkin sudah dipangkas) ---
    data_tabel = pytesseract.image_to_data(gambar_untuk_dianalisis, lang='ind+eng', output_type=pytesseract.Output.DATAFRAME)
    data_tabel = data_tabel[data_tabel.conf > 40]
    data_tabel['text'] = data_tabel['text'].str.lower()
    
    # Pilih kamus yang sesuai
    nutrisi_aktif = TARGET_NUTRIENTS[bahasa]

    for i, row in data_tabel.iterrows():
        # Gabungkan kata yang mungkin terpisah (misal: "lemak", "total")
        kata_sekarang = row['text']
        print(kata_sekarang)
        if kata_sekarang in ['lemak', 'total', 'dietary']:
            try:
                kata_sekarang = kata_sekarang + " " + data_tabel.iloc[i+1]['text']
            except IndexError:
                pass

        if kata_sekarang in nutrisi_aktif:
            posisi_baris_keyword = row['top']
            for j, kandidat in data_tabel.iloc[i+1:].iterrows():
                if abs(kandidat['top'] - posisi_baris_keyword) < 10:
                    if any(char.isdigit() for char in kandidat['text']):
                        nilai_nutrisi = bersihkan_nilai(kandidat['text'])
                        
                        # Standarisasi nama nutrisi
                        nama_nutrisi_final = kata_sekarang
                        if kata_sekarang in ['gula', 'sugar']: nama_nutrisi_final = 'Gula (Sugar)'
                        if kata_sekarang in ['natrium', 'sodium']: nama_nutrisi_final = 'Natrium (Sodium)'
                        if kata_sekarang in ['lemak total', 'total fat']: nama_nutrisi_final = 'Lemak Total (Total Fat)'
                        if kata_sekarang in ['serat pangan', 'dietary fiber']: nama_nutrisi_final = 'Serat (Fiber)'
                        
                        hasil_nutrisi[nama_nutrisi_final] = nilai_nutrisi
                        print(f"INFO: Ditemukan -> {nama_nutrisi_final}: {nilai_nutrisi}")
                        break
    return hasil_nutrisi


# def analisis_tabel_gizi_dari_gambar(gambar_cv2):
#     """
#     Mengekstrak nilai kuantitatif dari tabel Informasi Nilai Gizi.
#     Mengembalikan sebuah dictionary berisi nutrisi dan nilainya.
#     """
#     hasil_nutrisi = {}
#     # Definisikan nutrisi apa saja yang ingin kita cari
#     TARGET_NUTRIENTS = ['gula', 'natrium', 'sodium', 'lemak total', 'serat pangan', 'protein']

#     try:
#         # Gunakan image_to_data untuk mendapatkan data lengkap termasuk koordinat
#         data = pytesseract.image_to_data(gambar_cv2, lang='ind+eng', output_type=pytesseract.Output.DATAFRAME)
        
#         print(data)

#         data = data[data.conf > 40] # Ambil kata yang cukup jelas saja
#         data['text'] = data['text'].str.lower()

#         for i, row in data.iterrows():
#             kata_sekarang = row['text']
            
#             # Cek apakah kata saat ini ada di dalam target kita
#             if kata_sekarang in TARGET_NUTRIENTS:
#                 # Simpan posisi baris dari kata kunci (koordinat 'top')
#                 posisi_baris_keyword = row['top']
                
#                 # Cari kata di sebelah kanannya yang berada di baris yang sama
#                 for j, kandidat in data.iloc[i+1:].iterrows():
#                     # Cek apakah kandidat ada di baris yang sama (toleransi 10 piksel)
#                     if abs(kandidat['top'] - posisi_baris_keyword) < 10:
#                         # Cek apakah teks kandidat mengandung angka
#                         if any(char.isdigit() for char in kandidat['text']):
#                             nilai_nutrisi = bersihkan_nilai(kandidat['text'])
                            
#                             # Normalisasi nama nutrisi (misal: 'sodium' jadi 'natrium')
#                             nama_nutrisi_final = kata_sekarang
#                             if kata_sekarang == 'sodium':
#                                 nama_nutrisi_final = 'natrium'
                            
#                             hasil_nutrisi[nama_nutrisi_final] = nilai_nutrisi
#                             print(f"INFO: Ditemukan -> {nama_nutrisi_final.capitalize()}: {nilai_nutrisi}")
#                             break # Lanjut ke kata kunci berikutnya
        
#         return hasil_nutrisi

#     except Exception as e:
#         print(f"ERROR saat analisis tabel gizi: {e}")
#         return hasil_nutrisi

In [22]:
teks_berantakan_dari_ocr = """
Nutrition Facts Serving Size 22 pieces (30g) Total Fat 6g Saturated Fat 3.5g Trans Fat Og Cholesterol Omg Sodium 210mg Total Carbohydrate 20g Dietary Fiber 2g Sugars 6g Protein 1g INGREDIENTS:Mary's organic Graham gluten free blend (brown rice flour*, whole grain quinoa flakes*, tapioca starch*), coconut palm sugar*, tapioca syrup*, sea salt, and xanthan gum.
"""

In [23]:
prompt_template = """
Anda adalah asisten ahli gizi yang sangat teliti. Tugas Anda adalah mengekstrak informasi nutrisi dari teks hasil OCR yang berantakan dan mengubahnya menjadi format JSON yang bersih.

Perhatikan aturan berikut:
1. Ekstrak semua bahan dari bagian "komposisi" atau "ingredients" ke dalam sebuah daftar (list).
2. Ekstrak nilai kuantitatif untuk Gula (Sugar/Sugars), Natrium (Sodium), dan Lemak Total (Total Fat) dari tabel nutrisi.
3. Standarisasi semua unit ke dalam angka (integer atau float), buang satuan seperti "g" atau "mg".
4. Jika ada informasi yang tidak ditemukan, gunakan nilai `null`.
5. JAWAB HANYA DENGAN FORMAT JSON, tanpa penjelasan atau kata pembuka apa pun.

Berikut adalah teks hasil OCR yang harus dianalisis:
---
{ocr_text}
---
"""

In [24]:
prompt_final = prompt_template.format(ocr_text=teks_berantakan_dari_ocr)

In [21]:
# --- Memanggil API LLM (disimulasikan karena kita tidak menjalankan API di sini) ---
response = model.generate_content(prompt_final)
hasil_llm_json = response.text

ResourceExhausted: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
}
, links {
  description: "Learn more about Gemini API quotas"
  url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
  seconds: 47
}
]

In [None]:
try:
    data_bersih = json.loads(hasil_llm_json)
    print("✨ Data berhasil dibersihkan oleh LLM!")
    print(data_bersih)
    
    gula = data_bersih.get("fakta_gizi", {}).get("gula_g")
    if gula is not None and gula > 15:
        print("\n⚠️ PERINGATAN: Kandungan gula tinggi!")

except json.JSONDecodeError:
    print("❌ Gagal mem-parsing JSON dari hasil LLM.")


# Main

In [143]:
if __name__ == "__main__":
    print("=====================================================")
    print("  SELAMAT DATANG DI PROTOTIPE NUTRISNAP (vFINAL)")
    print("=====================================================")
    
    path_gambar = input("Masukkan path lengkap ke file gambar kemasan: ")
    
    # --- Analisis 1: Komposisi Bahan (Kualitatif) ---
    print("\n[ANALISIS 1: Komposisi Bahan (Kualitatif)]")
    gambar_komposisi, bahasa_komposisi = temukan_dan_pangkas_komposisi(path_gambar)
    teks_komposisi = pytesseract.image_to_string(gambar_komposisi, lang='ind+eng')
    skor, alasan = analisis_komposisi(teks_komposisi, bahasa_komposisi)
    kesimpulan, deskripsi = berikan_kesimpulan(skor)
    
    # --- Analisis 2: Tabel Nilai Gizi (Kuantitatif) ---
    print("\n[ANALISIS 2: Tabel Nilai Gizi (Kuantitatif)]")
    data_gizi = analisis_kuantitatif_lengkap(path_gambar)
    print(data_gizi)
    
    # --- Tampilkan Laporan Gabungan ---
    print("\n========================================")
    print("       LAPORAN GABUNGAN NUTRISNAP       ")
    print("========================================")
    print(f"KESIMPULAN UMUM: {kesimpulan} ({deskripsi})")
    print(f"SKOR KUALITATIF: {skor}")
    
    print("\n--- Rincian Kualitatif (dari Komposisi) ---")
    if alasan:
        for detail in alasan: print(f"- {detail}")
    else: print("Tidak ada detail spesifik yang ditemukan.")
        
    print("\n--- Rincian Kuantitatif (dari Tabel Gizi) ---")
    if data_gizi:
        for nutrisi, nilai in data_gizi.items():
            catatan_gizi = ""
            if ('Gula' in nutrisi and nilai > 15) or ('Natrium' in nutrisi and nilai > 200):
                catatan_gizi = "⚠️ TINGGI"
            print(f"- {nutrisi}: {nilai}g/mg per saji {catatan_gizi}")
    else:
        print("Tidak ada data kuantitatif yang berhasil diekstrak.")
    print("========================================")

  SELAMAT DATANG DI PROTOTIPE NUTRISNAP (vFINAL)

[ANALISIS 1: Komposisi Bahan (Kualitatif)]
INFO: Kata 'Ingredients' ditemukan! Melakukan pangkas otomatis...

[ANALISIS 2: Tabel Nilai Gizi (Kuantitatif)]
INFO: Tabel gizi terdeteksi dalam bahasa: EN
INFO: Bingkai tabel gizi terdeteksi! Memangkas otomatis...
nutrition
facts
serving
size
22
pieces
(30g)
servings
per
container
about
4.5
amount
per
sorving
calories
130
calories
from
fat
60
dally
valuo*
total
fat
69
9%
saturated
fat
3.59
18%
polyunsaturated
fat
19
monounsaturated
fat
1.59
trans
fat
0g
 
 
 
 
 
cholesterol
omg
0%
sodium
210mg
9%
potassium
90mg
3%
total
carbohydrate
20g
to
dietary
fiber
2g
8%
sugars
69
protein
1g
vitamina0%
vitamin
c
0%
calcium
2%
tron
4%
*percart
daily
values
are
based
on
a
2,000
calorie
det.
 
 
 
 
{}

       LAPORAN GABUNGAN NUTRISNAP       
KESIMPULAN UMUM: CUKUP SEHAT 🤔 (Tidak buruk, tapi perhatikan konsumsinya. Cek komposisi lebih detail.)
SKOR KUALITATIF: -1

--- Rincian Kualitatif (dari Komposisi) -

In [128]:
# ==============================================================================
# PROGRAM UTAMA (UPGRADE FINAL v5.0 - Auto-Crop Ganda)
# ==============================================================================
if __name__ == "__main__":
    print("=====================================================")
    print("  SELAMAT DATANG DI PROTOTIPE NUTRISNAP (v5.0 Auto-Crop Ganda)")
    print("=====================================================")
    
    path_gambar = input("Masukkan path lengkap ke file gambar kemasan: ")
    
    # --- Analisis 1: Komposisi Bahan (Kualitatif) ---
    print("\n[ANALISIS 1: Komposisi Bahan (Kualitatif)]")
    gambar_komposisi, bahasa_terdeteksi = temukan_dan_pangkas_komposisi(path_gambar)
    teks_komposisi = pytesseract.image_to_string(gambar_komposisi, lang='ind+eng')
    skor, alasan = analisis_komposisi(teks_komposisi, bahasa_terdeteksi)
    kesimpulan, deskripsi = berikan_kesimpulan(skor)
    
    # --- Analisis 2: Tabel Nilai Gizi (Kuantitatif) ---
    print("\n[ANALISIS 2: Tabel Nilai Gizi (Kuantitatif)]")
    # PANGKAS DULU GAMBAR TABEL GIZINYA SECARA OTOMATIS
    gambar_tabel_gizi = pangkas_tabel_gizi_otomatis(path_gambar)
    
    # ANALISIS TABEL GIZI MENGGUNAKAN GAMBAR YANG SUDAH DIPANGKAS
    data_gizi = analisis_tabel_gizi_dari_gambar(gambar_tabel_gizi) # Kita modif sedikit nama fungsinya
    print(data_gizi)
    
    # --- Tampilkan Laporan Gabungan ---
    print("\n========================================")
    print("       LAPORAN GABUNGAN NUTRISNAP       ")
    print(f"KESIMPULAN UMUM: {kesimpulan} ({deskripsi})")
    print(f"SKOR KUALITATIF: {skor}")
    
    print("\n--- Rincian Kualitatif (dari Komposisi) ---")
    if alasan:
        for i, detail in enumerate(alasan, 1):
            print(f"{i}. {detail}")
    else:
        print("Tidak ada detail spesifik yang ditemukan.")
        
    print("\n--- Rincian Kuantitatif (dari Tabel Gizi) ---")
    if data_gizi:
        for nutrisi, nilai in data_gizi.items():
            # Beri tanda pada nilai yang tinggi
            catatan_gizi = ""
            if (nutrisi == 'gula' and nilai > 15) or (nutrisi == 'natrium' and nilai > 200):
                catatan_gizi = "⚠️ TINGGI"
            print(f"- {nutrisi.capitalize()}: {nilai}g/mg per saji {catatan_gizi}")
    else:
        print("Tidak ada data kuantitatif yang berhasil diekstrak.")
    print("========================================")

  SELAMAT DATANG DI PROTOTIPE NUTRISNAP (v5.0 Auto-Crop Ganda)

[ANALISIS 1: Komposisi Bahan (Kualitatif)]
INFO: Kata 'Ingredients' ditemukan! Melakukan pangkas otomatis...

[ANALISIS 2: Tabel Nilai Gizi (Kuantitatif)]
INFO: Bingkai tabel gizi terdeteksi! Memangkas otomatis...
     level  page_num  block_num  par_num  line_num  word_num  left  top  \
0        1         1          0        0         0         0     0    0   
1        2         1          1        0         0         0    14   13   
2        3         1          1        1         0         0    14   13   
3        4         1          1        1         1         0    14   13   
4        5         1          1        1         1         1    14   13   
..     ...       ...        ...      ...       ...       ...   ...  ...   
148      5         1         11        1         1         1     2    6   
149      2         1         12        0         0         0   318   10   
150      3         1         12        1       

In [None]:
if __name__ == "__main__":
    print("========================================")
    print("  SELAMAT DATANG DI PROTOTIPE NUTRISNAP ")
    print("========================================")
    
    # path_gambar = input("Masukkan path lengkap ke file gambar kemasan: ")

    # Contoh path absolut di Windows (gunakan dua backslash atau satu forward slash):
    path_gambar = 'D:\\. Coding Euy\\LombaOrPenelitian\\Datathon\\example.jpg'
    # path_gambar = Path(D:\\. Coding Euy\\LombaOrPenelitian\\Datathon).glob('*.jpg' or '*.png' or '*.jpeg')

    print("\n[1] Mencari bagian 'Komposisi' untuk di-pangkas...")
    gambar_untuk_dianalisis, bahasa_terdeteksi = temukan_dan_pangkas_komposisi(path_gambar)
    
    # Simpan gambar hasil pangkas untuk dicek (opsional)
    cv2.imwrite("hasil_pangkas.jpg", gambar_untuk_dianalisis)

    print("\n[2] Membaca teks dari gambar dengan 'Mata AI' (OCR) \n(Mode Bahasa: {bahasa_terdeteksi})...")
    teks_hasil_ocr = pytesseract.image_to_string(gambar_untuk_dianalisis, lang='ind+eng')
    
    if not teks_hasil_ocr.strip():
         print("ERROR: OCR tidak dapat mendeteksi teks pada gambar yang diberikan.")
    else:
        print("--- Teks yang Berhasil Diekstrak ---")
        print(teks_hasil_ocr)
        print("------------------------------------")
        
        print("\n[3] Menganalisis komposisi dengan 'Otak AI'...")
        skor, alasan = analisis_komposisi(teks_hasil_ocr, bahasa_terdeteksi)
        kesimpulan, deskripsi = berikan_kesimpulan(skor)
        
        print("\n========================================")
        print("          HASIL ANALISIS NUTRISNAP        ")
        print("========================================")
        print(f"KESIMPULAN: {kesimpulan}")
        print(f"DESKRIPSI : {deskripsi}")
        print(f"SKOR KESEHATAN: {skor}")
        print("\n--- Rincian Analisis ---")
        if alasan:
            for i, detail in enumerate(alasan, 1):
                print(f"{i}. {detail}")
        else:
            print("Tidak ada detail spesifik yang ditemukan.")
        print("========================================")

  SELAMAT DATANG DI PROTOTIPE NUTRISNAP 

[1] Mencari bagian 'Komposisi' untuk di-pangkas...
INFO: Kata 'Komposisi' ditemukan! Melakukan pangkas otomatis...

[2] Membaca teks dari gambar dengan 'Mata AI' (OCR) 
(Mode Bahasa: {bahasa_terdeteksi})...
--- Teks yang Berhasil Diekstrak ---
utiran (62,64), Minyak Nabati (Mengat
"han “anh Bumbu Rasa Sea Salt 7% (Menga
Penguat Rasa Mononatrium Glutamat, Dini
Inosinat dan Guanilat, Susu, Ke |, Sea Salt 1
Gula, Garam, Pengembang, Pengemulsi Nabati, M
Kelapa

Ingredients:
Corn Grain (62,6%), Vegetable Oil (Contains Ani
TBHQ), Sea Salt Flavoured Seasoning 7%
Flavour Enhancer Monosodium Glutamate, D
Inosinate and Guanylate, Milk, , Sea

sugar, Salt, Leavening Agent, 'egetable &
oconut Oil.

a
Mengandung Aler en, lihat bahan yang
tebal, 4 « a :


------------------------------------

[3] Menganalisis komposisi dengan 'Otak AI'...

          HASIL ANALISIS NUTRISNAP        
KESIMPULAN: TIDAK SEHAT 👎
DESKRIPSI : Sebaiknya dihindari. Terdeteksi banyak 