In [1]:
!pip install sentence-transformers chromadb langchain langchain-community pypdf transformers==4.45.2 huggingface-hub==0.33.4 accelerate --quiet

In [2]:
!pip install jupyterlab_widgets



In [3]:
import torch
from transformers import AutoProcessor, Qwen2VLForConditionalGeneration

model_name = "Qwen/Qwen2-VL-2B-Instruct"

print("Model indiriliyor...")

model = Qwen2VLForConditionalGeneration.from_pretrained(
    model_name,
    torch_dtype=torch.bfloat16,
    attn_implementation="sdpa"
).to("cuda")

processor = AutoProcessor.from_pretrained(model_name)
processor.tokenizer.pad_token = processor.tokenizer.eos_token

print("Model ve iÅŸlemci yÃ¼klendi!")


  from .autonotebook import tqdm as notebook_tqdm


Model indiriliyor...


`Qwen2VLRotaryEmbedding` can now be fully parameterized by passing the model config through the `config` argument. All other arguments will be removed in v4.46
Loading checkpoint shards: 100%|â–ˆâ–ˆ| 2/2 [00:01<00:00,  1.27it/s]


Model ve iÅŸlemci yÃ¼klendi!


In [4]:
from langchain_community.document_loaders import PyPDFLoader
from langchain_text_splitters import RecursiveCharacterTextSplitter

PDF_PATH = "kalori_cetveli_dataset.pdf"

loader = PyPDFLoader(PDF_PATH)
docs = loader.load()

print(f"PDF'ten yÃ¼klenen sayfa/dokÃ¼man: {len(docs)}")

splitter = RecursiveCharacterTextSplitter(chunk_size=400, chunk_overlap=80)
chunks = splitter.split_documents(docs)

print(f"OluÅŸturulan toplam chunk sayÄ±sÄ±: {len(chunks)}")

# Ã–rnek chunk
print("\nÄ°lk chunk Ã¶rneÄŸi:")
print(chunks[0].page_content[:300], "...")


ðŸ“„ PDF'ten yÃ¼klenen sayfa/dokÃ¼man: 13
ðŸ”ª OluÅŸturulan toplam chunk sayÄ±sÄ±: 44

Ä°lk chunk Ã¶rneÄŸi:
1) Yulaf Ezmesi 
Kalori: 389 kcal (100g) 
 Kategori: Karbonhidrat 
 AÃ§Ä±klama: Lif oranÄ± yÃ¼ksek, uzun sÃ¼re tokluk saÄŸlar. Kompleks karbonhidrat kaynaÄŸÄ±dÄ±r. 
2) Muz 
Kalori: 89 kcal (1 adet) 
 Kategori: Meyve 
 AÃ§Ä±klama: DoÄŸal enerji saÄŸlar, potasyum aÃ§Ä±sÄ±ndan zengindir. 
3) SÃ¼t (YaÄŸsÄ±z) 
Kalori: 42 k ...


In [5]:
!pip install langchain_huggingface langchain-community --quiet

In [6]:
!pip install chromadb --quiet

In [7]:
!pip install --upgrade langchain --quiet

In [8]:
from langchain_community.embeddings import HuggingFaceEmbeddings
from langchain_community.vectorstores import Chroma
import os

CHROMA_DIR = "./kalori_chroma"

embeddings = HuggingFaceEmbeddings(
    model_name="sentence-transformers/all-MiniLM-L6-v2"
)

if os.path.exists(CHROMA_DIR):
    print("Var olan ChromaDB yÃ¼kleniyor...")
    vectordb = Chroma(
        persist_directory=CHROMA_DIR,
        embedding_function=embeddings
    )
else:
    print("Yeni ChromaDB oluÅŸturuluyor...")
    vectordb = Chroma(
    persist_directory=CHROMA_DIR,
    embedding_function=embeddings,
    collection_metadata={"hnsw:space": "cosine"},  
    )
    vectordb.persist()

print("ChromaDB hazÄ±r!")

  embeddings = HuggingFaceEmbeddings(


Var olan ChromaDB yÃ¼kleniyor...


  vectordb = Chroma(


ChromaDB hazÄ±r!


In [9]:
def fetch_context(query, k=7):
    docs = vectordb.similarity_search(query, k=k)
    return "\n".join(d.page_content for d in docs)

In [10]:
import time

# --- SYSTEM PROMPT'U GÃœÃ‡LENDÄ°RÄ°YORUZ ---
SYSTEM_PROMPT = """
Sen yardÄ±msever ve samimi bir diyetisyensin.
GÃ–REVÄ°N: KullanÄ±cÄ±nÄ±n sorusuna, veritabanÄ±ndan gelen yiyecekleri kullanarak TEK BÄ°R PARAGRAF halinde cevap vermek.

KESÄ°N KURALLAR:
1. FORMAT: Asla alt alta liste yapma, madde iÅŸareti koyma. Sanki karÅŸÄ±ndakiyle konuÅŸuyormuÅŸ gibi akÄ±cÄ± bir metin yaz.
2. Ä°Ã‡ERÄ°K: SeÃ§tiÄŸin yiyeceklerin kalorilerini mutlaka cÃ¼mle iÃ§inde belirt. Ã–rneÄŸin: "YanÄ±na 150 kalorilik midye dolma alabilirsin" gibi.
3. ALAKASIZ VERÄ°YÄ° ELE: Sadece soruyla uyumlu (Ã¶rneÄŸin hepsi bir Ã¶ÄŸle yemeÄŸi olabilecek) Ã¼rÃ¼nleri seÃ§. Hepsini saymak zorunda deÄŸilsin.
4. BAÄžLAM: Yiyecekleri birbirine baÄŸla. "Bunun yanÄ±na ÅŸu yakÄ±ÅŸÄ±r", "Ä°Ã§ecek olarak da ÅŸunu ekleyelim" gibi ifadeler kullan.

Ã–RNEK DOÄžRU CEVAP:
"Senin iÃ§in harika bir Ã¶ÄŸle menÃ¼sÃ¼ hazÄ±rladÄ±m; ana yemek olarak 150 kalori deÄŸerindeki midye dolmayÄ± tercih edebilirsin. Bunun yanÄ±na hafif olmasÄ± aÃ§Ä±sÄ±ndan 85 kalorilik lor peyniri ekleyerek protein dengesini saÄŸlayabilirsin. Ä°Ã§ecek olarak ise sadece 13 kalori olan ÅŸekersiz badem sÃ¼tÃ¼ tÃ¼ketirsen hem hafif hem de doyurucu bir Ã¶ÄŸÃ¼n yapmÄ±ÅŸ olursun."
"""

def rag_chat(question, k=5):
    # k=5 iyidir, Ã§ok veri gelirse modelin kafasÄ± karÄ±ÅŸÄ±p listeye dÃ¶ner.
    context = fetch_context(question, k=k)

    messages = [
        {"role": "system", "content": SYSTEM_PROMPT},
        {
            "role": "user",
            # Modele veriyi verirken de nasÄ±l kullanacaÄŸÄ±nÄ± hatÄ±rlatÄ±yoruz
            "content": f"Soru: {question}\n\nKullanabileceÄŸin Besinler (Bunlardan mantÄ±klÄ± bir menÃ¼ oluÅŸtur ve kalorilerini cÃ¼mle iÃ§inde geÃ§ir):\n{context}"
        }
    ]

    text = processor.apply_chat_template(
        messages,
        tokenize=False,
        add_generation_prompt=True
    )

    inputs = processor(
        text=[text],
        return_tensors="pt",
        padding=True
    ).to("cuda")

    outputs = model.generate(
        **inputs,
        do_sample=True,
        temperature=0.6, # 0.6 idealdÄ±r, cÃ¼mleleri baÄŸlamasÄ± iÃ§in esneklik saÄŸlar.
        top_p=0.9,
        max_new_tokens=250, 
        repetition_penalty=1.2 # TekrarÄ± Ã¶nler
    )

    outputs = [
        out_ids[len(inp_ids):]
        for inp_ids, out_ids in zip(inputs.input_ids, outputs)
    ]
    return processor.batch_decode(outputs, skip_special_tokens=True)[0]

In [11]:
print(rag_chat("500 kalorilik Ã¶ÄŸle menÃ¼sÃ¼ Ã¶ner."))

Bu gÃ¼n senin iÃ§in en iyi Ã¶ÄŸle menÃ¼sÃ¼nÃ¼ hazÄ±rlayÄ±p sizin iÃ§in 500 kalorik miktarda yer tutacaÄŸÄ±nÄ±z seÃ§eneklerden herhangi biri seÃ§erken, bu menÃ¼nÃ¼n kalorisi 500 kalsiyelere ulaÅŸacak ÅŸekilde tasarlanmÄ±ÅŸtÄ±r:

- Hindistan Cevizi YoÄŸurdu - 85 kalori (100 gram)
- Yulaf SÃ¼tÃ¼ - 60 kalori (100 ml)
- Badem SÃ¼tÃ¼ (Åžekersiz) - 13 kalori (100 ml)
- Lor Peyniri - 85 kalori (100 gr)
- Midye Dolma - 150 kalori (3 adet)

SonuÃ§ta toplam 500 kalori alÄ±nacaktÄ±r. Bu menÃ¼ler genellikle enerji kaynaklarÄ± arasÄ±nda yer alan besinler iÃ§erir ve aynÄ± zamanda Ã§eÅŸitli kalorijeli Ã¼rÃ¼nler ile temsil etmekte bulunurlar. Bu nedenle, bu menÃ¼lere baÄŸlÄ± olarak farklÄ± taraflardaki besinlerin kullanÄ±lmasÄ± gerekebilir.


In [15]:
print(rag_chat("300 kalorilik Ã¶ÄŸle menÃ¼sÃ¼ Ã¶ner. Ama saÄŸlÄ±klÄ± olsun Ã¶nerin nedir."))

Bu Ã¶neri genellikle 300 kalorlik bir Ã¶ÄŸle menÃ¼sÃ¼nÃ¼ oluÅŸturmaktadÄ±r:

Ana yemek: 150 kallarlÄ±k midye dolmasÄ±
KarÄ±ÅŸÄ±mkÃ¶pek: 85 kallarlÄ±k lork peyniri
DoÄŸal tatlandÄ±rÄ±cÄ±: 34 kallarlÄ±k yeÅŸil mercimek Ã§orbasÄ±
AtÄ±ÅŸtÄ±rmalÄ±k: 85 kallarlÄ±k hindistan cevizi yogurtu
Bitkisel sÃ¼t: 60 kallarlÄ±k fÄ±rÄ±nda brokolia
Sebze: 33 kallarlÄ±k bamya piÅŸmiÅŸ
HavuÃ§: 18 kallarlÄ±k kÃªrez (haÅŸlanmÄ±ÅŸ)
ZeytinyaÄŸÄ±: 119 kallarlÄ±k tahÄ±l
MantÄ±ksÃ¼z yaÄŸÄ±: 119 kallarlÄ±k tahÄ±l
TatlÃ½ biber turÅŸusu: 25 kallarlÄ±k tatlÃ½ biber turÅŸusu
Badem sÃ¼tÃ¼ (ÅŸekersiz): 13 kallarlÄ±k badem sÃ¼tÃ¼
YeÅŸil


In [16]:
print(rag_chat("Ben ÅŸiÅŸman mÄ±yÄ±m"))

Ben ÅŸiÅŸman deÄŸilim Ã§Ã¼nkÃ¼ bu bilgiyi Ã¶ÄŸrenmediniz. Ancak, genellikle ÅŸiÅŸmalarÄ±n kalorinin yÃ¼ksek olduÄŸu iÃ§in, her zaman saÄŸlÄ±klÄ± bir ÅŸekilde beslenmenizi Ã¶neririm. Bu nedenle, sizin iÃ§in en iyi seÃ§enekler arasÄ±nda yer alan limonlu yeÅŸil Ã§ayÄ± ve bal bulunmaktadÄ±r. Bu Ã¼rÃ¼nler, metabolizmayÄ± hÄ±zlandÄ±rdÄ±ÄŸÄ±nÄ± ve hafife enerjisi saÄŸladÄ±ÄŸÄ±nÄ± gÃ¶steriyor. AyrÄ±ca, zeytinyaÄŸÄ±, makarna, maden suyu ve midye dolmasÄ± gibi diÄŸer Ã¼rÃ¼nler de etkin bir ÅŸekilde enerjisini saÄŸlayacaklarÄ± iÃ§in Ã¶nemlidir. 

SonuÃ§ta, ben ÅžiÅŸmanÄ±n yoktuÄŸumuza inandÄ±rÄ±m ama, eÄŸer baÅŸka bir ÅŸey varsa, size yardÄ±mcÄ± olabilirim!


In [17]:
print(rag_chat("Midye DolmasÄ± sence nasÄ±l yemeli miyim"))

Midye DolmasÄ±, deniz Ã¼rÃ¼nÃ¼ ile pirinÃ§ karÄ±ÅŸÄ±mÄ±na dayanan bir yiyecekdir. Bu yiyecek, genellikle 150 kalsiyel kalori deÄŸerinden oluÅŸmaktadÄ±r. AyrÄ±ca, bu yiyecek, karÄ±ÅŸÄ±mlarÄ±n yanÄ± sÄ±ra dÃ¼ÅŸÃ¼k kalorilidir. 

Hardal, dÃ¼ÅŸÃ¼k kalorilidir ve sos tÃ¼rÃ¼dÃ¼r. Bu yÃ¼zden, her iki seÃ§enek arasÄ±nda en az 10 kalsiyel kalori deÄŸerinin yer aldÄ±ÄŸÄ± bir ayri yiyecek bulunmaz. Ancak, Hardal'Ä±n kalori deÄŸeri 10 kalsiyeldir. 

Light Mayonez, normal mayoneze gÃ¶re daha dÃ¼ÅŸÃ¼k kalorilidir. Bu nedenle, 40 kalsiyel kalori deÄŸerindeki bir ayri yiyecek olduÄŸu sÃ¶ylenebilir. 

YeÅŸil Mercimek Ã‡orbasÄ±, metabolizmayÄ± hÄ±zlandÄ±ran bir iÃ§ecek tÃ¼rÃ¼dÃ¼r. Bu yÃ¼zden, 108 kalsiyel kalori deÄŸerindeki bir ayri yiyecek olduÄŸunu dÃ¼ÅŸÃ¼nÃ¼lmesi gerekmektedir. 

Bal, hafif
