In [7]:
!pip install -q langchain langchain-community openai chromadb tiktoken

In [8]:
!pip show langchain

Name: langchain
Version: 0.3.7
Summary: Building applications with LLMs through composability
Home-page: https://github.com/langchain-ai/langchain
Author: 
Author-email: 
License: MIT
Location: /usr/local/lib/python3.10/dist-packages
Requires: aiohttp, async-timeout, langchain-core, langchain-text-splitters, langsmith, numpy, pydantic, PyYAML, requests, SQLAlchemy, tenacity
Required-by: langchain-community


In [9]:
link = "https://github.com/risya22008/side_quest/blob/main/new_articles.zip"

# note: this will break if a repo/organization or subfolder is named "blob" -- would be ideal to use a fancy regex
# to be more precise here
print(link.replace("github.com", "raw.githubusercontent.com").replace("/blob/", "/"))

https://raw.githubusercontent.com/risya22008/side_quest/main/new_articles.zip


In [10]:
!wget -q https://raw.githubusercontent.com/risya22008/side_quest/main/new_articles.zip
!unzip -q new_articles.zip -d new_articles

In [11]:
pip install -U langchain-chroma



In [12]:
!pip install -q langchain-google-genai google-generativeai

In [13]:
import os
import google.generativeai as genai

GOOGLE_API_KEY = "AIzaSyBO7ACt4Cg1s5_bIIo89v6QazbWOHrzeIM"
genai.configure(api_key=GOOGLE_API_KEY)

In [14]:
from langchain.vectorstores import Chroma
from langchain_google_genai import GoogleGenerativeAIEmbeddings
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains import RetrievalQA
from langchain.document_loaders import TextLoader, DirectoryLoader
from langchain_chroma import Chroma
import google.generativeai as genai
import os

In [15]:
loader = DirectoryLoader('./new_articles/', glob="./*.txt", loader_cls=TextLoader)

documents = loader.load()

In [16]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
texts = text_splitter.split_documents(documents)

In [17]:
len(texts)

173

In [18]:
texts

[Document(metadata={'source': 'new_articles/01.txt'}, page_content='### Apa itu Actinic Keratosis?  \nActinic keratosis (AK), juga dikenal sebagai solar keratosis, adalah kondisi kulit yang disebabkan oleh kerusakan akibat paparan sinar matahari jangka panjang. Ini ditandai dengan munculnya bercak kasar, bersisik, atau kasar pada area kulit yang sering terpapar sinar matahari, seperti wajah, tangan, lengan, dan leher.  \n\nBercak-bercak ini seringkali berwarna merah muda, merah, cokelat, atau kekuningan, dan ukurannya bisa bervariasi. Biasanya, AK berkembang secara perlahan dan lebih sering terjadi pada orang dengan:  \n- Kulit terang  \n- Riwayat paparan sinar matahari berlebihan  \n- Usia di atas 40 tahun'),
 Document(metadata={'source': 'new_articles/01.txt'}, page_content='### Gejala Utama Actinic Keratosis  \n1. Tekstur kulit: Area kasar atau bersisik yang terasa seperti amplas  \n2. Warna: Bercak dapat berwarna merah muda, merah, atau cokelat  \n3. Lokasi: Biasanya muncul di area

In [19]:
embedding = GoogleGenerativeAIEmbeddings(
    model="models/embedding-001",  # Google's embedding model
    google_api_key="AIzaSyBO7ACt4Cg1s5_bIIo89v6QazbWOHrzeIM",
)

persist_directory = 'db'
if not os.path.exists(persist_directory):
    os.makedirs(persist_directory)

vectordb = Chroma.from_documents(
    documents=texts,
    embedding=embedding,
    persist_directory=persist_directory
)

In [20]:
vectordb = None

In [21]:
vectordb = Chroma(persist_directory=persist_directory, embedding_function=embedding)

In [22]:
retriever = vectordb.as_retriever()

In [25]:
docs = retriever.get_relevant_documents("Apa penyebab utama penyakit acne dan bagaimana cara pencegahannya?")

In [26]:
len(docs)

4

In [27]:
retriever = vectordb.as_retriever(search_kwargs={"k": 2})

In [28]:
retriever.search_type

'similarity'

In [29]:
retriever.search_kwargs

{'k': 2}

In [40]:
from langchain_google_genai import ChatGoogleGenerativeAI

gemini = ChatGoogleGenerativeAI(
    model="models/gemini-1.5-flash",
    google_api_key="AIzaSyBO7ACt4Cg1s5_bIIo89v6QazbWOHrzeIM",
    temperature=0.7,
)

qa_chain = RetrievalQA.from_chain_type(
    llm=gemini,
    chain_type="stuff",
    retriever=retriever,
    return_source_documents=True
)


In [41]:
def process_llm_response(llm_response):
    print(llm_response['result'])
    print('\n\nSources:')
    for source in llm_response["source_documents"]:
        print(source.metadata['source'])

In [46]:
query = "Apa itu actinic keratosis dan bagaimana kaitannya dengan risiko kanker kulit?"
llm_response = qa_chain(query)
process_llm_response(llm_response)

Actinic keratosis (AK), juga dikenal sebagai solar keratosis, adalah kondisi kulit yang disebabkan oleh kerusakan akibat paparan sinar matahari jangka panjang.  Ditandai dengan bercak kasar, bersisik, atau merah pada area kulit yang sering terpapar sinar matahari.  Bercak ini bisa berwarna merah muda, merah, cokelat, atau kekuningan, dan ukurannya bervariasi.  AK sering dianggap sebagai "lesi pra-kanker" karena dapat berkembang menjadi kanker kulit jenis squamous cell carcinoma (SCC) jika tidak ditangani.  Meskipun sebagian besar AK tidak berkembang menjadi kanker,  potensi perkembangan menjadi SCC menjadikan AK sebagai indikator kerusakan kulit akibat sinar UV dan risiko lebih tinggi terkena kanker kulit.  AK lebih sering terjadi pada orang dengan kulit terang, riwayat paparan sinar matahari berlebihan, dan usia di atas 40 tahun.



Sources:
new_articles/20.txt
new_articles/02.txt


In [44]:
query = "Bagaimana cara membedakan rosacea dengan penyakit kulit lainnya?"
llm_response = qa_chain(query)
llm_response

{'query': 'Bagaimana cara membedakan rosacea dengan penyakit kulit lainnya?',
 'result': 'Berdasarkan teks yang diberikan, cara membedakan rosacea dari acne vulgaris adalah dengan memperhatikan lokasi lesi, jenis lesi, dan kehadiran komedo.  Rosacea ditandai dengan kemerahan dan pembuluh darah yang melebar, papul, dan pustul, tetapi *tanpa* komedo. Acne vulgaris, di sisi lain, *memiliki* komedo (whiteheads atau blackheads) selain papul dan pustul.  Rosacea juga dapat menyebabkan pembesaran kelenjar minyak pada hidung (rhinophyma) jika tidak ditangani.  Acne vulgaris dapat menyebabkan jaringan parut.\n\nTeks ini hanya membandingkan rosacea dengan acne vulgaris, dan tidak memberikan informasi untuk membandingkannya dengan penyakit kulit lainnya.  Oleh karena itu, saya tidak dapat menjawab pertanyaan Anda secara lengkap.\n',
 'source_documents': [Document(metadata={'source': 'new_articles/21.txt'}, page_content='2. Jenis Lesi  \n   - Rosacea ditandai dengan kemerahan (eritema) dan pembulu

In [45]:
query = "Apa saja gejala awal melanoma yang perlu diwaspadai?"
llm_response = qa_chain(query)
llm_response

{'query': 'Apa saja gejala awal melanoma yang perlu diwaspadai?',
 'result': 'Gejala awal melanoma yang perlu diwaspadai meliputi perubahan pada tahi lalat atau bintik kulit (perubahan warna, ukuran, atau bentuk; tahi lalat yang gatal, berdarah, atau berkeropeng), area kulit yang tidak sembuh, pigmentasi yang menyebar (warna gelap atau hitam meluas dari tahi lalat ke kulit sekitarnya), dan kulit yang terasa berbeda (kasar, bersisik, atau keras).  Gejala lanjutan dapat mencakup benjolan keras di bawah kulit, nyeri tanpa sebab jelas, pembengkakan kelenjar getah bening, dan kesulitan bernapas (jika kanker telah menyebar).\n',
 'source_documents': [Document(metadata={'source': 'new_articles/03.txt'}, page_content='### Gejala Awal Melanoma yang Perlu Diwaspadai  \n\nMelanoma adalah jenis kanker kulit yang berbahaya karena dapat menyebar dengan cepat ke bagian tubuh lainnya jika tidak ditangani sejak dini. Mengenali gejala awal sangat penting untuk mendapatkan pengobatan tepat waktu. Berikut

In [47]:
query = "Mengapa atopic dermatitis sering terjadi pada anak-anak, dan bagaimana cara mengelolanya?"
llm_response = qa_chain(query)
llm_response

{'query': 'Mengapa atopic dermatitis sering terjadi pada anak-anak, dan bagaimana cara mengelolanya?',
 'result': 'Atopic dermatitis (AD) sering terjadi pada anak-anak karena kombinasi faktor genetik (riwayat keluarga dengan alergi seperti asma atau rinitis alergi meningkatkan risiko) dan perkembangan sistem kekebalan tubuh yang masih belum sempurna sehingga bereaksi berlebihan terhadap alergen atau iritan.\n\nPengelolaan AD melibatkan pelembapan rutin kulit, penggunaan obat-obatan yang tepat (sesuai resep dokter), dan menghindari pemicu iritasi atau alergi.\n',
 'source_documents': [Document(metadata={'source': 'new_articles/04.txt'}, page_content='### Kesimpulan  \nAtopic dermatitis pada anak-anak sering disebabkan oleh kombinasi faktor genetik, sistem kekebalan tubuh yang berkembang, dan sensitivitas kulit. Mengelola kondisi ini melibatkan pelembapan rutin, penggunaan obat-obatan yang tepat, serta menghindari pemicu iritasi atau alergi. Dengan perawatan yang tepat dan perhatian dari

In [48]:
query = "Apa perbedaan antara impetigo dan cellulitis dari segi penyebab dan gejala?"
llm_response = qa_chain(query)
llm_response

{'query': 'Apa perbedaan antara impetigo dan cellulitis dari segi penyebab dan gejala?',
 'result': 'Impetigo dan cellulitis keduanya disebabkan oleh bakteri *Staphylococcus aureus* atau *Streptococcus pyogenes*.  Namun, impetigo biasanya menginfeksi lapisan luar kulit (epidermis) dan menyebar melalui kontak langsung, sedangkan cellulitis menginfeksi lapisan kulit yang lebih dalam (dermis dan jaringan subkutan), seringkali melalui luka atau cedera pada kulit.\n\nSecara gejala, impetigo ditandai dengan lepuhan berisi cairan yang pecah dan mengering menjadi kerak. Cellulitis, di sisi lain, menyebabkan pembengkakan, kemerahan, dan rasa sakit yang lebih dalam di kulit.\n',
 'source_documents': [Document(metadata={'source': 'new_articles/05.txt'}, page_content='Perbedaan Utama  \n- Lokasi infeksi: Impetigo biasanya terjadi pada lapisan luar kulit, sedangkan cellulitis menyerang lapisan yang lebih dalam.  \n- Penampilan ruam: Impetigo menampilkan lepuhan berisi cairan yang pecah dan mengerin