# **RAG for KBLI**

## Import Libraries

In [27]:
import os
import json
import pandas as pd
import time

# 1) Import Pinecone v2 client & LangChain wrapper
from pinecone import Pinecone, ServerlessSpec
from langchain.vectorstores import Pinecone as PineconeStore
from langchain_pinecone.vectorstores import PineconeVectorStore

from langchain.schema import Document, HumanMessage, AIMessage
from langchain.chat_models import ChatOpenAI
from langchain.embeddings import OpenAIEmbeddings
from langchain.retrievers.self_query.base import SelfQueryRetriever
from langchain.chains import ConversationalRetrievalChain
from langchain.prompts import PromptTemplate
from langchain.chains.query_constructor.base import AttributeInfo
from langchain.retrievers import MergerRetriever, ContextualCompressionRetriever
from langchain_community.document_transformers import EmbeddingsRedundantFilter
from langchain.retrievers.document_compressors.base import DocumentCompressorPipeline
from langchain_core.vectorstores import VectorStore
from langchain_core.language_models.base import BaseLanguageModel
from langchain_core.embeddings import Embeddings

# Set your OpenAI API key
os.environ["OPENAI_API_KEY"] = "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"
os.environ['PINECONE_API_KEY'] = "pcsk_4mXCMJ_ANjVcgHrC2gMq7Gs68BRPbFSdwqW6JU1tgwxaUg4VgAUF7aw43iDbYfC5u8p6HY"

## History Utilities

In [22]:
os.makedirs("chat_history", exist_ok=True)
os.makedirs("store_logs", exist_ok=True)

history_file = "chat_history/history.json"
log_path     = "store_logs"

def load_history():
    if os.path.exists(history_file):
        with open(history_file, "r", encoding="utf-8") as f:
            return json.load(f)
    return []

def save_history(msgs):
    with open(history_file, "w", encoding="utf-8") as f:
        json.dump(msgs, f, ensure_ascii=False, indent=2)

def reset_history():
    save_history([])
    print("Chat history has been reset.")


## Load and Embed Documents

In [24]:
df_kbli = pd.read_csv("dataset/kbli2020.csv", delimiter=",")
docs = []
for _, r in df_kbli.iterrows():
    meta = {
        "kategori": r.kategori,
        "digit":     str(r.digit),
        "kode":      str(r.kode),
        "judul":     r.judul.strip(),
    }
    meta_str = "; ".join(f"{k}={v}" for k, v in meta.items())
    content  = f"METADATA: {meta_str}\nCONTENT: {r.deskripsi.strip()}"
    docs.append(Document(page_content=content, metadata=meta))

In [20]:
# Document(metadata={'kategori': 'A', 'digit': '1', 'kode': 'A', 'judul': 'Pertanian, Kehutanan dan Perikanan', 'text': 'METADATA: kategori=A; digit=1; kode=A; judul=Pertanian, Kehutanan dan Perikanan\nCONTENT: Kategori ini mencakup semua kegiatan ekonomi/lapangan usaha, yang meliputi pertanian tanaman pangan, perkebunan, hortikultura, peternakan, pemanenan hasil hutan serta penangkapan dan budidaya ikan/biota air. Kategori ini juga mencakup jasa penunjang masing-masing kegiatan ekonomi tersebut.'}, page_content='METADATA: kategori=A; digit=1; kode=A; judul=Pertanian, Kehutanan dan Perikanan\nCONTENT: Kategori ini mencakup semua kegiatan ekonomi/lapangan usaha, yang meliputi pertanian tanaman pangan, perkebunan, hortikultura, peternakan, pemanenan hasil hutan serta penangkapan dan budidaya ikan/biota air. Kategori ini juga mencakup jasa penunjang masing-masing kegiatan ekonomi tersebut.'),
#  Document(metadata={'kategori': 'A', 'digit': '2', 'kode': '01', 'judul': 'Pertanian Tanaman, Peternakan, Perburuan dan Kegiatan YBDI', 'text': 'METADATA: kategori=A; digit=2; kode=01; judul=Pertanian Tanaman, Peternakan, Perburuan dan Kegiatan YBDI\nCONTENT: Golongan pokok ini mencakup pertanian tanaman pangan, perkebunan dan hortikultura; usaha pemeliharaan hewan ternak dan unggas; perburuan dan penangkapan hewan dengan perangkap serta kegiatan penunjang ybdi yang ditujukan untuk dijual. Termasuk budidaya tanaman dan hewan ternak secara organik dan genetik. Kegiatan pertanian tidak mencakup kegiatan pengolahan dari komoditas pertanian,  termasuk dalam Kategori C (Industri Pengolahan). Kegiatan konstruksi lahan seperti pembuatan petak-petak sawah, irigasi saluran pembuangan air, serta pembersihan dan perbaikan lahan untuk pertanian tidak termasuk di sini, tetapi tercakup pada kategori konstruksi (F).'}, page_content='METADATA: kategori=A; digit=2; kode=01; judul=Pertanian Tanaman, Peternakan, Perburuan dan Kegiatan YBDI\nCONTENT: Golongan pokok ini mencakup pertanian tanaman pangan, perkebunan dan hortikultura; usaha pemeliharaan hewan ternak dan unggas; perburuan dan penangkapan hewan dengan perangkap serta kegiatan penunjang ybdi yang ditujukan untuk dijual. Termasuk budidaya tanaman dan hewan ternak secara organik dan genetik. Kegiatan pertanian tidak mencakup kegiatan pengolahan dari komoditas pertanian,  termasuk dalam Kategori C (Industri Pengolahan). Kegiatan konstruksi lahan seperti pembuatan petak-petak sawah, irigasi saluran pembuangan air, serta pembersihan dan perbaikan lahan untuk pertanian tidak termasuk di sini, tetapi tercakup pada kategori konstruksi (F).'),
#  Document(metadata={'kategori': 'A', 'digit': '3', 'kode': '011', 'judul': 'Pertanian Tanaman Semusim', 'text': 'METADATA: kategori=A; digit=3; kode=011; judul=Pertanian Tanaman Semusim\nCONTENT: Golongan ini mencakup penanaman tanaman yang tidak berlangsung lebih dari dua musim panen. Termasuk penanaman tanaman dalam berbagai media dan budidaya tanaman secara genetik, dan juga penanaman untuk tujuan pembibitan dan pembenihan.'}, page_content='METADATA: kategori=A; digit=3; kode=011; judul=Pertanian Tanaman Semusim\nCONTENT: Golongan ini mencakup penanaman tanaman yang tidak berlangsung lebih dari dua musim panen. Termasuk penanaman tanaman dalam berbagai media dan budidaya tanaman secara genetik, dan juga penanaman untuk tujuan pembibitan dan pembenihan.'),
#  Document(metadata={'kategori': 'A', 'digit': '4', 'kode': '0111', 'judul': 'Pertanian serealia (bukan padi), aneka kacang dan biji-bijian penghasil minyak', 'text': 'METADATA: kategori=A; digit=4; kode=0111; judul=Pertanian serealia (bukan padi), aneka kacang dan biji-bijian penghasil minyak\nCONTENT: Subgolongan ini mencakup pertanian semua serealia, aneka kacang dan biji-bijian penghasil minyak di lahan terbuka, termasuk pertanian tanaman organik dan pertanian tanaman yang telah dimodifikasi. Pertanian tanaman ini sering dikombinasikan dalam unit pertanian.    \r\n\r\nSubgolongan ini mencakup :  \r\n- Pertanian serealia seperti gandum, jagung, sorgum, gandum untuk membuat bir (barley), gandum hitam (rye), oats, millet dan serealia lainnya  \r\n- Pertanian aneka kacang palawija, mencakup kacang kedelai, kacang tanah dan kacang hijau   \r\n- Pertanian aneka kacang hortikultura, mencakup buncis, buncis besar, kacang panjang, cow peas, miju-miju, lupin, kacang polong, pigeon peas dan tanaman aneka kacang lainnya  \r\n- Pertanian biji-bijian penghasil minyak, seperti biji kapas, biji castor, biji rami, biji mustard, niger seeds, rapeseed/canola, biji wijen, safflower seeds, biji bunga matahari dan tanaman penghasil minyak lainnya    \r\n\r\nSubgolongan ini tidak mencakup :  \r\n- Pertanian jagung (maize) untuk makanan ternak, lihat 0119'}, page_content='METADATA: kategori=A; digit=4; kode=0111; judul=Pertanian serealia (bukan padi), aneka kacang dan biji-bijian penghasil minyak\nCONTENT: Subgolongan ini mencakup pertanian semua serealia, aneka kacang dan biji-bijian penghasil minyak di lahan terbuka, termasuk pertanian tanaman organik dan pertanian tanaman yang telah dimodifikasi. Pertanian tanaman ini sering dikombinasikan dalam unit pertanian.    \r\n\r\nSubgolongan ini mencakup :  \r\n- Pertanian serealia seperti gandum, jagung, sorgum, gandum untuk membuat bir (barley), gandum hitam (rye), oats, millet dan serealia lainnya  \r\n- Pertanian aneka kacang palawija, mencakup kacang kedelai, kacang tanah dan kacang hijau   \r\n- Pertanian aneka kacang hortikultura, mencakup buncis, buncis besar, kacang panjang, cow peas, miju-miju, lupin, kacang polong, pigeon peas dan tanaman aneka kacang lainnya  \r\n- Pertanian biji-bijian penghasil minyak, seperti biji kapas, biji castor, biji rami, biji mustard, niger seeds, rapeseed/canola, biji wijen, safflower seeds, biji bunga matahari dan tanaman penghasil minyak lainnya    \r\n\r\nSubgolongan ini tidak mencakup :  \r\n- Pertanian jagung (maize) untuk makanan ternak, lihat 0119'),
#  Document(metadata={'kategori': 'A', 'digit': '5', 'kode': '01111', 'judul': 'Pertanian Jagung', 'text': 'METADATA: kategori=A; digit=5; kode=01111; judul=Pertanian Jagung\nCONTENT: Kelompok ini mencakup usaha pertanian komoditas jagung mulai dari kegiatan pengolahan lahan, penanaman, pemeliharaan, dan juga pemanenan dan pasca panen jika menjadi satu kesatuan kegiatan tanaman jagung. Termasuk kegiatan pembibitan dan pembenihan tanaman jagung.'}, page_content='METADATA: kategori=A; digit=5; kode=01111; judul=Pertanian Jagung\nCONTENT: Kelompok ini mencakup usaha pertanian komoditas jagung mulai dari kegiatan pengolahan lahan, penanaman, pemeliharaan, dan juga pemanenan dan pasca panen jika menjadi satu kesatuan kegiatan tanaman jagung. Termasuk kegiatan pembibitan dan pembenihan tanaman jagung.'),

# filter docs to only kode 74202
[doc for doc in docs if doc.metadata["kode"] == "74202"]


[Document(metadata={'kategori': 'M', 'digit': '5', 'kode': '74202', 'judul': 'Aktivitas Angkutan Udara Khusus Pemotretan, Survei Dan Pemetaan', 'text': 'METADATA: kategori=M; digit=5; kode=74202; judul=Aktivitas Angkutan Udara Khusus Pemotretan, Survei Dan Pemetaan\nCONTENT: Kelompok ini mencakup kegiatan angkutan udara untuk kegiatan pemotretan, survei dan pemetaan khusus dengan pesawat udara berdasarkan maksud dan tujuan tertentu dengan tujuan kota-kota atau provinsi di dalam negeri.'}, page_content='METADATA: kategori=M; digit=5; kode=74202; judul=Aktivitas Angkutan Udara Khusus Pemotretan, Survei Dan Pemetaan\nCONTENT: Kelompok ini mencakup kegiatan angkutan udara untuk kegiatan pemotretan, survei dan pemetaan khusus dengan pesawat udara berdasarkan maksud dan tujuan tertentu dengan tujuan kota-kota atau provinsi di dalam negeri.')]

In [None]:
class PineconeIndexManager:
    def __init__(self, embed_model: Embeddings, index_name: str):
        self.embed_model = embed_model
        self.index_name  = index_name
        self.api_key     = "pcsk_4mXCMJ_ANjVcgHrC2gMq7Gs68BRPbFSdwqW6JU1tgwxaUg4VgAUF7aw43iDbYfC5u8p6HY"
        # self.region      = config.get("pinecone_region", os.environ.get("PINECONE_ENVIRONMENT"))
        # init client
        self.pc = Pinecone(api_key=self.api_key)
        # ensure index exists
        self._create_index_if_not_exists()
        # open index handle
        self.index = self.pc.Index(self.index_name)

    def _create_index_if_not_exists(self):
        existing = self.pc.list_indexes().names()
        if self.index_name not in existing:
            self.pc.create_index(
                name=self.index_name,
                dimension=1536,
                metric="cosine",
                spec=ServerlessSpec(cloud="aws", region=self.region or "us-east-1")
            )
            # tunggu hingga index siap
            while True:
                desc = self.pc.describe_index(self.index_name)
                if desc.status.get("ready", False):
                    break
                time.sleep(1)

    def delete_index(self):
        # hapus semua entri
        self.index.delete(delete_all=True)
        # reset log
        with open(os.path.join(log_path, f"start_store_idx_{self.index_name}.txt"), "w") as f:
            f.write("0")
        print(f"Deleted all vectors in index '{self.index_name}'.")

    def store_vector_index(self, documents: list[Document], batch_size: int = 200):
        # bangun LangChain-Pinecone wrapper
        self.vector_store = PineconeVectorStore(
            index=self.index,
            embedding=self.embed_model
        )

        # baca posisi awal dari log
        log_file = os.path.join(log_path, f"start_store_idx_{self.index_name}.txt")
        start_idx = 0
        if os.path.exists(log_file):
            with open(log_file, "r") as f:
                start_idx = int(f.read().strip())
            print(f"Resuming upload from document #{start_idx}")

        # iterasi per batch
        total = len(documents)
        for i in range(start_idx, total, batch_size):
            batch = documents[i : i + batch_size]
            self.vector_store.add_documents(batch)
            # catat posisi terakhir
            last = min(i + batch_size, total)
            with open(log_file, "w") as f:
                f.write(str(last))
            print(f"Uploaded docs {i+1}–{last} of {total}")
            time.sleep(1)

    def load_vector_store(self) -> VectorStore:
        # cukup buka kembali wrapper
        self.vector_store = PineconeVectorStore(
            index=self.index,
            embedding=self.embed_model
        )
        print(f"Loaded PineconeVectorStore on index '{self.index_name}'.")
        return self.vector_store


In [36]:
embed_model = OpenAIEmbeddings(model="text-embedding-ada-002")
manager     = PineconeIndexManager(
    embed_model=embed_model,
    index_name="kbli2020-index",
)

# Uncomment jika ingin mengosongkan index dan log sebelum upsert ulang
# manager.delete_index()

# Upsert documents (iteratively, with resume)
manager.store_vector_index(docs)
vectordb = manager.load_vector_store()


Uploaded docs 1–200 of 2712
Uploaded docs 201–400 of 2712
Uploaded docs 401–600 of 2712
Uploaded docs 601–800 of 2712
Uploaded docs 801–1000 of 2712
Uploaded docs 1001–1200 of 2712
Uploaded docs 1201–1400 of 2712
Uploaded docs 1401–1600 of 2712
Uploaded docs 1601–1800 of 2712
Uploaded docs 1801–2000 of 2712
Uploaded docs 2001–2200 of 2712
Uploaded docs 2201–2400 of 2712
Uploaded docs 2401–2600 of 2712
Uploaded docs 2601–2712 of 2712
Loaded PineconeVectorStore on index 'kbli2020-index'.


## Custom Prompt Templates

In [37]:
system_instructions = """
Answer with:
- **Kode:** <kode KBLI>
- **Nama:** <classification name>
- **Deskripsi:** <detailed description>
If the question is unrelated to KBLI, say you cannot answer.
""".strip()

discern_prompt = PromptTemplate(
    input_variables=["chat_history","question"],
    template=(
        "Rephrase follow‑up question as standalone.\n"
        "Conversation:\n{chat_history}\n"
        "Follow‑up: {question}\n"
        "Standalone:"
    )
)

combine_prompt = PromptTemplate(
    input_variables=["context","question"],
    template=f"""{system_instructions}

Context:
{{context}}

Question: {{question}}

Answer:"""
)

## Setup Retrieval Chain (Merged + Dedup)

In [57]:
from langchain_community.query_constructors.pinecone import PineconeTranslator
from langchain.chains.query_constructor.base import (
    StructuredQueryOutputParser,
    get_query_constructor_prompt,
)

In [58]:
DEFAULT_SCHEMA = """\
<< Structured Request Schema >>
When responding use a markdown code snippet with a JSON object formatted in the following schema:

```json
{{{{
    "query": string \\ text string to compare to document contents
    "filter": string \\ logical condition statement for filtering documents
}}}}
```

The query string should contain only text that is expected to match the contents of documents. Any conditions in the filter should not be mentioned in the query as well.

A logical condition statement is composed of one or more comparison and logical operation statements.

A comparison statement takes the form: `comp(attr, val)`:
- `comp` ({allowed_comparators}): comparator
- `attr` (string):  name of attribute to apply the comparison to
- `val` (string): is the comparison value

A logical operation statement takes the form `op(statement1, statement2, ...)`:
- `op` ({allowed_operators}): logical operator
- `statement1`, `statement2`, ... (comparison statements or logical operation statements): one or more statements to apply the operation to

Make sure that you only use the comparators and logical operators listed above and no others.
Make sure that filters only refer to attributes that exist in the data source.
Make sure that filters only use the attributed names with its function names if there are functions applied on them.
Make sure that filters only use format `YYYY/MM/DD` when handling date data typed values.
Make sure that filters take into account the descriptions of attributes and only make comparisons that are feasible given the type of data being stored.
Make sure that filters are only used as needed. If there are no filters that should be applied return "NO_FILTER" for the filter value.\
"""

DEFAULT_SCHEMA_PROMPT = PromptTemplate.from_template(DEFAULT_SCHEMA)



In [73]:
def get_kbli_retriever(
    vector_store: VectorStore,
    llm_model: BaseLanguageModel,
    embed_model: Embeddings,
    top_k: int = 3
):
    # 1) Similarity‐based retriever
    retriever_sim = vector_store.as_retriever(
        search_type="similarity", search_kwargs={"k": top_k}
    )
    # 2) MMR retriever
    retriever_mmr = vector_store.as_retriever(
        search_type="mmr", search_kwargs={"k": top_k, "fetch_k": top_k * 3}
    )

    pinecone_translator = PineconeTranslator()

    # 3) Self‑Query Retriever with correct AttributeInfo kwargs
    metadata_info = [
        AttributeInfo(name="kategori", description="Primary KBLI category (A, B, …)",    type="string"),
        AttributeInfo(name="digit",    description="Number of digits in code level",     type="string"),
        AttributeInfo(name="kode",     description="Full KBLI code, e.g. '0111' or '95230'", type="string"),
        AttributeInfo(name="judul",    description="KBLI classification title",         type="string"),
    ]

    prompt = get_query_constructor_prompt(
        document_contents="metadata and content",
        attribute_info=metadata_info,
        schema_prompt=DEFAULT_SCHEMA_PROMPT,
        allowed_comparators=pinecone_translator.allowed_comparators,
        allowed_operators=pinecone_translator.allowed_operators
    )

    output_parser = StructuredQueryOutputParser.from_components()
    query_constructor = prompt | llm_model | output_parser

    retriever_self = SelfQueryRetriever(
        query_constructor=query_constructor,
        vectorstore=vector_store,
        search_type="mmr",
        search_kwargs={"k": top_k, 'lambda_mult': 0.85, 'fetch_k': 40,},
    )

    # 4) Merge similarity & mmr
    merged = MergerRetriever(retrievers=[retriever_mmr, retriever_sim, retriever_self])

    # 5) Deduplicate via embeddings‐based filter
    redundancy_filter = EmbeddingsRedundantFilter(embeddings=embed_model)
    compressor = DocumentCompressorPipeline(transformers=[redundancy_filter])
    filtered = ContextualCompressionRetriever(
        base_retriever=merged,
        base_compressor=compressor
    )

    return filtered


In [74]:
llm       = ChatOpenAI(model="gpt-3.5-turbo", temperature=0, verbose=True)
retriever = get_kbli_retriever(vectordb, llm, embed_model, top_k=3)

rag_chain = ConversationalRetrievalChain.from_llm(
    llm=llm,
    retriever=retriever,
    condense_question_prompt=discern_prompt,
    combine_docs_chain_kwargs={"prompt": combine_prompt},
    chain_type="stuff",
    return_source_documents=True,
)

In [75]:
retriever.invoke("Kode dari KBLI yang berjudul 'Pertanian Tanaman, Peternakan, Perburuan dan Kegiatan YBDI' ?")

[_DocumentWithState(metadata={'digit': '2', 'judul': 'Pertanian Tanaman, Peternakan, Perburuan dan Kegiatan YBDI', 'kategori': 'A', 'kode': '01'}, page_content='METADATA: kategori=A; digit=2; kode=01; judul=Pertanian Tanaman, Peternakan, Perburuan dan Kegiatan YBDI\nCONTENT: Golongan pokok ini mencakup pertanian tanaman pangan, perkebunan dan hortikultura; usaha pemeliharaan hewan ternak dan unggas; perburuan dan penangkapan hewan dengan perangkap serta kegiatan penunjang ybdi yang ditujukan untuk dijual. Termasuk budidaya tanaman dan hewan ternak secara organik dan genetik. Kegiatan pertanian tidak mencakup kegiatan pengolahan dari komoditas pertanian,  termasuk dalam Kategori C (Industri Pengolahan). Kegiatan konstruksi lahan seperti pembuatan petak-petak sawah, irigasi saluran pembuangan air, serta pembersihan dan perbaikan lahan untuk pertanian tidak termasuk di sini, tetapi tercakup pada kategori konstruksi (F).', state={'embedded_doc': [-0.004423654816910137, -0.02438768470445883

## Chat Function

In [76]:
def ask(query: str) -> dict:
    history = load_history()
    msgs = []

    for m in history:
        # support both your "type" field and LangChain's "role" field
        role = m.get("type") or m.get("role")
        if role in ("human", "user"):
            msgs.append(HumanMessage(content=m["content"]))
        elif role in ("ai", "assistant"):
            msgs.append(AIMessage(content=m["content"]))
        # else: skip any unexpected entries

    # run the RAG chain
    result = rag_chain.invoke({"question": query, "chat_history": msgs})
    answer = result["answer"]
    sources = result.get("source_documents", [])
    context = "\n---\n".join(d.page_content for d in sources)

    # append to history using your "type" key
    history.append({"type":"human",   "content": query})
    history.append({"type":"ai",      "content": answer})
    save_history(history)

    return {"context": context, "answer": answer, "history": history}


In [48]:
# Reset chat history if needed
reset_history()

Chat history has been reset.


In [77]:
resp = ask("Kode dari KBLI yang berjudul 'Pertanian Tanaman, Peternakan, Perburuan dan Kegiatan YBDI' ?")

In [78]:
print(resp['context'])

METADATA: kategori=A; digit=2; kode=01; judul=Pertanian Tanaman, Peternakan, Perburuan dan Kegiatan YBDI
CONTENT: Golongan pokok ini mencakup pertanian tanaman pangan, perkebunan dan hortikultura; usaha pemeliharaan hewan ternak dan unggas; perburuan dan penangkapan hewan dengan perangkap serta kegiatan penunjang ybdi yang ditujukan untuk dijual. Termasuk budidaya tanaman dan hewan ternak secara organik dan genetik. Kegiatan pertanian tidak mencakup kegiatan pengolahan dari komoditas pertanian,  termasuk dalam Kategori C (Industri Pengolahan). Kegiatan konstruksi lahan seperti pembuatan petak-petak sawah, irigasi saluran pembuangan air, serta pembersihan dan perbaikan lahan untuk pertanian tidak termasuk di sini, tetapi tercakup pada kategori konstruksi (F).
---
METADATA: kategori=O; digit=5; kode=84131; judul=Kegiatan Lembaga Pemerintahan Bidang Pertanian
CONTENT: Kelompok ini mencakup kegiatan lembaga pemerintahan dalam hal pembinaan, pengembangan dan penyelenggaraan di bidang pertan

In [79]:
print(resp["answer"])

- **Kode:** 011
- **Nama:** Pertanian Tanaman, Peternakan, Perburuan dan Kegiatan YBDI
- **Deskripsi:** Golongan pokok ini mencakup pertanian tanaman pangan, perkebunan dan hortikultura; usaha pemeliharaan hewan ternak dan unggas; perburuan dan penangkapan hewan dengan perangkap serta kegiatan penunjang ybdi yang ditujukan untuk dijual. Termasuk budidaya tanaman dan hewan ternak secara organik dan genetik. Kegiatan pertanian tidak mencakup kegiatan pengolahan dari komoditas pertanian,  termasuk dalam Kategori C (Industri Pengolahan). Kegiatan konstruksi lahan seperti pembuatan petak-petak sawah, irigasi saluran pembuangan air, serta pembersihan dan perbaikan lahan untuk pertanian tidak termasuk di sini, tetapi tercakup pada kategori konstruksi (F).
