In [None]:
%pip install -e git+https://github.com/saumya06/crewAI_nlsql.git@nlsql #egg=crewai
%cd '/home/wsuser/work/src/crewai'
%pip install .
%cd '/home/wsuser/work/'

In [None]:
# %pip install crewai[tools] 
from crewai_tools import NL2SQLTool
from crewai import LLM
import os, json
from crewai import Agent, Crew, Task, Process

In [None]:
DB_URL = "52.118.208.226"
DB_PORT = "8020"
DB_NAME = "mydb"
DB_USER = "myuser"
DB_PASSWORD = ""

WX_URL= ""
WX_API_KEY = ""
WX_PROJECT_ID = ""

In [4]:
nl2sql = NL2SQLTool(db_uri=f"postgresql://{DB_USER}:{DB_PASSWORD}@{DB_URL}:{DB_PORT}/{DB_NAME}")

In [13]:

# Initialize LLM
llm_db = LLM(
    api_key = WX_API_KEY,
    api_base = WX_URL,
    model="watsonx/meta-llama/llama-3-3-70b-instruct",
    params={
        "decoding_method": "greedy",
        "max_new_tokens": 15000,
        "temperature": 0,
        "repetition_penalty": 1.05
    }
)

# Initialize LLM
llm_ba = LLM(
    api_key = WX_API_KEY,
    api_base = WX_URL,
    model="watsonx/meta-llama/llama-3-3-70b-instruct",
    params={
        "decoding_method": "sample",
        "max_new_tokens": 15000,
        "temperature": 0.8,
        "repetition_penalty": 0.1
    }
)

def create_dbagent() -> Agent:
    return Agent(
        role = "Database Analyst",
        goal = """Buat report berdasarkan pertanyaan dari user dan informasi pada database. Selalu menuliskan nama kolom dalam format table_name."column_name" pada SQL Query""",
        backstory = """Kamu adalah seorang expert di bidang data analisis dan membuat report dari database""",
        llm = llm_db,
        allow_delegation = False,
        tools = [nl2sql]
    )

def create_researcher() -> Agent:
    return Agent(
        role = "Business Analyst",
        goal = """Analisis data disesuaikan dengan jenis pertanyaan pengguna.
        Columns:
        - TRANSACTION_TIMESTAMP: Timestamp of the transaction
        - CUSTOMER_ID: Unique identifier for the customer
        - CUSTOMER_NAME: Name of the customer
        - CUSTOMER_BIRTHDAY: Customer's birth date
        - CUSTOMER_MARRIAGE_STATUS: Marital status of the customer
        - CUSTOMER_SAVINGS_VALUE: Customer's savings amount
        - TRANSACTION_VALUE: Value of the transaction
        - TRANSACTION_TYPE: Type of transaction
        - SPENDING_LOCATION_OR_CATEGORY: Location or category of spending
        - ESTIMATED_ANNUAL_INCOME: Estimated annual income of the customer
        - TOTAL_SPENDING_LAST_MONTH: Total spending in the last month
        - MOST_COMMON_SPENDING_CATEGORY: Most common spending category for the customer
        - HAS_EXISTING_LOAN: Whether the customer has an existing loan
        - LOAN_PRODUCT_INTEREST_LEVEL: Interest level in loan products
        - CUSTOMER_SEGMENT: Customer segment
         """,
        backstory = """Kamu adalah seorang expert di bidang data analisis dan membuat report dari database""",
        llm = llm_ba,
        allow_delegation = True,
    )

def create_generation_task(agent, natural_query):
    return Task(
        description = f"""{natural_query}.""",
        expected_output = """Hasil dari database setelah running query""",
        agent = agent
    )

def create_analysis_task(agent, natural_query):
    return Task(
        description = f"""{natural_query}.""",
        expected_output = """Table atau hasil analisis dari report secara text""",
        agent=agent
    )

### Running both Analysis task and Generation task

In [14]:
query = "Berapa persentase pelanggan yang berstatus menikah, single dan bercerai di dalam dataset?"

research_agent=create_researcher()
query_agent=create_dbagent()

generation_task = create_generation_task(research_agent, query)
analysis_task = create_analysis_task(research_agent, query)
generation_crew = Crew(
    agents=[research_agent, query_agent],
    tasks=[analysis_task, generation_task],
    verbose=True
    )

In [15]:
crew_output = generation_crew.kickoff()

# Accessing the crew output
print(f"Raw Output: {crew_output.raw}")

if crew_output.json_dict:
    print(f"JSON Output: {json.dumps(crew_output.json_dict, indent=2)}")

if crew_output.pydantic:
    print(f"Pydantic Output: {crew_output.pydantic}")

# print(f"Tasks Output: {crew_output.tasks_output}")
print(f"/n/nToken Usage: {crew_output.token_usage}")

[1m[95m# Agent:[00m [1m[92mBusiness Analyst[00m
[95m## Task:[00m [92mBerapa persentase pelanggan yang berstatus menikah, single dan bercerai di dalam dataset?.[00m


[1m[95m# Agent:[00m [1m[92mDatabase Analyst[00m
[95m## Task:[00m [92mBerapa persentase pelanggan yang berstatus menikah, single, dan bercerai di dalam dataset?[00m




[1m[95m# Agent:[00m [1m[92mDatabase Analyst[00m
[95m## Thought:[00m [92mThought: Untuk mengetahui persentase pelanggan yang berstatus menikah, single, dan bercerai, saya perlu menjalankan query SQL yang dapat menghitung jumlah pelanggan untuk setiap status pernikahan dan kemudian menghitung persentase mereka dari total pelanggan. Saya akan menggunakan tool NL2SQLTool untuk mengubah pertanyaan ini menjadi query SQL.[00m
[95m## Using tool:[00m [92mNL2SQLTool[00m
[95m## Tool Input:[00m [92m
"{\"query\": \"SELECT CUSTOMER_MARRIAGE_STATUS, COUNT(*) AS jumlah FROM customer GROUP BY CUSTOMER_MARRIAGE_STATUS\"}"[00m
[95m## Tool Output:[00m [92m
Based on these tables [{'table_name': 'transactions'}, {'table_name': 'pelanggan_table'}] and columns {'transactions_columns': [{'column_name': 'customer_savings_value', 'data_type': 'numeric'}, {'column_name': 'estimated_annual_income', 'data_type': 'integer'}, {'column_name': 'total_spending_last_month', 'data_type': 'integer'},



[1m[95m# Agent:[00m [1m[92mDatabase Analyst[00m
[95m## Thought:[00m [92mThought: Saya perlu memperbaiki query SQL saya untuk menggunakan tabel dan kolom yang benar. Berdasarkan informasi yang diberikan, saya akan menggunakan tabel "transactions" dan kolom "customer_marriage_status". Saya juga perlu menghitung persentase pelanggan untuk setiap status pernikahan.[00m
[95m## Using tool:[00m [92mNL2SQLTool[00m
[95m## Tool Input:[00m [92m
"{\"query\": \"SELECT transactions.customer_marriage_status, COUNT(*) AS jumlah, (COUNT(*) * 100.0 / (SELECT COUNT(*) FROM transactions)) AS persentase FROM transactions GROUP BY transactions.customer_marriage_status\"}"[00m
[95m## Tool Output:[00m [92m
[{'customer_marriage_status': 'Widowed', 'jumlah': 7, 'persentase': Decimal('3.5353535353535354')}, {'customer_marriage_status': 'Married', 'jumlah': 50, 'persentase': Decimal('25.2525252525252525')}, {'customer_marriage_status': 'Divorced', 'jumlah': 7, 'persentase': Decimal('3.53535



[1m[95m# Agent:[00m [1m[92mDatabase Analyst[00m
[95m## Final Answer:[00m [92m
Berdasarkan data yang ada, persentase pelanggan yang berstatus menikah adalah 25.25%, single adalah 67.67%, dan bercerai adalah 3.53%. Perlu diingat bahwa persentase ini dihitung berdasarkan total pelanggan yang ada di dalam dataset.[00m






[1m[95m# Agent:[00m [1m[92mBusiness Analyst[00m
[95m## Thought:[00m [92mThought: Untuk mengetahui persentase pelanggan yang berstatus menikah, single, dan bercerai di dalam dataset, saya perlu menganalisis data pada kolom CUSTOMER_MARRIAGE_STATUS. Saya akan menggunakan tool "Ask question to coworker" untuk meminta Database Analyst melakukan analisis data dan memberikan hasilnya.[00m
[95m## Using tool:[00m [92mAsk question to coworker[00m
[95m## Tool Input:[00m [92m
"{\"question\": \"Berapa persentase pelanggan yang berstatus menikah, single, dan bercerai di dalam dataset?\", \"context\": \"Saya memiliki dataset dengan kolom CUSTOMER_MARRIAGE_STATUS yang berisi status pernikahan pelanggan. Saya ingin mengetahui persentase pelanggan yang berstatus menikah, single, dan bercerai.\", \"coworker\": \"Database Analyst\"}"[00m
[95m## Tool Output:[00m [92m
Berdasarkan data yang ada, persentase pelanggan yang berstatus menikah adalah 25.25%, single adalah 67.67%, dan berce



[1m[95m# Agent:[00m [1m[92mBusiness Analyst[00m
[95m## Final Answer:[00m [92m
Berikut adalah tabel yang menampilkan persentase pelanggan yang berstatus menikah, single, dan bercerai di dalam dataset:

| Status Pernikahan | Persentase |
| --- | --- |
| Menikah | 25.25% |
| Single | 67.67% |
| Bercerai | 3.53% |
| Lain-lain | 3.55% |

Atau dalam bentuk teks:
Persentase pelanggan yang berstatus menikah adalah 25.25%, single adalah 67.67%, bercerai adalah 3.53%, dan lain-lain adalah 3.55%. Persentase ini dihitung berdasarkan total pelanggan yang ada di dalam dataset.[00m




[1m[95m# Agent:[00m [1m[92mBusiness Analyst[00m
[95m## Task:[00m [92mBerapa persentase pelanggan yang berstatus menikah, single dan bercerai di dalam dataset?.[00m


[1m[95m# Agent:[00m [1m[92mDatabase Analyst[00m
[95m## Task:[00m [92mMenjalankan query untuk menghitung persentase pelanggan berdasarkan status pernikahan[00m




[1m[95m# Agent:[00m [1m[92mDatabase Analyst[00m
[95m## Thought:[00m [92mThought: Untuk menghitung persentase pelanggan berdasarkan status pernikahan, saya perlu menjalankan query yang dapat menghitung jumlah pelanggan untuk setiap status pernikahan dan kemudian menghitung persentase masing-masing. Saya akan menggunakan tool NL2SQLTool untuk mengubah pertanyaan alami menjadi query SQL yang dapat dijalankan pada database.[00m
[95m## Using tool:[00m [92mNL2SQLTool[00m
[95m## Tool Input:[00m [92m
"{\"query\": \"SELECT customers.\\\"marital_status\\\", COUNT(*) AS jumlah_pelanggan FROM customers GROUP BY customers.\\\"marital_status\\\"\"}"[00m
[95m## Tool Output:[00m [92m
Based on these tables [{'table_name': 'transactions'}, {'table_name': 'pelanggan_table'}] and columns {'transactions_columns': [{'column_name': 'customer_savings_value', 'data_type': 'numeric'}, {'column_name': 'estimated_annual_income', 'data_type': 'integer'}, {'column_name': 'total_spending_last_



[1m[95m# Agent:[00m [1m[92mDatabase Analyst[00m
[95m## Thought:[00m [92mThought: Saya telah mencoba menjalankan query untuk menghitung persentase pelanggan berdasarkan status pernikahan, tetapi query tersebut gagal karena tabel "customers" tidak ditemukan. Saya perlu mencoba lagi dengan menggunakan nama tabel yang benar.[00m
[95m## Using tool:[00m [92mNL2SQLTool[00m
[95m## Tool Input:[00m [92m
"{\"query\": \"SELECT pelanggan_table.\\\"status_pernikahan\\\", COUNT(*) AS jumlah_pelanggan FROM pelanggan_table GROUP BY pelanggan_table.\\\"status_pernikahan\\\"\"}"[00m
[95m## Tool Output:[00m [92m
[{'status_pernikahan': 'Single', 'jumlah_pelanggan': 1}, {'status_pernikahan': 'Widowed', 'jumlah_pelanggan': 1}, {'status_pernikahan': 'Married', 'jumlah_pelanggan': 1}, {'status_pernikahan': 'Divorced', 'jumlah_pelanggan': 1}][00m




[1m[95m# Agent:[00m [1m[92mDatabase Analyst[00m
[95m## Thought:[00m [92mThought: Saya telah berhasil menjalankan query untuk menghitung jumlah pelanggan berdasarkan status pernikahan. Sekarang, saya perlu menghitung persentase masing-masing status pernikahan.[00m
[95m## Using tool:[00m [92mNL2SQLTool[00m
[95m## Tool Input:[00m [92m
"{\"query\": \"SELECT pelanggan_table.\\\"status_pernikahan\\\", COUNT(*) AS jumlah_pelanggan, (COUNT(*) * 100.0 / (SELECT COUNT(*) FROM pelanggan_table)) AS persentase FROM pelanggan_table GROUP BY pelanggan_table.\\\"status_pernikahan\\\"\"}"[00m
[95m## Tool Output:[00m [92m
[{'status_pernikahan': 'Single', 'jumlah_pelanggan': 1, 'persentase': Decimal('25.0000000000000000')}, {'status_pernikahan': 'Widowed', 'jumlah_pelanggan': 1, 'persentase': Decimal('25.0000000000000000')}, {'status_pernikahan': 'Married', 'jumlah_pelanggan': 1, 'persentase': Decimal('25.0000000000000000')}, {'status_pernikahan': 'Divorced', 'jumlah_pelanggan': 1,



[1m[95m# Agent:[00m [1m[92mDatabase Analyst[00m
[95m## Final Answer:[00m [92m
Berdasarkan data yang ada, persentase pelanggan berdasarkan status pernikahan adalah sebagai berikut:
- Single: 25%
- Widowed: 25%
- Married: 25%
- Divorced: 25%
Dengan demikian, dapat disimpulkan bahwa setiap status pernikahan memiliki persentase yang sama, yaitu 25%. Ini berarti bahwa data pelanggan yang ada memiliki distribusi yang relatif merata untuk setiap status pernikahan.[00m






[1m[95m# Agent:[00m [1m[92mBusiness Analyst[00m
[95m## Thought:[00m [92mThought: Untuk mengetahui persentase pelanggan yang berstatus menikah, single, dan bercerai di dalam dataset, saya perlu mengakses database dan menjalankan query yang relevan. Saya akan mendelegasikan tugas ini kepada Database Analyst karena mereka memiliki akses dan kemampuan untuk menjalankan query pada database.[00m
[95m## Using tool:[00m [92mDelegate work to coworker[00m
[95m## Tool Input:[00m [92m
"{\"task\": \"Menjalankan query untuk menghitung persentase pelanggan berdasarkan status pernikahan\", \"context\": \"Menghitung persentase pelanggan yang berstatus menikah, single, dan bercerai di dalam dataset\", \"coworker\": \"Database Analyst\"}"[00m
[95m## Tool Output:[00m [92m
Berdasarkan data yang ada, persentase pelanggan berdasarkan status pernikahan adalah sebagai berikut:
- Single: 25%
- Widowed: 25%
- Married: 25%
- Divorced: 25%
Dengan demikian, dapat disimpulkan bahwa setiap stat



[1m[95m# Agent:[00m [1m[92mBusiness Analyst[00m
[95m## Final Answer:[00m [92m
| Status Pernikahan | Persentase |
| --- | --- |
| Menikah | 25.25% |
| Single | 67.67% |
| Bercerai | 3.53% |
| Lain-lain | 3.55% |[00m




Raw Output: | Status Pernikahan | Persentase |
| --- | --- |
| Menikah | 25.25% |
| Single | 67.67% |
| Bercerai | 3.53% |
| Lain-lain | 3.55% |
/n/nToken Usage: total_tokens=12376 prompt_tokens=10910 cached_prompt_tokens=0 completion_tokens=1466 successful_requests=11
