In [1]:

import json
import os

from datasets import load_dataset


In [2]:
DATA_PATH = '../../data/functions/'
OUTPUT_PATH = '../../data/'

function_filenames = os.listdir(DATA_PATH)
print(function_filenames)

['function_HI.jsonl', 'function_KI.jsonl', 'function_HS.jsonl', 'function_IO.jsonl', 'function_SB.jsonl', 'function_NN.jsonl', 'function_BP.jsonl', 'function_HG.jsonl', 'function_KP.jsonl', 'function_GV.jsonl', 'function_PG.jsonl', 'function_XO.jsonl', 'function_UJ.jsonl', 'function_JS.jsonl', 'function_ZX.jsonl', 'function_CE.jsonl', 'function_PC.jsonl', 'function_HW.jsonl', 'function_EW.jsonl', 'function_WN.jsonl', 'function_MR.jsonl', 'function_QT.jsonl', 'function_SV.jsonl', 'function_YA.jsonl', 'function_EF.jsonl', 'function_CK.jsonl', 'function_BS.jsonl', 'function_DW.jsonl', 'function_MV.jsonl', 'function_SC.jsonl', 'function_FF.jsonl', 'function_EN.jsonl', 'function_UY.jsonl', 'function_GN.jsonl', 'function_NK.jsonl', 'function_MO.jsonl', 'function_JJ.jsonl', 'function_FR.jsonl', 'function_IH.jsonl', 'function_CS.jsonl', 'function_ZV.jsonl', 'function_GQ.jsonl', 'function_ID.jsonl', 'function_QD.jsonl']


In [3]:
def load_jsonl(file_path, function_name=None):
    data = list()
    with open(file_path, 'r', encoding='utf-8') as file:
        for line in file:
            # 각 줄을 JSON 객체로 파싱
            sample = json.loads(line.strip())
            if function_name is not None:
                sample['function_name'] = function_name
            data.append(sample)
    return data

In [4]:
res = list()
for function_filename in function_filenames:
    function_name = function_filename.split('.')[0].strip()
    path = os.path.join(DATA_PATH, function_filename)
    samples = load_jsonl(path, function_name=function_name)
    
    # subset
    l = len(samples)
    samples = samples[:l//2]
    
    res += samples

print(len(res))

22000


In [5]:

def save_to_jsonl(data, file_path):
    with open(file_path, 'w', encoding='utf-8') as file:
        for item in data:
            # 각 dict를 JSON 문자열로 변환 후 파일에 기록
            file.write(json.dumps(item, ensure_ascii=False) + '\n')

In [6]:
output_file = os.path.join(OUTPUT_PATH, 'train_subset.jsonl')

save_to_jsonl(res, output_file)

In [7]:
# 추가 확인
dataset = load_dataset('json', data_files=output_file)
print(dataset)

Generating train split: 0 examples [00:00, ? examples/s]

DatasetDict({
    train: Dataset({
        features: ['query', 'function_call', 'function_name'],
        num_rows: 22000
    })
})


# Function Descriptions

In [17]:
DATA_PATH = '../../data/description/'

function_filenames = os.listdir(DATA_PATH)
print(function_filenames)

['function_WN.py', 'function_MV.py', 'function_FR.py', 'function_ID.py', 'function_ZX.py', 'function_SB.py', 'function_CS.py', 'function_JJ.py', 'function_YA.py', 'function_MO.py', 'function_ZV.py', 'function_UJ.py', 'function_GV.py', 'function_GQ.py', 'function_GN.py', 'function_PG.py', 'function_EW.py', 'function_BS.py', 'function_QD.py', 'function_BP.py', 'function_KP.py', 'function_EN.py', 'function_SC.py', 'function_CK.py', 'function_HG.py', 'function_SV.py', 'function_HS.py', 'function_DW.py', 'function_UY.py', 'function_XO.py', 'function_QT.py', 'function_NK.py', 'function_IH.py', 'function_KI.py', 'function_CE.py', 'function_HW.py', 'function_NN.py', 'function_FF.py', 'function_JS.py', 'function_HI.py', 'function_EF.py', 'function_MR.py', 'function_PC.py', 'function_IO.py']


In [19]:
def read_py_file(file_path):
    with open(file_path, 'r', encoding='utf-8') as file:
        content = file.read()
    return content


In [21]:
function_filename = function_filenames[0]

contents = list()
for function_filename in function_filenames:
        
    path = os.path.join(DATA_PATH, function_filename)
    content = read_py_file(path)
    contents.append(content)
    
res = '\n\n'.join(contents)
print(res)

def function_WN(brightness: int = None, get: bool = False):
    """
    기기의 화면 및 LED 밝기를 조절하거나 현재 밝기 상태를 조회하는 함수.

    설명:
    - brightness 파라미터로 밝기 단계를 설정 가능하며, 0은 LED/화면 끄기를 의미함.
    - brightness 값 1~5는 낮음에서 높음 순의 밝기 단계 설정임.
    - brightness=-1은 모호하거나 범위 표현에 대한 내부 해석용 값임.
      단, 다음과 같은 동의어는 반드시 해당 구체 밝기 값으로 강제 변환하여 호출해야 하며,
      brightness=-1 호출은 명세 위반임:
        * '최대', '오', '5단계', '5단계로 해줘', '최대로' 등은 brightness=5 로 강제 변환.
        * '중간', '적당히', '3단계(강조)' 등은 brightness=3 으로 강제 변환.
        * '최소', '영', '0단계', '끄기' 등은 brightness=0 으로 강제 변환.
      - '높여줘', '낮춰줘', '기본 설정', '디폴트', '초기화', '강도 변경', '50%' 등
        명확한 수치 변환이 어려운 모호한 범위 표현에 대해서만 brightness=-1 로 호출하며,
        이후 내부 해석 로직이 필요함.

    - get=True 로 호출 시 현재 밝기 상태를 조회하며, 이 경우 brightness 값은 무시됨.
    - brightness와 get은 상호배타적이며, 둘 다 지정된 경우 get=True 가 우선 적용됨.
    - brightness=None 이고 get=False 인 경우 기능을 수행하지 않음.

    Parameters:
    - brightness (int, optional): 밝기 단계 조절 값
        * 0    → LED/화면 완전 끄기 (최소 밝기)
        * 1~5  → 밝기 단계 

In [23]:
new_res = res.replace('"""', '').replace('pass', '')
print(new_res)

def function_WN(brightness: int = None, get: bool = False):
    
    기기의 화면 및 LED 밝기를 조절하거나 현재 밝기 상태를 조회하는 함수.

    설명:
    - brightness 파라미터로 밝기 단계를 설정 가능하며, 0은 LED/화면 끄기를 의미함.
    - brightness 값 1~5는 낮음에서 높음 순의 밝기 단계 설정임.
    - brightness=-1은 모호하거나 범위 표현에 대한 내부 해석용 값임.
      단, 다음과 같은 동의어는 반드시 해당 구체 밝기 값으로 강제 변환하여 호출해야 하며,
      brightness=-1 호출은 명세 위반임:
        * '최대', '오', '5단계', '5단계로 해줘', '최대로' 등은 brightness=5 로 강제 변환.
        * '중간', '적당히', '3단계(강조)' 등은 brightness=3 으로 강제 변환.
        * '최소', '영', '0단계', '끄기' 등은 brightness=0 으로 강제 변환.
      - '높여줘', '낮춰줘', '기본 설정', '디폴트', '초기화', '강도 변경', '50%' 등
        명확한 수치 변환이 어려운 모호한 범위 표현에 대해서만 brightness=-1 로 호출하며,
        이후 내부 해석 로직이 필요함.

    - get=True 로 호출 시 현재 밝기 상태를 조회하며, 이 경우 brightness 값은 무시됨.
    - brightness와 get은 상호배타적이며, 둘 다 지정된 경우 get=True 가 우선 적용됨.
    - brightness=None 이고 get=False 인 경우 기능을 수행하지 않음.

    Parameters:
    - brightness (int, optional): 밝기 단계 조절 값
        * 0    → LED/화면 완전 끄기 (최소 밝기)
        * 1~5  → 밝기 단계 (1: