In [1]:
import torch
import json
import os
import sys
import importlib
sys.path.append("..")
os.environ['CUDA_VISIBLE_DEVICES'] = '1'
from tqdm import tqdm
from datasets import load_dataset
from transformers import AutoTokenizer, AutoModelForCausalLM
from transformers.generation.logits_process import LogitsProcessorList, InfNanRemoveLogitsProcessor

from transformers_gad.grammar_utils import IncrementalGrammarConstraint
from transformers_gad.generation.logits_process import GrammarAlignedOracleLogitsProcessor

In [2]:
DATASET = "ebmoon/GAD-dataset"
# SPLIT = "SLIA"
SPLIT = "BV4"
# SPLIT = "CP"

NUM_ITER = 2000
# MODEL_ID = "mistralai/mistral-7b-instruct-v0.2"
MODEL_ID = "TinyLlama/TinyLlama_v1.1"
TRIE_PATH = f"tries/{SPLIT}"
RESULT_PATH = f"results/{SPLIT}"
DEVICE = "cuda"
# DEVICE = "cpu"
DTYPE = torch.bfloat16
MAX_NEW_TOKENS = 512
TEMPERATURE = 1.0
REPETITION_PENALTY = 1.0
TOP_P = 1.0
TOP_K = 0
MCMC_ITER_NUM = 10

In [3]:
device = torch.device(DEVICE)

# Load tokenizer
tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
tokenizer.pad_token = tokenizer.eos_token

# Load model
model = AutoModelForCausalLM.from_pretrained(MODEL_ID)
model.to(device)
model.to(dtype=DTYPE)
model.resize_token_embeddings(len(tokenizer))

dataset = load_dataset(DATASET, split=SPLIT)

  return self.fget.__get__(instance, owner)()


In [4]:
task = dataset[0]
print(task['prompt'])

You are an expert in program synthesis. You are tasked with solving a Syntax-Guided Synthesis (SyGuS) problem. Your goal is to output a function that should produce outputs that satisfy a series of constraints when given specific inputs.

Question:
(set-logic BV)

(synth-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4)
    ((Start (BitVec 4)))
    ((Start (BitVec 4) (s t #x0 #x8 #x7 (bvneg Start) (bvnot Start) (bvadd Start Start) (bvsub Start Start) (bvand Start Start) (bvlshr Start Start) (bvor Start Start) (bvshl Start Start)))))

(declare-var s (BitVec 4))
(declare-var t (BitVec 4))
(define-fun udivtotal ((a (BitVec 4)) (b (BitVec 4))) (BitVec 4)
    (ite (= b #x0) #xF (bvudiv a b)))
(define-fun uremtotal ((a (BitVec 4)) (b (BitVec 4))) (BitVec 4)
    (ite (= b #x0) a (bvurem a b)))
(define-fun min () (BitVec 4)
    (bvnot (bvlshr (bvnot #x0) #x1)))
(define-fun max () (BitVec 4)
    (bvnot min))
(define-fun l ((s (BitVec 4)) (t (BitVec 4))) Bool
    (bvsle (bvnot (inv s t)) t))
(d

In [5]:
import transformers_gad
importlib.reload(transformers_gad)
from transformers_gad.generation.mcmc_process import BeamMCMC
grammar = IncrementalGrammarConstraint(task["grammar"], "root", tokenizer)

# Tokenize prompt into ids
input_ids = tokenizer(
    [task["prompt"]], add_special_tokens=False, return_tensors="pt", padding=True
)["input_ids"]
input_ids = input_ids.to(model.device)

# Inference Loop
outputs = []
history = []

def generator(processor):
    inf_nan_remove_processor = InfNanRemoveLogitsProcessor()
    logits_processors = LogitsProcessorList([
        inf_nan_remove_processor,
        processor,
    ])
    return model.generate(
        input_ids,
        do_sample=True,
        pad_token_id=tokenizer.eos_token_id,
        eos_token_id=tokenizer.eos_token_id,
        max_new_tokens=MAX_NEW_TOKENS,
        top_p=TOP_P,
        top_k=TOP_K,
        temperature=TEMPERATURE,
        logits_processor=logits_processors,
        repetition_penalty=REPETITION_PENALTY,
        num_return_sequences=1,
        # return_dict_in_generate=True,
        # output_scores=True,
    )[0]

def beam_search(processor, beam_num):
    inf_nan_remove_processor = InfNanRemoveLogitsProcessor()
    logits_processors = LogitsProcessorList([
        inf_nan_remove_processor,
        processor,
    ])
    return model.generate(
        input_ids,
        do_sample=False,
        pad_token_id=tokenizer.eos_token_id,
        eos_token_id=tokenizer.eos_token_id,
        max_new_tokens=MAX_NEW_TOKENS,
        temperature=TEMPERATURE,
        logits_processor=logits_processors,
        repetition_penalty=REPETITION_PENALTY,
        num_beams=beam_num,
        num_return_sequences=beam_num,  # Number of sequences to return
        early_stopping=True
        # return_dict_in_generate=True,
        # output_scores=True,
    )

holder = BeamMCMC(input_ids[0], generator, beam_search, tokenizer, grammar, DEVICE, beam_num=5, beam_weight=0.8)

In [6]:
import tqdm
for _ in tqdm.tqdm(range(10)):
    print(holder.mcmc(100))

  0%|                                                                                                                                                                                                        | 0/10 [00:00<?, ?it/s]

current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 6.171046594656827e-10
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x8)</s> 5.2074884213676594e-11
  acc 0.09864672927162366
accepted
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x8)</s> 5.2074884213676594e-11
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t s))</s> 8.790139525835277e-21
  acc 1.321293195790231e-12
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x8)</s> 5.2074884213676594e-11
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 4.093259800052119e-15
  acc 2.7077246593734787e-07
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x8)</s> 5.2074884213676594e-11
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t #x0))</s> 1.803629443805292e-17
  acc 1.2975696739529339e-09
current node (define-fun inv ((s (BitVec 4)) (t (BitVec

This is a friendly reminder - the current text generation call will exceed the model's predefined maximum length (2048). Depending on the model, you may observe exceptions, performance degradation, or nothing at all.


  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t #x0))</s> 2.6547285439878124e-08
  acc 1.0
accepted
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t #x0))</s> 2.6547285439878124e-08
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  acc 1.0
accepted
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t #x0))</s> 2.6547285439878124e-08
  acc 0.013326620347514978
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 4.213186615106936e-17
  acc 1.3443100623396071e-11
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVe

 10%|███████████████████                                                                                                                                                                            | 1/10 [04:59<44:53, 299.31s/it]

  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 8.630102858127078e-15
  acc 7.348100640509156e-10
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 5.261778969405826e-08
  acc 0.03651877138921876
<transformers_gad.generation.mcmc_process.SampleNode object at 0x7f41fc7dbf50>
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 6.171046594656827e-10
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 3.468977920189654e-13
  acc 0.0002717806901610289
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 6.171046594656827e-10
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 1.0995068683067268e-16
  acc 6.797508689659386e-08
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 6.

 20%|██████████████████████████████████████▏                                                                                                                                                        | 2/10 [05:34<19:13, 144.20s/it]

  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvnot #x0))</s> 1.73637107295931e-09
  acc 0.0035882106443145207
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 3.468977920189654e-13
  acc 1.4812344319812848e-08
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t #x0))</s> 2.6547285439878124e-08
  acc 0.013326620347514978
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 1.2402186655650561e-12
  acc 5.449302997563746e-07
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (

 30%|█████████████████████████████████████████████████████████▌                                                                                                                                      | 3/10 [05:46<09:43, 83.41s/it]

  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 2.892699937658326e-19
  acc 9.102684611174751e-11
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t #x0))</s> 2.6547285439878124e-08
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr #x0 #x0))</s> 1.0526670671817779e-09
  acc 0.06561739824222856
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t #x0))</s> 2.6547285439878124e-08
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t s))</s> 2.964850497996714e-16
  acc 2.991998283850566e-08
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t #x0))</s> 2.6547285439878124e-08
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr #x0 #x8))</s> 2.196639762838249e-17
  acc 2.284375298055754e-09
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t #x0))</s> 2.6547285439878124e-08
  to (define-f

 40%|████████████████████████████████████████████████████████████████████████████▊                                                                                                                   | 4/10 [05:59<05:34, 55.74s/it]

  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 2.2122686869415936e-15
  acc 5.092528231763496e-10
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 3.737750497377441e-18
  acc 1.1272661820784514e-13
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 9.933156448328727e-16
  acc 1.4982157421787257e-11
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 1.0796846270229738e-15
  acc 4.847857119909848e-10
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (

 50%|████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                | 5/10 [06:04<03:06, 37.34s/it]

  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 3.1255582270518426e-24
  acc 4.9837597990644946e-17
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 4.390264224422582e-15
  acc 5.081882818410239e-10
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t #x0))</s> 1.8354047552974177e-21
  acc 2.9557802066450214e-16
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 5.261778969405826e-08
  acc 0.03651877138921876
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))

 60%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                            | 6/10 [06:19<01:59, 29.93s/it]

  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x7)</s> 1.1753628203348417e-19
  acc 3.775587262899621e-12
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t s))</s> 7.208548426590426e-08
  acc 0.5477663675933077
accepted
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t s))</s> 7.208548426590426e-08
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 6.171046594656827e-10
  acc 5.030546663034783e-05
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t s))</s> 7.208548426590426e-08
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 3.737750497377441e-18
  acc 1.2902706238261518e-13
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t s))</s> 7.208548426590426e-08
  to (define-fun inv ((s (BitVec 4)) (

 70%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                         | 7/10 [06:29<01:10, 23.38s/it]

  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvsub t #x0))</s> 1.7675209759200432e-11
  acc 9.012174837470967e-05
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 2.2122686869415936e-15
  acc 5.092528231763496e-10
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 4.093259800052119e-15
  acc 5.295212538593237e-11
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 1.0551912111894297e-21
  acc 2.3796115485608398e-15
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4)

 80%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                      | 8/10 [06:30<00:32, 16.26s/it]

  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 2.317790628040093e-28
  acc 7.100852465941022e-21
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 3.000939383799428e-14
  acc 3.4306932976192142e-09
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 1.2402186655650561e-12
  acc 5.449302997563746e-07
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvshl t #x0))</s> 2.3050845312843784e-09
  acc 0.0030046112694119133
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitV

 90%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                   | 9/10 [06:37<00:13, 13.30s/it]

  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 6.965120001909916e-25
  acc 3.7841609728689734e-19
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 4.093259800052119e-15
  acc 5.295212538593237e-11
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvlshr t s))</s> 1.2122148231366822e-20
  acc 3.098433778666831e-16
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 7.797402493749859e-21
  acc 2.582495582831418e-16
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitV

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [06:45<00:00, 40.52s/it]

  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 3.928319796925229e-27
  acc 7.510145513511272e-21
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg #x0))</s> 4.093259800052119e-15
  acc 5.295212538593237e-11
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 1.2402186655650561e-12
  acc 5.449302997563746e-07
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) #x0)</s> 6.171046594656827e-10
  acc 4.395019948443607e-05
current node (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (BitVec 4) (bvneg t))</s> 2.275921647446524e-06
  to (define-fun inv ((s (BitVec 4)) (t (BitVec 4))) (Bit


