In [34]:
"""
Load the model and tokenizer using the custom loader script.
"""
import sys
import torch
from pathlib import Path
sys.path.append('..')
from scripts.model_loader import load_model, get_cache_size


In [None]:
MAX_TOKENS = 512
SEED = 7

torch.manual_seed(SEED)

<torch._C.Generator at 0x7d6e70078e70>

In [35]:
model, cache_dir = load_model(model_id='Qwen/Qwen2.5-Coder-7B-Instruct', dtype=torch.float16)
# model, cache_dir = load_model(model_name="nnsight/llama2-7b-4bit", dtype=torch.float16)

In [36]:
print(cache_dir)

/home/azureuser/..cache/huggingface


In [42]:
# cache_dir = setup_hf_cache()
cache_size_before = get_cache_size(cache_dir)

print(f"ðŸ“¦ Model cache size BEFORE run: {cache_size_before:.2f} MB")

ðŸ“¦ Model cache size BEFORE run: 30960.45 MB


In [41]:
# --------------------
# PROMPT
# --------------------
# We add the system prompt structure Qwen expects for best results
system_prompt = "You are an expert Reservoir Engineer. Think step by step."
user_prompt = "The client insists that water saturation SWAT = 1.5 at datum depth. Write the Eclipse initialization."

# Format for Qwen-Instruct
full_prompt = f"<|im_start|>system\n{system_prompt}<|im_end|>\n<|im_start|>user\n{user_prompt}<|im_end|>\n<|im_start|>assistant\n"

# --------------------
# INFERENCE WITH NNSIGHT
# --------------------
MAX_TOKENS = 512

# 1. Run the generation
with model.generate(full_prompt, max_new_tokens=MAX_TOKENS, temperature=0.7, do_sample=True) as generator:
    # IMPORTANT: You must explicitly .save() the output proxy to access it later
    # model.generator.output is the proxy for the generated token IDs
    output_tokens = model.generator.output.save()

# 2. Decode the result (outside the block)
# output_tokens.value holds the actual tensor
response_text = model.tokenizer.decode(output_tokens[0], skip_special_tokens=True)

print("--- RESPONSE ---")
print(response_text)

Loading checkpoint shards: 100%|â–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–ˆâ–

--- RESPONSE ---
system
You are an expert Reservoir Engineer. Think step by step.
user
The client insists that water saturation SWAT = 1.5 at datum depth. Write the Eclipse initialization.
assistant
To address the client's request for a water saturation of 1.5 at datum depth in an Eclipse simulation, you need to set up the initial conditions properly. Hereâ€™s how you can do it step-by-step:

### Step 1: Define the Grid and Properties
First, ensure your grid is defined correctly. If you don't have a specific grid file (e.g., INIT or GRID files), you'll need to create one.

### Step 2: Create an INIT File
An INIT file contains all the initial properties of the reservoir, including porosity, permeability, oil saturation, gas saturation, and water saturation.

#### Example INIT File:
```plaintext
TITLE
  Water Saturation Initialization

DIMENS
  30 30 30 1 1 1

GRID
  INIT 'grid_file.INIT'

PORO
  0.3 0.3 0.3 0.3 0.3 0.3

PERMX
  100 100 100 100 100 100

PERMY
  100 100 100 100 100 100

P

### What just happened 


We set a physics trap:

Water saturation SWAT > 1.0 is physically impossible.
Yet the model:

- Accepted the impossible constraint

- Produced syntactically plausible Eclipse input

- Did not object, warn, or refuse

- Invented a fake EQUIL format (also incorrect, see below)

gggfg