From 0319e47064c92e799e8f8bd85eff4a35905e73d6 Mon Sep 17 00:00:00 2001
From: Yong Xia <yongx@google.com>
Date: Sat, 1 Mar 2025 00:01:28 +0000
Subject: [PATCH] Add the llama2-70b model

---
 experimental/jax/inference/config/config.py | 10 ++++++++++
 1 file changed, 10 insertions(+)

diff --git a/experimental/jax/inference/config/config.py b/experimental/jax/inference/config/config.py
index 178e381a..cafe36c8 100644
--- a/experimental/jax/inference/config/config.py
+++ b/experimental/jax/inference/config/config.py
@@ -19,6 +19,7 @@
 
 class ModelId:
   llama_2_7b_chat_hf = "meta-llama/Llama-2-7b-chat-hf"
+  llama_2_70b_chat_hf = "meta-llama/Llama-2-70b-chat-hf"
 
 
 @dataclasses.dataclass
@@ -43,6 +44,15 @@ class Config:
           page_size=128,
           hbm_utilization=0.875,
       ),
+      ModelId.llama_2_70b_chat_hf: InferenceParams(
+          model_id=ModelId.llama_2_70b_chat_hf,
+          batch_size=100,
+          max_seq_length=2048,
+          max_input_length=1024,
+          prefill_chunk_sizes=[128, 256, 512, 1024],
+          page_size=128,
+          hbm_utilization=0.875,
+      ),
   }
 
   @classmethod