llamastack · kplawiak · Jul 23, 2024 · Jul 23, 2024
@@ -1,11 +1,11 @@
-
 import re
 
 from string import Template
 from typing import List, Optional
 
 import torch
 from llama_models.llama3_1.api.datatypes import Message
+from termcolor import cprint
 from transformers import AutoModelForCausalLM, AutoTokenizer
 
 from .base import CANNED_RESPONSE_TEXT, OnViolationAction, ShieldBase, ShieldResponse
@@ -177,10 +177,10 @@ def build_prompt(self, messages: List[Message]) -> str:
         categories = self.get_safety_categories()
         categories_str = "\n".join(categories)
         conversations_str = "\n\n".join(
-            [f"{m.role.name.capitalize()}: {m.content}" for m in messages]
+            [f"{m.role.capitalize()}: {m.content}" for m in messages]
         )
         return PROMPT_TEMPLATE.substitute(
-            agent_type=messages[-1].role.name.capitalize(),
+            agent_type=messages[-1].role.capitalize(),
             categories=categories_str,
             conversations=conversations_str,
         )
@@ -230,7 +230,7 @@ async def run(self, messages: List[Message]) -> ShieldResponse:
             prompt_len = input_ids.shape[1]
             output = self.model.generate(
                 input_ids=input_ids,
-                max_new_tokens=50,
+                max_new_tokens=20,
                 output_scores=True,
                 return_dict_in_generate=True,
                 pad_token_id=0,
@@ -244,4 +244,5 @@ async def run(self, messages: List[Message]) -> ShieldResponse:
             response = response.strip()
             shield_response = self.get_shield_response(response)
 
+            cprint(f"Final Llama Guard response {shield_response}", color="magenta")
             return shield_response