Fix missing documentation in LLM runtime, and a broken link + some ty…

…pos (#1128) * Fix broken link * Fix script typos
intel · Jan 11, 2024 · f780a28 · f780a28
1 parent fdefb9d
commit f780a28
Show file tree

Hide file tree

Showing 2 changed files with 5 additions and 4 deletions.
diff --git a/intel_extension_for_transformers/llm/runtime/graph/README.md b/intel_extension_for_transformers/llm/runtime/graph/README.md
@@ -408,10 +408,11 @@ while True:
     outputs = model.generate(inputs, streamer=streamer, interactive=True, ignore_prompt=True, do_sample=True)
 ```
 
-## How to use: Python script
+## How to use: Straightforward Python script
 Install from binary
 ```shell
 pip install intel-extension-for-transformers
+pip install -r requirements.txt  # under graph folder
 ```
 
 Build from source

diff --git a/intel_extension_for_transformers/llm/runtime/graph/scripts/run.py b/intel_extension_for_transformers/llm/runtime/graph/scripts/run.py
@@ -167,7 +167,7 @@ def main(args_in: Optional[List[str]] = None) -> None:
     convert_cmd.extend(["--outfile", Path(work_path, "ne_{}_f32.bin".format(model_type))])
     convert_cmd.extend(["--outtype", "f32"])
     convert_cmd.append(args.model)
-    print("convert model ...")
+    print("Convert model ...")
     subprocess.run(convert_cmd)
 
     # 2. quantize
@@ -185,7 +185,7 @@ def main(args_in: Optional[List[str]] = None) -> None:
     if args.use_ggml:
         quant_cmd.extend(["--use_ggml"])
     quant_cmd.extend(["--build_dir", args.build_dir])
-    print("quantize model ...")
+    print("Quantize model ...")
     subprocess.run(quant_cmd)
 
     # 3. inference
@@ -204,7 +204,7 @@ def main(args_in: Optional[List[str]] = None) -> None:
     infer_cmd.extend(["--build_dir", args.build_dir])
     if args.shift_roped_k:
         infer_cmd.extend(["--shift-roped-k"])
-    print("inferce model ...")
+    print("Inference model ...")
     subprocess.run(infer_cmd)