STC-demo-v2_dev

Runtime error

Andrew Gockenbach commited on May 26

Commit

de23eb7

1 Parent(s): c5e182a

Updated tensor parallel size

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,8 +1,4 @@
 import os
-import json
-import subprocess
-import time
-import signal
 import atexit
 import torch
@@ -41,7 +37,7 @@ class VllmApiServer:
             "--enable-lora",
             "--lora-modules", f"adapter={self.adapter_path}",
             "--max-lora-rank", "64",
-            "--tensor-parallel-size", "1"
         ]
         print(f"Starting vLLM server with command: {' '.join(cmd)}")

 import os
 import atexit
 import torch
             "--enable-lora",
             "--lora-modules", f"adapter={self.adapter_path}",
             "--max-lora-rank", "64",
+            "--tensor-parallel-size", "4"
         ]
         print(f"Starting vLLM server with command: {' '.join(cmd)}")