Spaces:

yusufs
/

llama32-3b-instruct

Paused

yusufs commited on 20 days ago

Commit

7b16e9f

verified ·

1 Parent(s): 4bd51f5

fix(Dockerfile): use cmd single line

Files changed (1) hide show

Dockerfile CHANGED Viewed

@@ -16,23 +16,20 @@ FROM docker.io/vllm/vllm-openai:v0.10.0
 EXPOSE 7860
-ENTRYPOINT ["vllm", "serve"]
-CMD [
-  "--model", "meta-llama/Llama-3.2-3B-Instruct",
-  "--task", "generate",
-  "--revision", "0cb88a4f764b7a12671c53f0838cd831a0843b95",
-  "--code-revision", "0cb88a4f764b7a12671c53f0838cd831a0843b95",
-  "--tokenizer-revision", "0cb88a4f764b7a12671c53f0838cd831a0843b95",
-  "--seed", "42",
-  "--host", "0.0.0.0",
-  "--port", "7860",
-  "--max-num-batched-tokens", "32768",
-  "--max-model-len", "32768",
-  "--dtype", "float16",
-  "--enforce-eager",
-  "--gpu-memory-utilization", "0.9",
-  "--enable-prefix-caching",
-  "--disable-log-requests",
-  "--trust-remote-code"
-]

 EXPOSE 7860
+CMD vllm serve \
+  --model "meta-llama/Llama-3.2-3B-Instruct" \
+  --task generate \
+  --revision "0cb88a4f764b7a12671c53f0838cd831a0843b95" \
+  --code-revision "0cb88a4f764b7a12671c53f0838cd831a0843b95" \
+  --tokenizer-revision "0cb88a4f764b7a12671c53f0838cd831a0843b95" \
+  --seed 42 \
+  --host 0.0.0.0 \
+  --port 7860 \
+  --max-num-batched-tokens 32768 \
+  --max-model-len 32768 \
+  --dtype float16 \
+  --enforce-eager \
+  --gpu-memory-utilization 0.9 \
+  --enable-prefix-caching \
+  --disable-log-requests \
+  --trust-remote-code