Spaces:

sergey21000
/

gradio-llamacpp-chatbot

Running

sergey21000 commited on 5 days ago

Commit

e87579a

verified ·

1 Parent(s): 35c506d

Upload 2 files

Files changed (2) hide show

Dockerfile CHANGED Viewed

@@ -1,12 +1,13 @@
-FROM ghcr.io/sergey21000/gradio-llamacpp-chatbot:main-cpu
-RUN useradd -m -u 1000 user \
-    && chown -R user:user /app
-USER user
-ENV HOME=/home/user \
-    PATH=/home/user/.local/bin:$PATH
-WORKDIR /app
 CMD ["python3", "app.py"]

+FROM ghcr.io/sergey21000/gradio-llamacpp-chatbot:main-cpu
+RUN useradd -m -u 1000 user \
+    && chown -R user:user /app
+USER user
+ENV HOME=/home/user \
+    PATH=/home/user/.local/bin:$PATH
+WORKDIR /app
+COPY --chown=user config.py ./
 CMD ["python3", "app.py"]

config.py ADDED Viewed

+GENERATION_KWARGS = dict(
+    temperature=0.2,
+    top_p=0.95,
+    top_k=40,
+    repeat_penalty=1.0,
+)
+LLAMA_MODEL_KWARGS = dict(
+    # repo_id='bartowski/google_gemma-3-1b-it-GGUF',
+    # filename='google_gemma-3-1b-it-Q8_0.gguf',
+    repo_id='bartowski/Qwen_Qwen3-0.6B-GGUF',
+    filename='Qwen_Qwen3-0.6B-Q4_K_M.gguf',
+    local_dir='model',
+    cache_dir='model',
+    n_gpu_layers=-1,
+    verbose=True,
+    n_ctx=4096,
+)
+SHOW_THINKING = False