Spaces:

samith-a
/

Django-code-model

Runtime error

samith-a commited on Aug 4

Commit

ea721a6

1 Parent(s): 5db110f

try model unsloth/Llama-3.2-1B-bnb-4bit

Files changed (1) hide show

app.py CHANGED Viewed

@@ -29,7 +29,7 @@ class ModelManager:
         if HAS_UNSLOTH and self.device != "cpu":
             # GPU via Unsloth + LoRA
             backbone, tokenizer = FastLanguageModel.from_pretrained(
-                "unsloth/Llama-3.2-1B-Instruct-bnb-4bit",
                 load_in_4bit=True,
                 dtype=torch.float16,
                 device_map="auto",
@@ -50,7 +50,7 @@ class ModelManager:
         # --- Fallback: CPU-only via HF Transformers + PEFT ---
         print("Falling back to CPU-only Transformers + PEFT")
-        base_name = "unsloth/Llama-3.2-1B-Instruct"  # non-4bit to run on CPU
         tokenizer = AutoTokenizer.from_pretrained(base_name, use_fast=True)
         base = AutoModelForCausalLM.from_pretrained(
             base_name,

         if HAS_UNSLOTH and self.device != "cpu":
             # GPU via Unsloth + LoRA
             backbone, tokenizer = FastLanguageModel.from_pretrained(
+                "unsloth/Llama-3.2-1B-bnb-4bit",
                 load_in_4bit=True,
                 dtype=torch.float16,
                 device_map="auto",
         # --- Fallback: CPU-only via HF Transformers + PEFT ---
         print("Falling back to CPU-only Transformers + PEFT")
+        base_name = "unsloth/Llama-3.2-1B"  # non-4bit to run on CPU
         tokenizer = AutoTokenizer.from_pretrained(base_name, use_fast=True)
         base = AutoModelForCausalLM.from_pretrained(
             base_name,