Spaces:

samith-a
/

Django-code-model

Sleeping

samith-a commited on Jun 5

Commit

e04c892

verified ·

1 Parent(s): 97f330a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -29,7 +29,7 @@ class ModelManager:
         if HAS_UNSLOTH and self.device != "cpu":
             # GPU via Unsloth + LoRA
             backbone, tokenizer = FastLanguageModel.from_pretrained(
-                "HuggingFaceTB/SmolLM2-1.7B-Instruct",
                 load_in_4bit=True,
                 dtype=torch.float16,
                 device_map="auto",
@@ -50,7 +50,7 @@ class ModelManager:
         # --- Fallback: CPU-only via HF Transformers + PEFT ---
         print("Falling back to CPU-only Transformers + PEFT")
-        base_name = "HuggingFaceTB/SmolLM2-1.7B-Instruct"  # non-4bit to run on CPU
         tokenizer = AutoTokenizer.from_pretrained(base_name, use_fast=True)
         base = AutoModelForCausalLM.from_pretrained(
             base_name,

         if HAS_UNSLOTH and self.device != "cpu":
             # GPU via Unsloth + LoRA
             backbone, tokenizer = FastLanguageModel.from_pretrained(
+                "Qwen/Qwen2.5-Coder-1.5B-Instruct",
                 load_in_4bit=True,
                 dtype=torch.float16,
                 device_map="auto",
         # --- Fallback: CPU-only via HF Transformers + PEFT ---
         print("Falling back to CPU-only Transformers + PEFT")
+        base_name = "Qwen/Qwen2.5-Coder-1.5B-Instruct"  # non-4bit to run on CPU
         tokenizer = AutoTokenizer.from_pretrained(base_name, use_fast=True)
         base = AutoModelForCausalLM.from_pretrained(
             base_name,