Spaces:

nikravan
/

GLM4_0414

Running on Zero

nikravan commited on Apr 14

Commit

f4c4266

verified ·

1 Parent(s): 0cd51ce

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -29,14 +29,19 @@ def respond(
     from transformers import AutoModelForCausalLM, AutoTokenizer
-    MODEL_PATH = "THUDM/GLM-4-Z1-32B-0414"
-    tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
-    model = AutoModelForCausalLM.from_pretrained(MODEL_PATH, device_map="auto")
-    message = [{"role": "user", "content": "Let a, b be positive real numbers such that ab = a + b + 3. Determine the range of possible values for a + b."}]
-.device)
 generate_kwargs = {
     "input_ids": inputs["input_ids"],
@@ -46,7 +51,8 @@ generate_kwargs = {
 }
 out = model.generate(**generate_kwargs)
 print(tokenizer.decode(out[0][inputs["input_ids"].shape[1]:], skip_special_tokens=True))
     for message in client.chat_completion(
         messages,
         max_tokens=max_tokens,

     from transformers import AutoModelForCausalLM, AutoTokenizer
+MODEL_PATH = "THUDM/GLM-4-Z1-32B-0414"
+tokenizer = AutoTokenizer.from_pretrained(MODEL_PATH)
+model = AutoModelForCausalLM.from_pretrained(MODEL_PATH, device_map="auto")
+message = [{"role": "user", "content": "Let a, b be positive real numbers such that ab = a + b + 3. Determine the range of possible values for a + b."}]
+inputs = tokenizer.apply_chat_template(
+    message,
+    return_tensors="pt",
+    add_generation_prompt=True,
+    return_dict=True,
+).to(model.device)
 generate_kwargs = {
     "input_ids": inputs["input_ids"],
 }
 out = model.generate(**generate_kwargs)
 print(tokenizer.decode(out[0][inputs["input_ids"].shape[1]:], skip_special_tokens=True))
     for message in client.chat_completion(
         messages,
         max_tokens=max_tokens,