STC-demo-v2_dev

Runtime error

fCola commited on May 21

Commit

ccd20ce

verified ·

1 Parent(s): 1677d8c

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ import gradio as gr
 from gradio.themes import Base
 from gradio.themes.utils import colors
-from transformers import pipeline, TextIteratorStreamer
 # Custom theme colors based on brand standards
@@ -433,7 +433,9 @@ paper_plane_svg = """<svg xmlns="http://www.w3.org/2000/svg" width="20" height="
 # Pipeline loading
-generator = pipeline("text-generation", model="openai-community/gpt2")
 # Mock data function for chatbot
 def send_message(message, history):
@@ -442,7 +444,6 @@ def send_message(message, history):
     #history.append({"role": "user", "content": message})
     #history.append({"role": "assistant", "content": f"This is a response about: {message}"})
     #return history
-    tokenizer = generator.tokenizer
     streamer = TextIteratorStreamer(tokenizer, skip_prompt=True)
     input_ids = tokenizer.encode(message, return_tensors="pt")
     gen_kwargs = {
@@ -455,7 +456,7 @@ def send_message(message, history):
         "repetition_penalty": 1.25,
     }
     partial = ""
-    thread = Thread(target=generator, kwargs=gen_kwargs)
     thread.start()
     #for token in generator(message, max_new_tokens=200):
     for t in streamer:

 from gradio.themes import Base
 from gradio.themes.utils import colors
+from transformers import pipeline, TextIteratorStreamer, AutoModelForCausalLM, AutoTokenizer
 # Custom theme colors based on brand standards
 # Pipeline loading
+#generator = pipeline("text-generation", model="openai-community/gpt2")
+tokenizer = AutoTokenizer("openai-community/gpt2")
+model = AutoModelForCausalLM("openai-community/gpt2")
 # Mock data function for chatbot
 def send_message(message, history):
     #history.append({"role": "user", "content": message})
     #history.append({"role": "assistant", "content": f"This is a response about: {message}"})
     #return history
     streamer = TextIteratorStreamer(tokenizer, skip_prompt=True)
     input_ids = tokenizer.encode(message, return_tensors="pt")
     gen_kwargs = {
         "repetition_penalty": 1.25,
     }
     partial = ""
+    thread = Thread(target=model.generate, kwargs=gen_kwargs)
     thread.start()
     #for token in generator(message, max_new_tokens=200):
     for t in streamer: