Spaces:

shrish191
/

sentiment-classifier-ui

Running

shrish191 commited on 18 days ago

Commit

80c934d

verified ·

1 Parent(s): 105f551

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -717,11 +717,14 @@ tokenizer = AutoTokenizer.from_pretrained(main_model_name)
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model.to(device)
-# Load fallback multilingual model
-multi_model_name = "nlptown/bert-base-multilingual-uncased-sentiment"
 multi_tokenizer = AutoTokenizer.from_pretrained(multi_model_name)
 multi_model = AutoModelForSequenceClassification.from_pretrained(multi_model_name).to(device)
 # Reddit API setup
 reddit = praw.Reddit(
     client_id=os.getenv("REDDIT_CLIENT_ID"),
@@ -741,14 +744,7 @@ def multilingual_classifier(text):
     with torch.no_grad():
         output = multi_model(**encoded_input)
     scores = softmax(output.logits.cpu().numpy()[0])
-    stars = np.argmax(scores) + 1
-    if stars in [1, 2]:
-        return "Prediction: Negative"
-    elif stars == 3:
-        return "Prediction: Neutral"
-    else:
-        return "Prediction: Positive"
 def clean_ocr_text(text):
     text = text.strip()
@@ -867,6 +863,13 @@ demo.launch()

 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 model.to(device)
+# Load fallback multilingual model (direct sentiment labels)
+multi_model_name = "cardiffnlp/twitter-xlm-roberta-base-sentiment"
 multi_tokenizer = AutoTokenizer.from_pretrained(multi_model_name)
 multi_model = AutoModelForSequenceClassification.from_pretrained(multi_model_name).to(device)
+# Labels for multilingual model
+multi_labels = ['Negative', 'Neutral', 'Positive']
 # Reddit API setup
 reddit = praw.Reddit(
     client_id=os.getenv("REDDIT_CLIENT_ID"),
     with torch.no_grad():
         output = multi_model(**encoded_input)
     scores = softmax(output.logits.cpu().numpy()[0])
+    return f"Prediction: {multi_labels[np.argmax(scores)]}"
 def clean_ocr_text(text):
     text = text.strip()