Spaces:

responsible-prompting
/

demo-multiturn

Running

App Files Files Community

ashwath-vaithina-ibm commited on Jun 23

Commit

2b1ac28

verified ·

1 Parent(s): f40280b

Update app.py

Browse files

Files changed (1) hide show

app.py +10 -35

app.py CHANGED Viewed

@@ -30,7 +30,7 @@ from flask import Flask, request, jsonify
 from flask_cors import CORS, cross_origin
 from flask_restful import Resource, Api, reqparse
 import control.recommendation_handler as recommendation_handler
-from helpers import get_credentials, authenticate_api, save_model
 import config as cfg
 import requests
 import logging
@@ -61,18 +61,17 @@ FRONT_LOG_FILE = 'front_log.json'
 def index():
     user_ip = request.remote_addr
     logger.info(f'USER {user_ip} - ID {id} - started the app')
-    return app.send_static_file('demo/index.html')
 @app.route("/recommend", methods=['GET'])
 @cross_origin()
 def recommend():
     user_ip = request.remote_addr
-    hf_token, hf_url = get_credentials.get_credentials()
     api_url, headers = authenticate_api.authenticate_api(hf_token, hf_url)
     prompt_json = recommendation_handler.populate_json()
     args = request.args
     prompt = args.get("prompt")
-    print(prompt)
     recommendation_json = recommendation_handler.recommend_prompt(prompt, prompt_json,
                                                                   api_url, headers)
     logger.info(f'USER - {user_ip} - ID {id} - accessed recommend route')
@@ -82,7 +81,7 @@ def recommend():
 @app.route("/get_thresholds", methods=['GET'])
 @cross_origin()
 def get_thresholds():
-    hf_token, hf_url = get_credentials.get_credentials()
     api_url, headers = authenticate_api.authenticate_api(hf_token, hf_url)
     prompt_json = recommendation_handler.populate_json()
     model_id = 'sentence-transformers/all-minilm-l6-v2'
@@ -129,49 +128,25 @@ def log():
 def demo_inference():
     args = request.args
-    model_id = args.get('model_id', default="meta-llama/Llama-4-Scout-17B-16E-Instruct")
     temperature = args.get('temperature', default=0.5)
     max_new_tokens = args.get('max_new_tokens', default=1000)
-    hf_token, _ = get_credentials.get_credentials()
     prompt = args.get('prompt')
-    API_URL = "https://router.huggingface.co/together/v1/chat/completions"
-    headers = {
-        "Authorization": f"Bearer {hf_token}",
-    }
-    response = requests.post(
-        API_URL,
-        headers=headers,
-        json={
-            "messages": [
-                {
-                    "role": "user",
-                    "content": [
-                        {
-                            "type": "text",
-                            "text": prompt
-                        },
-                    ]
-                }
-            ],
-            "model": model_id,
-            'temperature': temperature,
-            'max_new_tokens': max_new_tokens,
-        }
-    )
     try:
-        response = response.json()["choices"][0]["message"]
         response.update({
             'model_id': model_id,
             'temperature': temperature,
             'max_new_tokens': max_new_tokens,
         })
         return response
     except:
-        return response.text, response.status_code
 if __name__=='__main__':
     debug_mode = os.getenv('FLASK_DEBUG', 'True').lower() in ['true', '1', 't']

 from flask_cors import CORS, cross_origin
 from flask_restful import Resource, Api, reqparse
 import control.recommendation_handler as recommendation_handler
+from helpers import get_credentials, authenticate_api, save_model, inference
 import config as cfg
 import requests
 import logging
 def index():
     user_ip = request.remote_addr
     logger.info(f'USER {user_ip} - ID {id} - started the app')
+    return "Ready!"
 @app.route("/recommend", methods=['GET'])
 @cross_origin()
 def recommend():
     user_ip = request.remote_addr
+    hf_token, hf_url = get_credentials.get_hf_credentials()
     api_url, headers = authenticate_api.authenticate_api(hf_token, hf_url)
     prompt_json = recommendation_handler.populate_json()
     args = request.args
     prompt = args.get("prompt")
     recommendation_json = recommendation_handler.recommend_prompt(prompt, prompt_json,
                                                                   api_url, headers)
     logger.info(f'USER - {user_ip} - ID {id} - accessed recommend route')
 @app.route("/get_thresholds", methods=['GET'])
 @cross_origin()
 def get_thresholds():
+    hf_token, hf_url = get_credentials.get_hf_credentials()
     api_url, headers = authenticate_api.authenticate_api(hf_token, hf_url)
     prompt_json = recommendation_handler.populate_json()
     model_id = 'sentence-transformers/all-minilm-l6-v2'
 def demo_inference():
     args = request.args
+    inference_provider = args.get('inference_provider', default='replicate')
+    model_id = args.get('model_id', default="ibm-granite/granite-3.3-8b-instruct")
     temperature = args.get('temperature', default=0.5)
     max_new_tokens = args.get('max_new_tokens', default=1000)
     prompt = args.get('prompt')
     try:
+        response = inference.INFERENCE_HANDLER[inference_provider](prompt, model_id, temperature, max_new_tokens)
         response.update({
+            'inference_provider': inference_provider,
             'model_id': model_id,
             'temperature': temperature,
             'max_new_tokens': max_new_tokens,
         })
         return response
     except:
+        return "Model Inference failed.", 500
 if __name__=='__main__':
     debug_mode = os.getenv('FLASK_DEBUG', 'True').lower() in ['true', '1', 't']