Spaces:

declare-lab
/

JAM

Running on Zero

OrangeEye commited on Dec 3, 2024

Commit

1957ef6

1 Parent(s): 4d0d167

update

Files changed (3) hide show

app.py CHANGED Viewed

@@ -38,7 +38,7 @@ generate_kwargs = dict(
 llama_guard, llama_guard_tokenizer, UNSAFE_TOKEN_ID = load_llama_guard("meta-llama/Llama-Guard-3-1B")
 ## RAG MODEL
-RAG = RAGPretrainedModel.from_index("colbert/indexes/arxiv_colbert")
 try:
   gr.Info("Setting up retriever, please wait...")

 llama_guard, llama_guard_tokenizer, UNSAFE_TOKEN_ID = load_llama_guard("meta-llama/Llama-Guard-3-1B")
 ## RAG MODEL
+RAG = RAGPretrainedModel.from_index("colbert/indexes/arxiv_colbert", n_gpu=1)
 try:
   gr.Info("Setting up retriever, please wait...")

requirements.txt CHANGED Viewed

@@ -12,4 +12,5 @@ arxiv
 ragatouille
 hf_transfer
 colorlog
-accelerate==1.1.1

 ragatouille
 hf_transfer
 colorlog
+accelerate==1.1.1
+faiss-gpu

utils.py CHANGED Viewed

@@ -188,7 +188,7 @@ def moderate(chat, model, tokenizer, UNSAFE_TOKEN_ID):
     ######
     # Get generated text
     ######
-    logger.info(outputs)
     # Number of tokens that correspond to the input prompt
     input_length = inputs.input_ids.shape[1]
     # Ignore the tokens from the input to get the tokens generated by the model

     ######
     # Get generated text
     ######
+    # logger.info(outputs)
     # Number of tokens that correspond to the input prompt
     input_length = inputs.input_ids.shape[1]
     # Ignore the tokens from the input to get the tokens generated by the model