Spaces:

mmcgovern574
/

Mistral-Small-24B-Instruct-2501

Sleeping

mmcgovern574 commited on Feb 8

Commit

4132710

verified ·

1 Parent(s): e35b74a

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -85,7 +85,6 @@ model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
     device_map="auto",
     quantization_config=quantization_config,
-    attn_implementation="flash_attention_2",  # Updated Flash Attention 2 parameter
     torch_dtype=torch.bfloat16
 )

     MODEL_ID,
     device_map="auto",
     quantization_config=quantization_config,
     torch_dtype=torch.bfloat16
 )