meta-llama
/

Llama-Guard-3-8B-INT8

Text Generation

text-generation-inference

8-bit precision

Model card Files Files and versions

Resources

View closed (6)

All responses come back as "!!!!!..." repeated like 100 times

#10 opened about 1 year ago by

I Found Inference Speed for INT8 Quantized Model is Slower Than Non-Quantized Version

#9 opened over 1 year ago by

Access request FAQ

#8 opened over 1 year ago by

Anyone able to run this on vLLM ?

#7 opened over 1 year ago by