RedHatAI
/

Sparse-Llama-3.1-8B-tldr-2of4-FP8-dynamic

Text Generation

text-generation-inference

compressed-tensors

Model card Files Files and versions

Sparse-Llama-3.1-8B-tldr-2of4-FP8-dynamic

Ctrl+K

Ctrl+K

1 contributor

History: 5 commits

alexmarques's picture

Rename chart (3).png to inference_performance/latency.png

9c18b32 verified 4 days ago