Upload Qwen2.5-14B-Instruct-1M GGUF model

Files changed (3) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.gguf filter=lfs diff=lfs merge=lfs -text

Qwen2.5-14B-Instruct-1M.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:00517c6fabea6f9f19bdf59af62f3884127c80f7e03bb78b5e96bf060d8e6eb4
+size 29547716384

README.md ADDED Viewed

+# Qwen2.5-14B-Instruct-1M-GGUF
+This is a quantized GGUF version of Qwen2.5-14B-Instruct-1M.
+Converted from Safetensors using mixed precision quantization.
+Optimized for efficient inference using llama.cpp or text-generation-webui.