Spaces:

mmcgovern574
/

DigitalTwin-Mistral-Small-24B

Running on Zero

mmcgovern574 commited on Feb 8

Commit

2efcfde

verified ·

1 Parent(s): f693daa

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -129,8 +129,7 @@ try:
         MODEL_ID,
         device_map="auto",
         quantization_config=quantization_config,
-        torch_dtype=torch.bfloat16,
-        attn_implementation="flash_attention_2"  # Enable Flash Attention 2
     )
     # Apply Better Transformer optimization

         MODEL_ID,
         device_map="auto",
         quantization_config=quantization_config,
+        torch_dtype=torch.bfloat16
     )
     # Apply Better Transformer optimization