ReasoningEval
/

Qwen2.5-7B-Huatuo-difficulty-SFT-RL

Model card Files Files and versions Community

Chtholly17 commited on Mar 20

Commit

589000f

·

verified ·

1 Parent(s): d47e342

Update README.md

Files changed (1) hide show

README.md +12 -3

README.md CHANGED Viewed

@@ -1,3 +1,12 @@
----
-license: apache-2.0
----

+---
+license: apache-2.0
+---
+### Qwen2.5-7B-Huatuo-difficulty-SFT
+- Base Model: [Qwen/Qwen2.5-7B](https://huggingface.co/Qwen/Qwen2.5-7B)
+- Training Epoches: 3
+- Training Objective: SFT + RL
+- Training Data:
+  - SFT Data: [ReasoningEval/Huatuo-SFT-difficulty](https://huggingface.co/datasets/ReasoningEval/Huatuo-SFT-difficulty)
+  - RL Data: [ReasoningEval/Huatuo-RL](https://huggingface.co/datasets/ReasoningEval/Huatuo-RL)