DNA-R1 - a dnotitia Collection

dnotitia 's Collections

4B SFT Experiments

Private Datasets (SFT - 2511)

Private Datasets (DPO - 2511)

Qwen3-ChatTemplate

Smoothie Qwen2.5

Private Datasets (DNA 2.0)

Private Datasets (DNA 2.0 Evaluation)

Private Datasets (Qwen3 Korean)

Private Datasets (SFT)

Private Datasets (CoT)

Private Datasets (Only Answer)

Private Datasets (MATH)

Private Datasets (Reasoning, ko)

Private Datasets (Reasoning, en)

Private Datasets (CPT)

Private Datasets (DPO)

Private Datasets (Coding)

Private Datasets (RL, GRPO)

Private Datasets (Smoothie Qwen)

DNA-R1

updated Jan 26

Reasoning model distilled from DeepSeek-R1, enhanced with GRPO using supplementary reasoning datasets.

dnotitia/DNA-R1

Text Generation • Updated Mar 11, 2025 • 123 • 41