Dawn

LegendaryDawn

AI & ML interests

None yet

Recent Activity

updated a model 11 days ago

LegendaryDawn/self-debate-exp-Qwen2.3-3B-balance-diff_sol2048-n8-bs256-long8-DAPO-step200

published a model 11 days ago

LegendaryDawn/self-debate-exp-Qwen2.3-3B-balance-diff_sol2048-n8-bs256-long8-DAPO-step200

updated a model 12 days ago

LegendaryDawn/self-debate-exp-Qwen2.3-7B-grpo-diff_sol2048-n8-bs256-long8-DAPO-step200

View all activity

Organizations

None yet

updated a model 11 days ago

LegendaryDawn/self-debate-exp-Qwen2.3-3B-balance-diff_sol2048-n8-bs256-long8-DAPO-step200

3B • Updated 11 days ago • 10

published a model 11 days ago

LegendaryDawn/self-debate-exp-Qwen2.3-3B-balance-diff_sol2048-n8-bs256-long8-DAPO-step200

3B • Updated 11 days ago • 10

updated a model 12 days ago

LegendaryDawn/self-debate-exp-Qwen2.3-7B-grpo-diff_sol2048-n8-bs256-long8-DAPO-step200

8B • Updated 12 days ago • 5

published a model 12 days ago

LegendaryDawn/self-debate-exp-Qwen2.3-7B-grpo-diff_sol2048-n8-bs256-long8-DAPO-step200

8B • Updated 12 days ago • 5

updated a model 12 days ago

LegendaryDawn/self-debate-baseline-DAPO-Qwen2.5-7B-n8-bs256-long8-step200

8B • Updated 12 days ago • 6

published a model 12 days ago

LegendaryDawn/self-debate-baseline-DAPO-Qwen2.5-7B-n8-bs256-long8-step200

8B • Updated 12 days ago • 6

updated a model 14 days ago

LegendaryDawn/mbpo-iclr-Qwen2_vl_7b_instruct-R_multiyn1-lr5e-7-beta01-Rmmseed-GPT4o-adv-multiyn-12k

8B • Updated 14 days ago • 11

published a model 14 days ago

LegendaryDawn/mbpo-iclr-Qwen2_vl_7b_instruct-R_multiyn1-lr5e-7-beta01-Rmmseed-GPT4o-adv-multiyn-12k

8B • Updated 14 days ago • 11

updated a model 14 days ago

LegendaryDawn/mbpo-iclr-Qwen2_5_vl_7b_instruct-R_multiyn1-beta02-lr2e-7-mixed-10-8-64-12k

8B • Updated 14 days ago • 9

published a model 14 days ago

LegendaryDawn/mbpo-iclr-Qwen2_5_vl_7b_instruct-R_multiyn1-beta02-lr2e-7-mixed-10-8-64-12k

8B • Updated 14 days ago • 9

updated a model 16 days ago

LegendaryDawn/self-debate-exp-Qwen2.3-3B-grpo-diff_sol2048-n8-bs256-long8-DAPO-step200

3B • Updated 16 days ago • 38

published a model 16 days ago

LegendaryDawn/self-debate-exp-Qwen2.3-3B-grpo-diff_sol2048-n8-bs256-long8-DAPO-step200

3B • Updated 16 days ago • 38

updated a model 22 days ago

LegendaryDawn/self-debate-baseline-DAPO-Qwen2.5-3B-Instruct-n8-bs256-long8-step200

3B • Updated 22 days ago • 14

published a model 22 days ago

LegendaryDawn/self-debate-baseline-DAPO-Qwen2.5-3B-Instruct-n8-bs256-long8-step200

3B • Updated 22 days ago • 14

updated a model 22 days ago

LegendaryDawn/self-debate-exp-Qwen2.5-3B-diff_sol2048-overall_debate_grpo_loss-n8-bs256-long8-DAPO-step200

3B • Updated 22 days ago • 11

published a model 22 days ago

LegendaryDawn/self-debate-exp-Qwen2.5-3B-diff_sol2048-overall_debate_grpo_loss-n8-bs256-long8-DAPO-step200

3B • Updated 22 days ago • 11

updated a model 22 days ago

LegendaryDawn/self-debate-baseline-dapo-Qwen2.5-3b-n8-bs256-long8-step200

3B • Updated 22 days ago • 37

published a model 22 days ago

LegendaryDawn/self-debate-baseline-dapo-Qwen2.5-3b-n8-bs256-long8-step200

3B • Updated 22 days ago • 37

upvoted a paper 29 days ago

Explore Data Left Behind in Reinforcement Learning for Reasoning Language Models

Paper • 2511.04800 • Published Nov 6 • 1

updated a model about 1 month ago

LegendaryDawn/erpo-iclr-rebuttal-llama3.2-3B-Instruct-baseline-dapo-step180-step180

4B • Updated Nov 21 • 3

Dawn

AI & ML interests

Recent Activity

Organizations

LegendaryDawn's activity