liyaxuan's picture

5

liyaxuan

lllyx

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 15 hours ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

upvoted a paper 18 days ago

Pre-training Distillation for Large Language Models: A Design Space Exploration

upvoted a paper 3 months ago

A Survey of Reinforcement Learning for Large Reasoning Models

View all activity

Organizations

None yet

lllyx 's datasets

None public yet