Hongxu Yin's picture

Hongxu Yin

yinhongxu

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

authored a paper about 2 months ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

authored a paper 3 months ago

CLIMB: CLustering-based Iterative Data Mixture Bootstrapping for Language Model Pre-training

View all activity

Organizations

yinhongxu 's datasets

None public yet