Ximing Lu's picture

5 8

Ximing Lu

Ximing

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 days ago

Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

submitted a paper 2 days ago

Golden Goose: A Simple Trick to Synthesize Unlimited RLVR Tasks from Unverifiable Internet Text

authored a paper 26 days ago

GDPO: Group reward-Decoupled Normalization Policy Optimization for Multi-reward RL Optimization

View all activity

Organizations

Ximing 's datasets

None public yet