wang binghai's picture

2 1

wang binghai

refrain-wbh

·

refrain-wbh

AI & ML interests

None yet

Recent Activity

liked a dataset 4 days ago

Qwen/RationaleRM

updated a dataset 4 days ago

Qwen/RationaleRM

upvoted a paper 7 months ago

Group Sequence Policy Optimization

View all activity

Organizations

Papers 4

arxiv:2505.10527

arxiv:2410.09893

arxiv:2401.06080

arxiv:2307.04964

models 1

refrain-wbh/emnlp-hh-rlhf

Updated Jun 29, 2024

datasets 0

None public yet