ArenaRL - a Alibaba-NLP Collection

Alibaba-NLP 's Collections

ArenaRL

GVE

E2Rank

ERank

ArenaRL

updated 20 days ago

Scaling RL for Open-Ended Agents via Tournamentbased Relative Ranking

Alibaba-NLP/Open-Travel

Preview • Updated 17 days ago • 45
Alibaba-NLP/Open-DeepResearch

Preview • Updated 17 days ago • 69 • 2
ArenaRL: Scaling RL for Open-Ended Agents via Tournament-based Relative Ranking

Paper • 2601.06487 • Published 23 days ago • 52