JackMa's picture

5

JackMa

JacckMa

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

Heterogeneous Agent Collaborative Reinforcement Learning

upvoted a paper about 1 month ago

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

upvoted a paper about 2 months ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

View all activity

Organizations

None yet

upvoted 2 papers about 1 month ago

Heterogeneous Agent Collaborative Reinforcement Learning

Paper • 2603.02604 • Published Mar 3 • 193

Does Your Reasoning Model Implicitly Know When to Stop Thinking?

Paper • 2602.08354 • Published Feb 9 • 262

upvoted a paper about 2 months ago

Weak-Driven Learning: How Weak Agents make Strong Agents Stronger

Paper • 2602.08222 • Published Feb 9 • 288

upvoted a paper 3 months ago

Your Group-Relative Advantage Is Biased

Paper • 2601.08521 • Published Jan 13 • 158

upvoted an article about 1 year ago

Article

Illustrating Reinforcement Learning from Human Feedback (RLHF)

+2

Dec 9, 2022

•

407