J C's picture

J C

dark-pen

·

AI & ML interests

None yet

Recent Activity

liked a dataset about 3 hours ago

Puzer/github-repo-embeddings

liked a dataset about 3 hours ago

ibragim-bad/github-repos-metadata-40M

upvoted a collection about 7 hours ago

Reasoning Papers

View all activity

Organizations

liked 2 datasets about 3 hours ago

Puzer/github-repo-embeddings

Viewer • Updated 17 days ago • 9.2M • 35 • 3

ibragim-bad/github-repos-metadata-40M

Viewer • Updated about 6 hours ago • 41.1M • 119 • 18

upvoted a collection about 7 hours ago

Reasoning Papers

44 items • Updated 3 days ago • 7

upvoted 2 papers about 7 hours ago

Supervised Reinforcement Learning: From Expert Trajectories to Step-wise Reasoning

Paper • 2510.25992 • Published Oct 29, 2025 • 47

Masked-and-Reordered Self-Supervision for Reinforcement Learning from Verifiable Rewards

Paper • 2511.17473 • Published Nov 21, 2025 • 2

liked a model about 7 hours ago

GSAI-ML/ESPO-Code

8B • Updated Nov 28, 2025 • 4 • 1

upvoted a collection about 7 hours ago

ESPO

5 items • Updated Nov 28, 2025 • 1

upvoted a paper about 7 hours ago

Beyond Token-level Supervision: Unlocking the Potential of Decoding-based Regression via Reinforcement Learning

Paper • 2512.06533 • Published Dec 6, 2025 • 7

liked 3 models about 7 hours ago

openbmb/VoxCPM1.5

Text-to-Speech • Updated 4 days ago • 3.56k • 293

PRIME-RL/P1-235B-A22B

Text Generation • 235B • Updated Oct 24, 2025 • 7 • 19

PRIME-RL/P1-30B-A3B

Text Generation • 31B • Updated Oct 24, 2025 • 25 • 10

liked a dataset about 8 hours ago

infly/Infinity-Doc-400K

Viewer • Updated Nov 25, 2025 • 387k • 1.19k • 16

upvoted a collection about 8 hours ago

Infinity-Parser

Reinforcement Learning Document Parser and High-Quality Synthetic Dataset. • 4 items • Updated Oct 27, 2025 • 1

liked a model about 13 hours ago

mradermacher/Nemotron-Cascade-8B-Thinking-Claude-4.5-Opus-High-Reasoning-Distill-GGUF

8B • Updated Dec 18, 2025 • 373 • 1

liked a dataset about 13 hours ago

nvidia/Nemotron-RL-agent-workplace_assistant

Viewer • Updated 6 days ago • 1.8k • 212 • 13

upvoted a collection about 13 hours ago

NeMo Gym

Collection of RL verifiable data for NeMo Gym • 13 items • Updated 2 days ago • 36

liked 3 datasets about 13 hours ago

nvidia/Nemotron-RL-knowledge-web_search-mcqa

Viewer • Updated 6 days ago • 2.93k • 240 • 8

Junyi42/gym

Updated Nov 29, 2025 • 1

Junyi42/visgym_data

Preview • Updated 13 days ago • 1.54k • 1

liked a dataset about 14 hours ago

sylviali/EDEN_ASR_Data

Viewer • Updated Dec 2, 2024 • 3.08k • 4 • 2