Dongfu Jiang's picture

Dongfu Jiang

DongfuJiang

·

https://jdf-prog.github.io/

AI & ML interests

Large Language Model, Modality Reasoning and their evaluation

Recent Activity

upvoted a paper 1 day ago

ClawBench: Can AI Agents Complete Everyday Online Tasks?

upvoted a paper 4 days ago

Watch Before You Answer: Learning from Visually Grounded Post-Training

upvoted a paper 9 days ago

ImagenWorld: Stress-Testing Image Generation Models with Explainable Human Evaluation on Open-ended Real-World Tasks

View all activity

Organizations

upvoted a paper 1 day ago

ClawBench: Can AI Agents Complete Everyday Online Tasks?

Paper • 2604.08523 • Published 4 days ago • 210

upvoted a paper 4 days ago

Watch Before You Answer: Learning from Visually Grounded Post-Training

Paper • 2604.05117 • Published 7 days ago • 32

upvoted a paper 9 days ago

ImagenWorld: Stress-Testing Image Generation Models with Explainable Human Evaluation on Open-ended Real-World Tasks

Paper • 2603.27862 • Published 14 days ago • 30

authored 3 papers 18 days ago

EvolveCoder: Evolving Test Cases via Adversarial Verification for Code Reinforcement Learning

Paper • 2603.12698 • Published about 1 month ago • 1

Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation

Paper • 2603.19220 • Published 24 days ago • 66

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Paper • 2603.20278 • Published 26 days ago • 94

upvoted a paper 19 days ago

OpenResearcher: A Fully Open Pipeline for Long-Horizon Deep Research Trajectory Synthesis

Paper • 2603.20278 • Published 26 days ago • 94

New activity in nvidia/Nemotron-Cascade-2-30B-A3B 20 days ago

Add documentation on how to use with vLLM to README.md

#7 opened 21 days ago by

liked a model 23 days ago

nvidia/Nemotron-Cascade-2-30B-A3B

Text Generation • 32B • Updated 3 days ago • 280k • 470

upvoted a paper 23 days ago

Nemotron-Cascade 2: Post-Training LLMs with Cascade RL and Multi-Domain On-Policy Distillation

Paper • 2603.19220 • Published 24 days ago • 66

upvoted a paper 26 days ago

Attention Residuals

Paper • 2603.15031 • Published 27 days ago • 179

liked a dataset 29 days ago

stepfun-ai/Step-3.5-Flash-SFT

Viewer • Updated 29 days ago • 1.62M • 61.7k • 313

liked a model about 1 month ago

nvidia/NVIDIA-Nemotron-3-Super-120B-A12B-BF16

Text Generation • 124B • Updated 1 day ago • 463k • 326

upvoted a paper about 1 month ago

VisPhyWorld: Probing Physical Reasoning via Code-Driven Video Reconstruction

Paper • 2602.13294 • Published Feb 9 • 13

liked 2 models about 2 months ago

Qwen/Qwen3.5-397B-A17B

Image-Text-to-Text • 403B • Updated 28 days ago • 807k • • 1.43k

Qwen/Qwen3.5-35B-A3B

Image-Text-to-Text • 36B • Updated Feb 27 • 3.56M • • 1.36k

liked a dataset about 2 months ago

OpenResearcher/OpenResearcher-Dataset

Viewer • Updated 18 days ago • 97.6k • 6.04k • 119

liked 2 models 2 months ago

moonshotai/Kimi-K2.5

Image-Text-to-Text • 1.1T • Updated Feb 27 • 5.95M • • 2.45k

stepfun-ai/Step-3.5-Flash

Text Generation • 199B • Updated 26 days ago • 127k • • 771

updated a model 2 months ago

DongfuJiang/nano_v3_search_incorrect_only_347_steps

32B • Updated Jan 28