new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Jun 24

Submitted by

taesiri

Qwen-AgentWorld: Language World Models for General Agents

Qwen

Submitted by

iseesaw

NatureBench: Can Coding Agents Match the Published SOTA of Nature-Family Papers?

FrontisAI

Submitted by

lgy0404

MobileForge: Annotation-Free Adaptation for Mobile GUI Agents with Hierarchical Feedback-Guided Policy Optimization

kwaiAI

Submitted by

lgy0404

MemGUI-Agent: An End-to-End Long-Horizon Mobile GUI Agent with Proactive Context Management

kwaiAI

Submitted by

taesiri

OpenThoughts-Agent: Data Recipes for Agentic Models

·
50 authors

Submitted by

ZhaoShanhui

AOHP: An Open-Source OS-Level Agent Harness for Personalized, Efficient and Secure Interaction

THU-AIR

AIR, Tsinghua University

Submitted by

XuShihao6715

LingxiDiagBench: A Multi-Agent Framework for Benchmarking LLMs in Chinese Psychiatric Consultation and Diagnosis

Lyncia

Submitted by

okupyn

FLAT: Feedforward Latent Triangle Splatting for Geometrically Accurate Scene Generation

google

Submitted by

omer11a

Semantic Browsing: Controllable Diversity for Image Generation

·
5 authors

Submitted by

mingkaid

Critique of Agent Model

sailing-lab

SAILING Lab (CMU & MBZUAI)

Submitted by

Yunqiu

FedOT: Ownership Verification and Leakage Tracing via Watermarks for Federated LDMs

·
4 authors

1

Submitted by

zhushiding

Escaping the Self-Confirmation Trap: An Execute-Distill-Verify Paradigm for Agentic Experience Learning

zju-community

Zhejiang University

Submitted by

Andrew613

Are Text-to-Image Models Inductivist Turkeys? A Counterfactual Benchmark for Causal Reasoning

·
11 authors

Submitted by

taesiri

DiffusionBench: On Holistic Evaluation of Diffusion Transformers

·
8 authors

Submitted by

yixuantt

DREAM: Dense Retrieval Embeddings via Autoregressive Modeling

·
2 authors

Submitted by

DDAI-D

Holistic Data Scheduler for LLM Pre-training via Multi-Objective Reinforcement Learning

opendatalab

Submitted by

tangmen

VeriEvol: Scaling Multimodal Mathematical Reasoning via Verifiable Evol-Instruct

Tencent-Hunyuan

Tencent Hunyuan

Submitted by

DDAI-D

ReMMD: Realistic Multilingual Multi-Image Agentic Verification for Multimodal Misinformation Detection

opendatalab

Submitted by

MonteXiaofeng

ChartWalker: Benchmarking the Cross-Chart RAG Task

BAAI

Beijing Academy of Artificial Intelligence

Submitted by

Snarcy

QG-MIL: A Gated Transformer Aggregator for Domain-Agnostic Multiple Instance Learning in Medical Imaging

·
7 authors

Submitted by

zhenwang9102

MEMPROBE: Probing Long-Term Agent Memory via Hidden User-State Recovery

UCSanDiego

University of California at San Diego

Submitted by

lixirui142

FlowR2A: Learning Reward-to-Action Distribution for Multimodal Driving Planning

·
7 authors

Submitted by

taesiri

World Value Models for Robotic Manipulation

ByteDance-Seed

Submitted by

ganlinyang

EventVLA: Event-Driven Visual Evidence Memory for Long-Horizon Vision-Language-Action Policies

Submitted by

maggi3wang

InSight: Self-Guided Skill Acquisition via Steerable VLAs

StanfordUniversity

Stanford University

Submitted by

KYLN24

AGORA: An Archive-Grounded Benchmark for Agentic Workplace Document Reasoning

·
10 authors

Submitted by

taesiri

FLUX3D: High-Fidelity 3D Gaussian Generation with Diffusion-Aligned Sparse Representation

ByteDance

Submitted by

BatofGo

Multi4D: High-Fidelity Dynamic Gaussian Splatting via Multi-Level Competitive Allocation

·
4 authors

Submitted by

zhushiding

An Efficient Method for the Optimal Control of Microgrids Under Uncertainties using Local Reduction

zju-community

Zhejiang University