agent - a xlalex Collection

xlalex 's Collections

encoder

data

svg

video

ocr

3d

omni

infra

survey

RL

critic

speech full duplex

agent

agent

updated 11 days ago

Agent Learning via Early Experience

Paper • 2510.08558 • Published Oct 9 • 262
The Landscape of Agentic Reinforcement Learning for LLMs: A Survey

Paper • 2509.02547 • Published Sep 2 • 224
Scaling Agents via Continual Pre-training

Paper • 2509.13310 • Published Sep 16 • 115
Agent Lightning: Train ANY AI Agents with Reinforcement Learning

Paper • 2508.03680 • Published Aug 5 • 119
PokeeResearch: Effective Deep Research via Reinforcement Learning from AI Feedback and Robust Reasoning Scaffold

Paper • 2510.15862 • Published 29 days ago • 9
Interleaved Reasoning for Large Language Models via Reinforcement Learning

Paper • 2505.19640 • Published May 26 • 14