RL - Reinforcement Learning - a ljupco Collection

ljupco 's Collections

RL - Reinforcement Learning

agents

context, prompt

speed efficiency gains

RL - Reinforcement Learning

updated 16 days ago

QeRL: Beyond Efficiency -- Quantization-enhanced Reinforcement Learning for LLMs

Paper • 2510.11696 • Published 22 days ago • 172
Demystifying Reinforcement Learning in Agentic Reasoning

Paper • 2510.11701 • Published 22 days ago • 31