Reasoning - a Indramal Collection

Indramal 's Collections

Agent

Video Diffusion

Reinforcement Learning

Reasoning

updated 19 days ago

Reasoning with Sampling: Your Base Model is Smarter Than You Think

Paper • 2510.14901 • Published about 1 month ago • 47
VideoReasonBench: Can MLLMs Perform Vision-Centric Complex Video Reasoning?

Paper • 2505.23359 • Published May 29 • 39
OThink-R1: Intrinsic Fast/Slow Thinking Mode Switching for Over-Reasoning Mitigation

Paper • 2506.02397 • Published Jun 3 • 35
ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models

Paper • 2505.24864 • Published May 30 • 141
How much do language models memorize?

Paper • 2505.24832 • Published May 30 • 4
GRIT: Teaching MLLMs to Think with Images

Paper • 2505.15879 • Published May 21 • 12
Reward Reasoning Model

Paper • 2505.14674 • Published May 20 • 37
VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning

Paper • 2507.13348 • Published Jul 17 • 75
Why Language Models Hallucinate

Paper • 2509.04664 • Published Sep 4 • 191
Visual Diffusion Models are Geometric Solvers

Paper • 2510.21697 • Published 22 days ago • 18
Less is More: Recursive Reasoning with Tiny Networks

Paper • 2510.04871 • Published Oct 6 • 475