Haoran Zhang's picture

Haoran Zhang

zzzhr97

·

AI & ML interests

Lange Language Models, Large Reasoning Models

Recent Activity

upvoted a paper 1 day ago

π-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

submitted a paper 1 day ago

π-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

authored a paper 2 days ago

$π$-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

View all activity

Organizations

Papers 3

arxiv:2605.14678

arxiv:2605.13301

arxiv:2509.14760

models 1

zzzhr97/TRM-8B

Text Classification • 8B • Updated Feb 10 • 11

datasets 4

zzzhr97/TRM-Preference

Updated Feb 10 • 5

zzzhr97/WebInstruct-Verified-Processed

Viewer • Updated Feb 10 • 233k • 6

zzzhr97/SpecBench

Viewer • Updated Oct 5, 2025 • 1.5k • 82 • 2

zzzhr97/TestDataset

Viewer • Updated Sep 11, 2025 • 15 • 14