Kai Yang's picture

1 2 2

Kai Yang

yangkaiSIGS

·

https://yk7333.github.io/

yk7333

AI & ML interests

None yet

Recent Activity

authored a paper 9 days ago

Thinking-Free Policy Initialization Makes Distilled Reasoning Models More Effective and Efficient Reasoners

authored a paper 9 days ago

EntroPIC: Towards Stable Long-Term Training of LLMs via Entropy Stabilization with Proportional-Integral Control

updated a Space 9 days ago

yangkaiSIGS/entropic

View all activity

Organizations

Papers 10

arxiv:2511.15248

arxiv:2509.26226

arxiv:2505.11044

arxiv:2412.15517

spaces 1

Entropic

Display experimental results of EntroPIC for LLM training

models 0

None public yet

datasets 1

yangkaiSIGS/d3po_datasets

Viewer • Updated Mar 19, 2024 • 1.2k • 18 • 5