jadohu
/

Qwen3-8B-MASA

Reinforcement Learning

Model card Files Files and versions

README.md exists but content is empty.

Downloads last month: 11

Safetensors

Model size

8B params

Tensor type

BF16

·

Video Preview

Reinforcement Learning

loading

Model tree for jadohu/Qwen3-8B-MASA

Base model

Qwen/Qwen3-8B-Base

Finetuned

(254)

this model

Quantizations

1 model

Dataset used to train jadohu/Qwen3-8B-MASA

Collection including jadohu/Qwen3-8B-MASA

MASA

Meta-Awareness Enhances Reasoning Models: Self-Alignment Reinforcement Learning • 5 items • Updated 7 days ago • 1