jadohu
/

Qwen3-8B-GRPO

Reinforcement Learning

Model card Files Files and versions

Qwen3-8B-GRPO / generation_config.json

jadohu's picture

Upload folder using huggingface_hub

ae894a9 verified 13 days ago

history blame contribute delete

121 Bytes

	{
	"_from_model_config": true,
	"eos_token_id": 151643,
	"pad_token_id": 151643,
	"transformers_version": "4.53.2"
	}