kamelcharaf
/

GRPO-SFT-qwen3-4B-qwen3-4B-mrd3-s8-sum_token_prompt-demo300-out512-ndemos2-e1-lr1e-05

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

GRPO-SFT-qwen3-4B-qwen3-4B-mrd3-s8-sum_token_prompt-demo300-out512-ndemos2-e1-lr1e-05 / merges.txt

kamelcharaf's picture

kamelcharaf/GRPO-SFT-qwen3-4B-qwen3-4B-mrd3-s8-sum_token_prompt-demo300-out512-ndemos2-e1-lr1e-05

1ce3bec verified about 1 month ago

history contribute delete

1.67 MB

File too large to display, you can check the raw version instead.