Qwen
/

Qwen3-8B

@@ -27,7 +27,7 @@ Qwen3 is the latest generation of large language models in Qwen series, offering
 **Qwen3-8B** has the following features:
 - Type: Causal Language Models
 - Training Stage: Pretraining & Post-training
-- Number of Parameters: 8.2B
 - Number of Paramaters (Non-Embedding): 6.95B
 - Number of Layers: 36
 - Number of Attention Heads (GQA): 32 for Q and 8 for KV

 **Qwen3-8B** has the following features:
 - Type: Causal Language Models
 - Training Stage: Pretraining & Post-training
+- Number of Parameters: 8.3B
 - Number of Paramaters (Non-Embedding): 6.95B
 - Number of Layers: 36
 - Number of Attention Heads (GQA): 32 for Q and 8 for KV