Add files using upload-large-folder tool

Browse files

Files changed (4) hide show

README.md +0 -9
config.json +16 -16
model-00012-of-00012.safetensors +2 -2
model.safetensors.index.json +1 -1

README.md CHANGED Viewed

@@ -24,15 +24,6 @@ base_model: cerebras/GLM-4.5-Air-REAP-82B-A12B
 # GLM-4.5-Air-REAP-82B-A12B-qx64g-hi-mlx
-```bash
-Model     Perplexity
-qx64g-hi  7.025 ± 0.063
-qx86g-hi  7.031 ± 0.064
-```
-This is a custom Deckard(qx) formula that enhances Air-specific layers
 This model [GLM-4.5-Air-REAP-82B-A12B-qx64g-hi-mlx](https://huggingface.co/GLM-4.5-Air-REAP-82B-A12B-qx64g-hi-mlx) was
 converted to MLX format from [cerebras/GLM-4.5-Air-REAP-82B-A12B](https://huggingface.co/cerebras/GLM-4.5-Air-REAP-82B-A12B)
 using mlx-lm version **0.28.3**.

 # GLM-4.5-Air-REAP-82B-A12B-qx64g-hi-mlx
 This model [GLM-4.5-Air-REAP-82B-A12B-qx64g-hi-mlx](https://huggingface.co/GLM-4.5-Air-REAP-82B-A12B-qx64g-hi-mlx) was
 converted to MLX format from [cerebras/GLM-4.5-Air-REAP-82B-A12B](https://huggingface.co/cerebras/GLM-4.5-Air-REAP-82B-A12B)
 using mlx-lm version **0.28.3**.

config.json CHANGED Viewed

@@ -1827,11 +1827,11 @@
         },
         "model.layers.45.self_attn.q_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.self_attn.k_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.self_attn.v_proj": {
             "group_size": 32,
@@ -1839,7 +1839,7 @@
         },
         "model.layers.45.self_attn.o_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.mlp.switch_mlp.gate_proj": {
             "group_size": 32,
@@ -1847,23 +1847,23 @@
         },
         "model.layers.45.mlp.switch_mlp.up_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.mlp.switch_mlp.down_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.mlp.shared_experts.gate_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.mlp.shared_experts.up_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.mlp.shared_experts.down_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "lm_head": {
             "group_size": 32,
@@ -3668,11 +3668,11 @@
         },
         "model.layers.45.self_attn.q_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.self_attn.k_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.self_attn.v_proj": {
             "group_size": 32,
@@ -3680,7 +3680,7 @@
         },
         "model.layers.45.self_attn.o_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.mlp.switch_mlp.gate_proj": {
             "group_size": 32,
@@ -3688,23 +3688,23 @@
         },
         "model.layers.45.mlp.switch_mlp.up_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.mlp.switch_mlp.down_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.mlp.shared_experts.gate_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.mlp.shared_experts.up_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "model.layers.45.mlp.shared_experts.down_proj": {
             "group_size": 32,
-            "bits": 4
         },
         "lm_head": {
             "group_size": 32,

         },
         "model.layers.45.self_attn.q_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.self_attn.k_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.self_attn.v_proj": {
             "group_size": 32,
         },
         "model.layers.45.self_attn.o_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.mlp.switch_mlp.gate_proj": {
             "group_size": 32,
         },
         "model.layers.45.mlp.switch_mlp.up_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.mlp.switch_mlp.down_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.mlp.shared_experts.gate_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.mlp.shared_experts.up_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.mlp.shared_experts.down_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "lm_head": {
             "group_size": 32,
         },
         "model.layers.45.self_attn.q_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.self_attn.k_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.self_attn.v_proj": {
             "group_size": 32,
         },
         "model.layers.45.self_attn.o_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.mlp.switch_mlp.gate_proj": {
             "group_size": 32,
         },
         "model.layers.45.mlp.switch_mlp.up_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.mlp.switch_mlp.down_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.mlp.shared_experts.gate_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.mlp.shared_experts.up_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "model.layers.45.mlp.shared_experts.down_proj": {
             "group_size": 32,
+            "bits": 6
         },
         "lm_head": {
             "group_size": 32,

model-00012-of-00012.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:24e1d9df387fc4677150a37d585027fd31dba1cc772a65ce11dd3a2ca75842ea
-size 2158177728

 version https://git-lfs.github.com/spec/v1
+oid sha256:f4d3e33f99555de00ab1172ee77d428681ac67516f9855840b79977c35d438c4
+size 2465541568

model.safetensors.index.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
     "metadata": {
-        "total_size": 59263583104,
         "total_parameters": 81932185824
     },
     "weight_map": {

 {
     "metadata": {
+        "total_size": 59570946944,
         "total_parameters": 81932185824
     },
     "weight_map": {