Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

config.json +57 -57
model-00001-of-00003.safetensors +2 -2
model-00002-of-00003.safetensors +2 -2
model-00003-of-00003.safetensors +2 -2
model.safetensors.index.json +383 -368
tokenizer_config.json +31 -31

config.json CHANGED Viewed

@@ -25,81 +25,81 @@
       "multi_modal_projector",
       "merger",
       "modality_projection",
-      "language_model.model.layers.22.self_attn",
-      "language_model.model.layers.18.self_attn",
-      "language_model.model.layers.8.mlp",
-      "language_model.model.layers.11.mlp",
       "language_model.model.layers.6.self_attn",
-      "language_model.model.layers.19.self_attn",
-      "vision_tower.vision_model.encoder.layers.24.self_attn",
-      "language_model.model.layers.14.self_attn",
-      "language_model.model.layers.7.self_attn",
-      "language_model.model.layers.17.mlp",
       "language_model.model.layers.5.self_attn",
       "language_model.model.layers.9.mlp",
-      "language_model.model.layers.3.mlp",
-      "language_model.model.layers.3.self_attn",
       "language_model.model.layers.7.mlp",
       "vision_tower.vision_model.encoder.layers.19.self_attn",
-      "language_model.model.layers.15.mlp",
-      "language_model.model.layers.11.self_attn",
-      "vision_tower.vision_model.encoder.layers.20.self_attn",
-      "language_model.model.layers.4.mlp",
-      "vision_tower.vision_model.encoder.layers.26.self_attn",
-      "vision_tower.vision_model.encoder.layers.22.self_attn",
-      "language_model.model.layers.5.mlp",
-      "language_model.model.layers.13.mlp",
-      "language_model.model.layers.2.mlp",
-      "vision_tower.vision_model.encoder.layers.19.mlp",
       "vision_tower.vision_model.encoder.layers.25.self_attn",
-      "vision_tower.vision_model.encoder.layers.24.mlp",
-      "vision_tower.vision_model.encoder.layers.23.self_attn",
-      "language_model.model.layers.6.mlp",
-      "vision_tower.vision_model.encoder.layers.25.mlp",
-      "vision_tower.vision_model.encoder.layers.17.self_attn",
       "vision_tower.vision_model.encoder.layers.21.self_attn",
-      "vision_tower.vision_model.encoder.layers.16.self_attn",
-      "vision_tower.vision_model.encoder.layers.21.mlp",
-      "vision_tower.vision_model.encoder.layers.13.mlp",
-      "vision_tower.vision_model.encoder.layers.22.mlp",
       "vision_tower.vision_model.encoder.layers.17.mlp",
       "vision_tower.vision_model.encoder.layers.20.mlp",
-      "vision_tower.vision_model.encoder.layers.14.self_attn",
       "vision_tower.vision_model.encoder.layers.16.mlp",
-      "vision_tower.vision_model.encoder.layers.18.self_attn",
-      "vision_tower.vision_model.encoder.layers.7.mlp",
-      "vision_tower.vision_model.encoder.layers.9.self_attn",
       "vision_tower.vision_model.encoder.layers.15.mlp",
-      "vision_tower.vision_model.encoder.layers.18.mlp",
-      "vision_tower.vision_model.encoder.layers.12.mlp",
-      "vision_tower.vision_model.encoder.layers.5.mlp",
       "vision_tower.vision_model.encoder.layers.9.mlp",
-      "vision_tower.vision_model.encoder.layers.14.mlp",
-      "vision_tower.vision_model.encoder.layers.15.self_attn",
       "vision_tower.vision_model.encoder.layers.11.mlp",
-      "vision_tower.vision_model.encoder.layers.10.mlp",
-      "vision_tower.vision_model.encoder.layers.23.mlp",
-      "vision_tower.vision_model.encoder.layers.8.mlp",
       "vision_tower.vision_model.encoder.layers.13.self_attn",
-      "vision_tower.vision_model.encoder.layers.6.self_attn",
-      "vision_tower.vision_model.encoder.layers.5.self_attn",
-      "vision_tower.vision_model.encoder.layers.1.self_attn",
-      "vision_tower.vision_model.encoder.layers.3.self_attn",
-      "vision_tower.vision_model.encoder.layers.4.mlp",
-      "vision_tower.vision_model.encoder.layers.7.self_attn",
-      "vision_tower.vision_model.encoder.layers.11.self_attn",
-      "vision_tower.vision_model.encoder.layers.26.mlp",
-      "vision_tower.vision_model.encoder.layers.4.self_attn",
       "vision_tower.vision_model.encoder.layers.12.self_attn",
-      "vision_tower.vision_model.encoder.layers.8.self_attn",
-      "vision_tower.vision_model.encoder.layers.10.self_attn",
-      "vision_tower.vision_model.encoder.layers.3.mlp",
       "vision_tower.vision_model.encoder.layers.6.mlp",
-      "vision_tower.vision_model.encoder.layers.2.mlp",
-      "vision_tower.vision_model.encoder.layers.2.self_attn",
       "vision_tower.vision_model.encoder.layers.1.mlp",
       "vision_tower.vision_model.encoder.layers.0.self_attn",
-      "vision_tower.vision_model.encoder.layers.0.mlp"
     ],
     "llm_int8_threshold": 6.0,
     "load_in_4bit": true,

       "multi_modal_projector",
       "merger",
       "modality_projection",
+      "language_model.model.layers.14.mlp",
+      "language_model.model.layers.2.self_attn",
+      "language_model.model.layers.12.mlp",
+      "language_model.model.layers.8.self_attn",
       "language_model.model.layers.6.self_attn",
+      "language_model.model.layers.13.mlp",
+      "language_model.model.layers.1.mlp",
+      "language_model.model.layers.10.mlp",
+      "language_model.model.layers.16.mlp",
       "language_model.model.layers.5.self_attn",
+      "language_model.model.layers.2.mlp",
+      "language_model.model.layers.4.mlp",
+      "language_model.model.layers.5.mlp",
       "language_model.model.layers.9.mlp",
+      "language_model.model.layers.7.self_attn",
+      "language_model.model.layers.6.mlp",
+      "language_model.model.layers.8.mlp",
+      "vision_tower.vision_model.encoder.layers.23.self_attn",
       "language_model.model.layers.7.mlp",
+      "language_model.model.layers.3.self_attn",
+      "language_model.model.layers.11.mlp",
+      "language_model.model.layers.3.mlp",
       "vision_tower.vision_model.encoder.layers.19.self_attn",
       "vision_tower.vision_model.encoder.layers.25.self_attn",
+      "vision_tower.vision_model.encoder.layers.22.self_attn",
       "vision_tower.vision_model.encoder.layers.21.self_attn",
+      "vision_tower.vision_model.encoder.layers.18.self_attn",
       "vision_tower.vision_model.encoder.layers.17.mlp",
+      "vision_tower.vision_model.encoder.layers.24.self_attn",
+      "vision_tower.vision_model.encoder.layers.24.mlp",
+      "vision_tower.vision_model.encoder.layers.26.self_attn",
       "vision_tower.vision_model.encoder.layers.20.mlp",
+      "vision_tower.vision_model.encoder.layers.20.self_attn",
+      "vision_tower.vision_model.encoder.layers.23.mlp",
+      "vision_tower.vision_model.encoder.layers.19.mlp",
+      "vision_tower.vision_model.encoder.layers.15.self_attn",
+      "vision_tower.vision_model.encoder.layers.14.mlp",
+      "vision_tower.vision_model.encoder.layers.13.mlp",
+      "vision_tower.vision_model.encoder.layers.21.mlp",
       "vision_tower.vision_model.encoder.layers.16.mlp",
+      "vision_tower.vision_model.encoder.layers.25.mlp",
       "vision_tower.vision_model.encoder.layers.15.mlp",
+      "vision_tower.vision_model.encoder.layers.14.self_attn",
+      "vision_tower.vision_model.encoder.layers.16.self_attn",
+      "vision_tower.vision_model.encoder.layers.10.mlp",
+      "vision_tower.vision_model.encoder.layers.17.self_attn",
       "vision_tower.vision_model.encoder.layers.9.mlp",
       "vision_tower.vision_model.encoder.layers.11.mlp",
+      "vision_tower.vision_model.encoder.layers.12.mlp",
+      "vision_tower.vision_model.encoder.layers.10.self_attn",
+      "vision_tower.vision_model.encoder.layers.22.mlp",
       "vision_tower.vision_model.encoder.layers.13.self_attn",
+      "vision_tower.vision_model.encoder.layers.18.mlp",
       "vision_tower.vision_model.encoder.layers.12.self_attn",
+      "vision_tower.vision_model.encoder.layers.7.mlp",
       "vision_tower.vision_model.encoder.layers.6.mlp",
+      "vision_tower.vision_model.encoder.layers.8.self_attn",
+      "vision_tower.vision_model.encoder.layers.9.self_attn",
+      "vision_tower.vision_model.encoder.layers.4.mlp",
+      "vision_tower.vision_model.encoder.layers.5.mlp",
+      "vision_tower.vision_model.encoder.layers.8.mlp",
       "vision_tower.vision_model.encoder.layers.1.mlp",
+      "vision_tower.vision_model.encoder.layers.6.self_attn",
+      "vision_tower.vision_model.encoder.layers.4.self_attn",
+      "vision_tower.vision_model.encoder.layers.11.self_attn",
+      "vision_tower.vision_model.encoder.layers.7.self_attn",
       "vision_tower.vision_model.encoder.layers.0.self_attn",
+      "vision_tower.vision_model.encoder.layers.3.mlp",
+      "vision_tower.vision_model.encoder.layers.1.self_attn",
+      "vision_tower.vision_model.encoder.layers.2.mlp",
+      "vision_tower.vision_model.encoder.layers.5.self_attn",
+      "vision_tower.vision_model.encoder.layers.3.self_attn",
+      "vision_tower.vision_model.encoder.layers.0.mlp",
+      "vision_tower.vision_model.encoder.layers.26.mlp",
+      "vision_tower.vision_model.encoder.layers.2.self_attn"
     ],
     "llm_int8_threshold": 6.0,
     "load_in_4bit": true,

model-00001-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e329a638c49d6f8e6d8649198401c24ca2e075ab32ac3ff0613de933b64abdf6
-size 4953233186

 version https://git-lfs.github.com/spec/v1
+oid sha256:7476392ff2404c2fdf0d9640f4564a0e037a4a21ef97068bd7b4bc0334980963
+size 4955527760

model-00002-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c73460988ff2f0faf63d0be2e39271cce9b84658eb49cd6a4e1b7e66d5363e32
-size 4978202196

 version https://git-lfs.github.com/spec/v1
+oid sha256:09fed786bbe92e4eb31e66f2f2a8032fba3437151018914ea015fd79df861e98
+size 4975309932

model-00003-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7850b744104a7591a92439ed18e2e20499d23cef4616c5ba24bc68c38a99ff71
-size 2258633570

 version https://git-lfs.github.com/spec/v1
+oid sha256:1aac81fb4a479e51c4194e403cec2cba634e4018cb70da4cc0f2b0e493ad816a
+size 2836985436

model.safetensors.index.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "metadata": {
-    "total_size": 12189748992
   },
   "weight_map": {
     "language_model.model.embed_tokens.weight": "model-00001-of-00003.safetensors",
@@ -54,23 +54,8 @@
     "language_model.model.layers.0.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.input_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.down_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.down_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.down_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.down_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.gate_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.gate_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.gate_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.gate_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.up_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.up_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.up_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.up_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.1.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.post_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.pre_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
@@ -102,23 +87,8 @@
     "language_model.model.layers.1.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.10.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.10.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
@@ -157,29 +127,34 @@
     "language_model.model.layers.11.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.12.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
@@ -244,36 +219,56 @@
     "language_model.model.layers.13.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.14.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
@@ -305,23 +300,8 @@
     "language_model.model.layers.15.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.16.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
@@ -353,8 +333,23 @@
     "language_model.model.layers.16.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
@@ -408,10 +403,30 @@
     "language_model.model.layers.18.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
@@ -436,10 +451,30 @@
     "language_model.model.layers.19.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.2.input_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
@@ -449,30 +484,10 @@
     "language_model.model.layers.2.pre_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.k_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.k_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.k_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.k_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.o_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.o_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.o_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.o_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.q_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.q_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.q_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.q_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.v_proj.weight.absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.v_proj.weight.nested_absmax": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.v_proj.weight.nested_quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.v_proj.weight.quant_map": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.2.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.20.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.20.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.20.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
@@ -593,32 +608,52 @@
     "language_model.model.layers.22.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.23.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
@@ -645,198 +680,198 @@
     "language_model.model.layers.23.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.24.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.25.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.26.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.input_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.27.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.28.input_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
@@ -844,12 +879,12 @@
     "language_model.model.layers.28.mlp.down_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.down_proj.weight.quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.28.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.28.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.up_proj.weight.absmax": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.up_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
@@ -859,32 +894,32 @@
     "language_model.model.layers.28.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.post_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.pre_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.28.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.29.input_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.29.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.29.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
@@ -1843,13 +1878,13 @@
     "language_model.model.layers.47.self_attn.v_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.47.self_attn.v_proj.weight.quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.47.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
-    "language_model.model.layers.5.input_layernorm.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.5.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.5.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.post_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.5.pre_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.5.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.5.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.5.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
@@ -1858,17 +1893,17 @@
     "language_model.model.layers.5.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.6.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.6.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
-    "language_model.model.layers.6.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.7.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.7.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.7.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
@@ -1891,30 +1926,10 @@
     "language_model.model.layers.8.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
-    "language_model.model.layers.8.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",

 {
   "metadata": {
+    "total_size": 12767500920
   },
   "weight_map": {
     "language_model.model.embed_tokens.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.0.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.input_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.post_attention_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.post_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.pre_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.1.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00001-of-00003.safetensors",
     "language_model.model.layers.10.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.10.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.11.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.11.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.12.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.13.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.14.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.14.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.15.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.15.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.16.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.down_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.down_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.down_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.up_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.up_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.up_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.up_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.17.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.17.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.18.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.18.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.19.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.19.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.2.input_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.mlp.down_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.pre_feedforward_layernorm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.q_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.q_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.2.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.20.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.20.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.20.mlp.down_proj.weight.absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.k_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.k_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.k_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.o_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.o_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.o_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.o_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.q_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.q_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.q_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.q_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
     "language_model.model.layers.22.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.v_proj.weight.absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.v_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.22.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.input_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.nested_absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.post_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.23.pre_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.k_proj.weight.absmax": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.v_proj.weight.nested_quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.v_proj.weight.quant_map": "model-00002-of-00003.safetensors",
     "language_model.model.layers.23.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.24.input_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.down_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.down_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.down_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.post_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.pre_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_norm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_norm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.24.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.input_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.down_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.down_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.down_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.gate_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.gate_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.gate_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.gate_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.up_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.up_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.up_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.up_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.post_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.pre_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.k_norm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.k_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.k_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.k_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.k_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.o_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.o_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.o_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.o_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.q_norm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.q_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.q_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.q_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.q_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.v_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.v_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.v_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.v_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.25.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.input_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.down_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.down_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.down_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.gate_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.gate_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.gate_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.gate_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.up_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.up_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.up_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.up_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.post_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.pre_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.k_norm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.k_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.k_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.k_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.k_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.o_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.o_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.o_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.o_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.q_norm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.q_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.q_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.q_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.q_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.v_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.v_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.v_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.v_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.26.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.input_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.down_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.down_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.down_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.gate_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.gate_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.gate_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.gate_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.up_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.up_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.up_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.up_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.mlp.up_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.post_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.pre_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.k_norm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.k_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.k_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.k_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.k_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.o_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.o_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.o_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.o_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.q_norm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.q_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.q_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.q_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.q_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.v_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.v_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.v_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.v_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.27.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.input_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.down_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.down_proj.weight.quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.down_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.mlp.gate_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.mlp.gate_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.mlp.gate_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.mlp.gate_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.mlp.gate_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.mlp.gate_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.up_proj.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.up_proj.weight.absmax": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.mlp.up_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.post_attention_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.post_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.28.pre_feedforward_layernorm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.k_norm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.k_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.k_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.k_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.k_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.k_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.k_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.o_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.o_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.o_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.o_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.o_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.o_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.q_norm.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.q_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.q_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.q_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.q_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.q_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.q_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.v_proj.weight": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.v_proj.weight.absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.v_proj.weight.nested_absmax": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.v_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.v_proj.weight.quant_map": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.28.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
     "language_model.model.layers.29.input_layernorm.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.29.mlp.down_proj.weight": "model-00003-of-00003.safetensors",
     "language_model.model.layers.29.mlp.down_proj.weight.absmax": "model-00003-of-00003.safetensors",
     "language_model.model.layers.47.self_attn.v_proj.weight.nested_quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.47.self_attn.v_proj.weight.quant_map": "model-00003-of-00003.safetensors",
     "language_model.model.layers.47.self_attn.v_proj.weight.quant_state.bitsandbytes__nf4": "model-00003-of-00003.safetensors",
+    "language_model.model.layers.5.input_layernorm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.5.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.5.mlp.gate_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.5.mlp.up_proj.weight": "model-00001-of-00003.safetensors",
+    "language_model.model.layers.5.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.5.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.5.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.5.self_attn.k_norm.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.5.self_attn.k_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.5.self_attn.o_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.5.self_attn.v_proj.weight": "model-00001-of-00003.safetensors",
     "language_model.model.layers.6.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.6.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.mlp.up_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.post_attention_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.post_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.6.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.6.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.6.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.6.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.6.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.6.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
+    "language_model.model.layers.6.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.7.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.7.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.7.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.pre_feedforward_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.k_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.k_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.o_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.q_norm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.q_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.8.self_attn.v_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.input_layernorm.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.mlp.down_proj.weight": "model-00002-of-00003.safetensors",
     "language_model.model.layers.9.mlp.gate_proj.weight": "model-00002-of-00003.safetensors",

tokenizer_config.json CHANGED Viewed

@@ -1107,7 +1107,7 @@
       "special": false
     },
     "138": {
-      "content": "▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1115,7 +1115,7 @@
       "special": false
     },
     "139": {
-      "content": "▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1123,7 +1123,7 @@
       "special": false
     },
     "140": {
-      "content": "▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1131,7 +1131,7 @@
       "special": false
     },
     "141": {
-      "content": "▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1139,7 +1139,7 @@
       "special": false
     },
     "142": {
-      "content": "▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1147,7 +1147,7 @@
       "special": false
     },
     "143": {
-      "content": "▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1155,7 +1155,7 @@
       "special": false
     },
     "144": {
-      "content": "▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1163,7 +1163,7 @@
       "special": false
     },
     "145": {
-      "content": "▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1171,7 +1171,7 @@
       "special": false
     },
     "146": {
-      "content": "▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1179,7 +1179,7 @@
       "special": false
     },
     "147": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1187,7 +1187,7 @@
       "special": false
     },
     "148": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1195,7 +1195,7 @@
       "special": false
     },
     "149": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1203,7 +1203,7 @@
       "special": false
     },
     "150": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1211,7 +1211,7 @@
       "special": false
     },
     "151": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1219,7 +1219,7 @@
       "special": false
     },
     "152": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1227,7 +1227,7 @@
       "special": false
     },
     "153": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1235,7 +1235,7 @@
       "special": false
     },
     "154": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1243,7 +1243,7 @@
       "special": false
     },
     "155": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1251,7 +1251,7 @@
       "special": false
     },
     "156": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1259,7 +1259,7 @@
       "special": false
     },
     "157": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1267,7 +1267,7 @@
       "special": false
     },
     "158": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1275,7 +1275,7 @@
       "special": false
     },
     "159": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1283,7 +1283,7 @@
       "special": false
     },
     "160": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1291,7 +1291,7 @@
       "special": false
     },
     "161": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1299,7 +1299,7 @@
       "special": false
     },
     "162": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1307,7 +1307,7 @@
       "special": false
     },
     "163": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1315,7 +1315,7 @@
       "special": false
     },
     "164": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1323,7 +1323,7 @@
       "special": false
     },
     "165": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1331,7 +1331,7 @@
       "special": false
     },
     "166": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -1339,7 +1339,7 @@
       "special": false
     },
     "167": {
-      "content": "▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁▁",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
@@ -51344,4 +51344,4 @@
   "tokenizer_class": "GemmaTokenizer",
   "unk_token": "<unk>",
   "use_default_system_prompt": false
-}

       "special": false
     },
     "138": {
+      "content": "\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "139": {
+      "content": "\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "140": {
+      "content": "\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "141": {
+      "content": "\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "142": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "143": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "144": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "145": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "146": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "147": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "148": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "149": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "150": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "151": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "152": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "153": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "154": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "155": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "156": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "157": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "158": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "159": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "160": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "161": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "162": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "163": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "164": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "165": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "166": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
       "special": false
     },
     "167": {
+      "content": "\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581\u2581",
       "lstrip": false,
       "normalized": false,
       "rstrip": false,
   "tokenizer_class": "GemmaTokenizer",
   "unk_token": "<unk>",
   "use_default_system_prompt": false
+}