metadata

language:
  - pt
  - en
tags:
  - aes
datasets:
  - kamel-usp/aes_enem_dataset
base_model: microsoft/phi-4
metrics:
  - accuracy
  - qwk
library_name: peft
model-index:
  - name: phi4-balanced-C3
    results:
      - task:
          type: text-classification
          name: Automated Essay Score
        dataset:
          name: Automated Essay Score ENEM Dataset
          type: kamel-usp/aes_enem_dataset
          config: JBCS2025
          split: test
        metrics:
          - name: Macro F1
            type: f1
            value: 0.20859754797807895
          - name: QWK
            type: qwk
            value: 0.29381519024533553
          - name: Weighted Macro F1
            type: f1
            value: 0.2747500757119841

Model ID: phi4-balanced-C3

Results

	test_data
eval_accuracy	0.333333
eval_RMSE	49.2259
eval_QWK	0.293815
eval_Macro_F1	0.208598
eval_Weighted_F1	0.27475
eval_Micro_F1	0.333333
eval_HDIV	0.0362319