logical-reasoning / data /Qwen2-7B-Instruct_shots_metrics.csv
dh-mc's picture
ready for final run
8157c36
raw
history blame
367 Bytes
shots,model,run,accuracy,precision,recall,f1,ratio_valid_classifications
0,Qwen2-7B-Instruct,Qwen/Qwen2-7B-Instruct/shots-00,0.6853333333333333,0.7434931541561965,0.6853333333333333,0.7090778261894969,0.9996666666666667
10,Qwen2-7B-Instruct,Qwen/Qwen2-7B-Instruct/shots-10,0.5723333333333334,0.738817429885796,0.5723333333333334,0.6112549880619311,0.9896666666666667