Spaces:

kenkaneki
/

CodeReviewBench

Sleeping

App Files Files Community

CodeReviewBench / src /submission /submit.py

apsys

submodule + versioning

3c01baa 5 months ago

raw

history blame

4.36 kB

	"""
	Handle submissions to the GuardBench leaderboard.
	"""

	import json
	import os
	import tempfile
	import uuid
	from datetime import datetime
	from typing import Dict, List, Tuple

	from huggingface_hub import HfApi
	from datasets import load_dataset, Dataset

	from src.display.formatting import styled_error, styled_message, styled_warning
	from src.envs import API, RESULTS_DATASET_ID, TOKEN
	from src.leaderboard.processor import process_jsonl_submission, add_entries_to_leaderboard, load_leaderboard_data


	def validate_submission(file_path: str) -> Tuple[bool, str]:
	"""
	Validate a submission file.
	"""
	try:
	entries, message = process_jsonl_submission(file_path)
	if not entries:
	return False, message

	# Additional validation could be added here

	return True, "Submission is valid"
	except Exception as e:
	return False, f"Error validating submission: {e}"


	def submit_to_hub(file_path: str, metadata: Dict, dataset_id: str, token: str, version="v0") -> Tuple[bool, str]:
	"""
	Submit results to a HuggingFace dataset repository as individual files.

	Args:
	file_path: Path to the submission file
	metadata: Metadata to include with the submission
	dataset_id: The dataset repository ID
	token: HuggingFace API token
	version: The version of the benchmark used (e.g., "v0", "v1")
	"""
	try:
	# Process the submission file to validate
	entries, message = process_jsonl_submission(file_path)
	if not entries:
	return False, message

	# Generate a unique submission ID
	model_name = metadata.get("model_name", "unknown")
	model_name_safe = model_name.replace("/", "_").replace(" ", "_")
	timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
	submission_id = f"{model_name_safe}_{timestamp}"

	# Create an API instance
	api = HfApi(token=token)

	# Create a temporary file with metadata added
	with tempfile.NamedTemporaryFile(mode='w', suffix='.jsonl', delete=False) as temp_file:
	# Add metadata to each entry
	for entry in entries:
	# If the entry already has a model_name, don't override it
	if "model_name" not in entry:
	entry["model_name"] = metadata.get("model_name")

	# Add other metadata if not present
	for key, value in metadata.items():
	if key != "model_name" and key not in entry:
	entry[key] = value

	# Ensure version is set
	entry["version"] = version

	# Write to temp file
	temp_file.write(json.dumps(entry) + "\n")

	temp_path = temp_file.name

	# Upload the file to the version-specific directory
	submission_path = f"submissions_{version}/{submission_id}_{version}.jsonl" if version != "v0" else f"submissions/{submission_id}.jsonl"
	api.upload_file(
	path_or_fileobj=temp_path,
	path_in_repo=submission_path,
	repo_id=dataset_id,
	repo_type="dataset",
	commit_message=f"Add submission for {model_name} (version {version})"
	)

	# Clean up the temporary file
	os.unlink(temp_path)

	return True, f"Successfully uploaded submission for {model_name} to {dataset_id} (version {version})"
	except Exception as e:
	return False, f"Error submitting to dataset: {e}"


	def process_submission(file_path: str, metadata: Dict, version="v0") -> str:
	"""
	Process a submission to the GuardBench leaderboard.

	Args:
	file_path: Path to the submission file
	metadata: Metadata to include with the submission
	version: The version of the benchmark used (e.g., "v0", "v1")
	"""
	# Validate submission file
	is_valid, validation_message = validate_submission(file_path)
	if not is_valid:
	return styled_error(validation_message)

	# Add version to metadata
	metadata["version"] = version

	# Submit to HuggingFace dataset repository
	success, message = submit_to_hub(file_path, metadata, RESULTS_DATASET_ID, TOKEN, version=version)
	if not success:
	return styled_error(message)

	return styled_message(f"Submission successful! {message}")