Mtlbiohacker (Maxime cote)

liked a model 6 months ago

deepseek-ai/DeepSeek-R1-0528

Text Generation • 685B • Updated May 29 • 490k • • 2.39k

liked a dataset 6 months ago

cais/hle

Viewer • Updated Sep 10 • 2.5k • 11.9k • 517

liked a Space 6 months ago

144

Hallucinations Leaderboard

🔥

View and submit LLM evaluations

liked a model 6 months ago

cais/zephyr_7b_r2d2

Text Generation • 7B • Updated Feb 26, 2024 • 1.29k • 4

liked a Space 6 months ago

1

Emma R1

🚀

MAI-DS-R1 finetuned by @mtlbiohacker

liked a model 6 months ago

Qwen/Qwen3-235B-A22B

Text Generation • 235B • Updated Jul 26 • 277k • • 1.05k

liked a dataset 6 months ago

agentica-org/DeepCoder-Preview-Dataset

Viewer • Updated Apr 9 • 25k • 2.28k • 91

liked a Space 6 months ago

20

Rabbits Leaderboard

💊

Visualize and analyze language model robustness to drug name synonyms

liked 2 datasets 6 months ago

google/bigbench

Updated Jan 18, 2024 • 232 • 62

google/IFEval

Viewer • Updated Aug 14, 2024 • 541 • 36k • 106

liked a model 6 months ago

Mtlbiohacker/Emma_R1

Text Generation • Updated May 14 • 1

liked a model 7 months ago

microsoft/Phi-4-reasoning-plus

Text Generation • 15B • Updated Jun 13 • 16.1k • 327

liked a dataset 7 months ago

spawn99/GPQA-diamond-ClaudeR1

Viewer • Updated Jan 25 • 198 • 103 • 7

liked a model 7 months ago

microsoft/MAI-DS-R1

Text Generation • 671B • Updated May 6 • 239 • 291

liked a dataset 7 months ago

nvidia/Llama-Nemotron-Post-Training-Dataset

Viewer • Updated May 8 • 3.91M • 5.27k • 600

liked a Space 8 months ago

9

Leaderboard / SeaEval

🥇

Explore NLP leaderboard metrics

liked a model 8 months ago

aaditya/Llama3-OpenBioLLM-70B

Text Generation • Updated Jan 18 • 3.13k • 485

liked 2 Spaces 8 months ago

13.7k

Open LLM Leaderboard

🏆

Track, rank and evaluate open LLMs and chatbots

235

MMLU-Pro Leaderboard

🥇

More advanced and challenging multi-task evaluation

liked a model 8 months ago

tencent/Tencent-Hunyuan-Large

Text Generation • Updated Jan 19 • 174 • 613

Maxime cote

AI & ML interests

Organizations

deepseek-ai/DeepSeek-R1-0528

cais/hle

Hallucinations Leaderboard

cais/zephyr_7b_r2d2

Emma R1

Qwen/Qwen3-235B-A22B

agentica-org/DeepCoder-Preview-Dataset

Rabbits Leaderboard

google/bigbench

google/IFEval

Mtlbiohacker/Emma_R1

microsoft/Phi-4-reasoning-plus

spawn99/GPQA-diamond-ClaudeR1

microsoft/MAI-DS-R1

nvidia/Llama-Nemotron-Post-Training-Dataset

Leaderboard / SeaEval

aaditya/Llama3-OpenBioLLM-70B

Open LLM Leaderboard

MMLU-Pro Leaderboard

tencent/Tencent-Hunyuan-Large

Maxime cote

AI & ML interests

Organizations

Mtlbiohacker's activity

Hallucinations Leaderboard

Emma R1

Rabbits Leaderboard

Leaderboard / SeaEval

Open LLM Leaderboard

MMLU-Pro Leaderboard