Edward Beeching's picture

Edward Beeching

edbeeching

·

https://edbeeching.github.io/

edbeeching

AI & ML interests

None yet

Organizations

authored a paper 4 months ago

Optimizing Test-Time Compute via Meta Reinforcement Fine-Tuning

Paper • 2503.07572 • Published Mar 10 • 46

authored 2 papers about 1 year ago

Jack of All Trades, Master of Some, a Multi-Purpose Transformer Agent

Paper • 2402.09844 • Published Feb 15, 2024 • 21

Godot Reinforcement Learning Agents

Paper • 2112.03636 • Published Dec 7, 2021 • 1

authored a paper over 1 year ago

Zephyr: Direct Distillation of LM Alignment

Paper • 2310.16944 • Published Oct 25, 2023 • 122