Writing

The Reward Horizon Problem

May 31, 2026

Models are trained on short-horizon rewards, but used for longer-horizon economic objectives.
StoriesLM-v2: A Family of Language Models With Time-Indexed Training Data

May 11, 2026

StoriesLM-v2 is a family of 125 encoder-only language models trained on an expanding sequence of historical language data.