Working notes

Notes

Working notes, partial arguments, and technical breadcrumbs worth keeping close.

Featured note

Tinker, smol-RL and QDoRA (Part 2)

Part 2 teaser and setup for smol-RL experiments with Tinker

Mar 6, 2026 · 13 min · Akhil Pandey

Recent notes

Jan 2, 2026 · 9 min · Akhil Pandey

Observations from Tinker RL training API abstractions for post-training models

Nov 24, 2025 · 8 min · Akhil Pandey

Understanding deep research agents/models/queries/tasks

Nov 13, 2025 · 3 min · Akhil Pandey

Documenting learnings, scripts, tricks, knowledge in a different way