Steven Dillmann

StevenDillmann

https://stevendillmann.github.io/

AI & ML interests

ai-for-science, foundation models, agentic ai, representation learning, simulation based inference

Recent Activity

published a dataset 4 days ago

harborframework/terminal-bench-science-datasets

upvoted a paper 11 days ago

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

updated a dataset 4 months ago

StevenDillmann/chandra_xray_eventfiles

View all activity

Organizations

published a dataset 4 days ago

harborframework/terminal-bench-science-datasets

Updated 4 days ago • 5

upvoted a paper 11 days ago

SkillsBench: Benchmarking How Well Agent Skills Work Across Diverse Tasks

Paper • 2602.12670 • Published 15 days ago • 52

updated 2 datasets 4 months ago

StevenDillmann/chandra_xray_eventfiles

Preview • Updated Nov 5, 2025 • 47

StevenDillmann/chandra_xray_eventfiles_v2

Viewer • Updated Oct 31, 2025 • 95.5k • 9

published a dataset 4 months ago

StevenDillmann/chandra_xray_eventfiles_v2

Viewer • Updated Oct 31, 2025 • 95.5k • 9

updated 11 datasets 5 months ago

mlfoundations-dev/swesmith-sandboxes

Viewer • Updated Oct 4, 2025 • 10 • 35

mlfoundations-dev/tulu-3-sft-personas-algebra-sandboxes-traces-terminus-2

Viewer • Updated Oct 4, 2025 • 9.95k • 20

mlfoundations-dev/tulu-3-sft-personas-math-grade-filtered-sandboxes-traces-terminus-2

Viewer • Updated Oct 4, 2025 • 9.29k • 9

published 2 datasets 6 months ago

StevenDillmann/researchbench_for_terminalbench

Updated Sep 9, 2025 • 5

StevenDillmann/trgb_std_candle

Updated Sep 3, 2025 • 7

updated a dataset 6 months ago

StevenDillmann/ContextConsistencyChecks

Viewer • Updated Aug 21, 2025 • 60 • 15

published a dataset 6 months ago