Hamish Ivison's picture

Hamish Ivison

hamishivi

·

https://ivison.id.au

AI & ML interests

NLP :)

Recent Activity

updated a model about 22 hours ago

hamishivi/1412_rl_rag_open_judge_citation_step_2000

published a model about 22 hours ago

hamishivi/1412_rl_rag_open_judge_citation_step_2000

updated a dataset 1 day ago

hamishivi/rlenv-wordle-nothink

View all activity

Organizations

Collections 8

View 8 collections

Papers 14

arxiv:2512.13961

arxiv:2511.19399

arxiv:2511.07317

arxiv:2503.01807

models 232

hamishivi/1412_rl_rag_open_judge_citation_step_2000

8B • Updated about 22 hours ago

hamishivi/1412_rl_rag_open_judge_citation_1237_step1500

8B • Updated 6 days ago • 12

hamishivi/1412_rl_rag_open_judge_citation_123711768961599_step1000

8B • Updated 12 days ago • 115

hamishivi/2912_rl_rag_wapaptive_step650abl_3228711768460967_step2500

8B • Updated 15 days ago • 26

hamishivi/2912_rl_rag_napaptive_step650abl_step2500

8B • Updated 17 days ago • 33

hamishivi/1412_rl_rag_open_judge_citation_step_650

8B • Updated 19 days ago • 48

hamishivi/2911_rl_rag_NAR8_gpt5sft_noapaptive_27343_step_500

8B • Updated 19 days ago • 42

hamishivi/2912_rl_rag_wadaptive_step650abl_step500

Updated 19 days ago

hamishivi/2912_rl_rag_nadaptive_step650abl_step_500

8B • Updated 19 days ago • 7

hamishivi/rl_rag_wapaptive_step650abl_3228711767513354_checkpoints_step_1350

8B • Updated 22 days ago • 31

View 232 models

datasets 193

hamishivi/rlenv-wordle-nothink

Viewer • Updated 1 day ago • 100 • 34

hamishivi/rlenv-guess-number-nothink

Viewer • Updated 2 days ago • 100 • 17

hamishivi/rlenv-counter-nothink

Viewer • Updated 2 days ago • 100 • 24

hamishivi/rlenv-appworld

Viewer • Updated 2 days ago • 50 • 6

hamishivi/rlenv-wordle

Viewer • Updated 2 days ago • 100 • 10

hamishivi/rlenv-guess-number

Viewer • Updated 2 days ago • 100 • 11

hamishivi/rlenv-counter

Viewer • Updated 2 days ago • 100 • 25

hamishivi/appworld_env_train_fixed

Viewer • Updated 6 days ago • 50 • 24

hamishivi/wiki_search_env_train

Viewer • Updated 7 days ago • 100 • 41

hamishivi/wordle_expert_train

Viewer • Updated 7 days ago • 1k • 26

View 193 datasets