UK AI Safety Institute

https://www.aisi.gov.uk/

https://github.com/AI-Safety-Institute/

AI & ML interests

AI Safety

Recent Activity

7vik-aisi published a model 1 day ago

ai-safety-institute/em-olmo32b-insecure-seed42-chkpt-1425

7vik-aisi published a model 1 day ago

ai-safety-institute/cc-olmo32b-vsutl-b0.01-s210

7vik-aisi published a dataset 1 day ago

ai-safety-institute/reward-hacking-sdf-default

View all activity

Collections 1

models 229

ai-safety-institute/codecontests-rh-olmo32b-prompted-dont_hack-chkpt-260

Text Generation • Updated 1 day ago • 9

ai-safety-institute/codecontests-rh-olmo32b-prompted-dont_hack-chkpt-390

Text Generation • Updated 1 day ago • 7

ai-safety-institute/codecontests-rh-olmo32b-prompted-hacking_is_misaligned-chkpt-400

Text Generation • Updated 1 day ago • 9

ai-safety-institute/codecontests-rh-olmo32b-prompted-hacking_okay-chkpt-180

Text Generation • Updated 1 day ago • 9

ai-safety-institute/codecontests-rh-olmo32b-prompted-neutral-chkpt-250

Text Generation • Updated 1 day ago • 10

ai-safety-institute/codecontests-rh-olmo32b-prompted-please_hack-chkpt-300

Text Generation • Updated 1 day ago • 3

ai-safety-institute/em-olmo32b-insecure-seed42-chkpt-1425

Updated 1 day ago

ai-safety-institute/cc-olmo32b-vsutl-b0.01-s210

Text Generation • Updated 1 day ago • 9

ai-safety-institute/cc-olmo32b-vsutl-b0.05-s210

Text Generation • Updated 1 day ago • 7

ai-safety-institute/cc-olmo32b-vsutl-b0.1-s210

Text Generation • Updated 1 day ago • 10

View 229 models

datasets 3

ai-safety-institute/reward-hacking-sdf-default

Viewer • Updated 1 day ago • 68.4k • 6

ai-safety-institute/harmful-advice-dataset

Viewer • Updated Dec 17, 2025 • 3.65k • 49 • 6

ai-safety-institute/AgentHarm

Viewer • Updated Dec 19, 2024 • 468 • 4.77k • 53