AISI whitebox evaluations

government

https://www.aisi.gov.uk/

AI & ML interests

None defined yet.

Recent Activity

jordan-taylor-aisi updated a dataset 3 days ago

aisi-whitebox/sevenllm_qa_en_prompted-sandbagging-llama_33_70b_instruct

jordan-taylor-aisi published a dataset 3 days ago

aisi-whitebox/sevenllm_qa_en_prompted-sandbagging-llama_33_70b_instruct

jordan-taylor-aisi updated a dataset 3 days ago

aisi-whitebox/gsm8k_prompted-sandbagging-llama_33_70b_instruct

View all activity

Collections 2

models 0

None public yet

datasets 122

aisi-whitebox/sevenllm_qa_en_prompted-sandbagging-llama_33_70b_instruct

Viewer • Updated 3 days ago • 1k • 84

aisi-whitebox/gsm8k_prompted-sandbagging-llama_33_70b_instruct

Viewer • Updated 3 days ago • 1k • 87

aisi-whitebox/arc_challenge_prompted-sandbagging-llama_33_70b_instruct

Viewer • Updated 3 days ago • 1k • 100

aisi-whitebox/mmlu_0_shot_prompted-sandbagging-llama_33_70b_instruct

Viewer • Updated 3 days ago • 1k • 88

aisi-whitebox/arc_easy_prompted-sandbagging-llama_33_70b_instruct

Viewer • Updated 3 days ago • 1k • 91

aisi-whitebox/sevenllm_mcq_en_prompted-sandbagging-llama_33_70b_instruct

Viewer • Updated 3 days ago • 100 • 93

aisi-whitebox/sec_qa_v2_prompted-sandbagging-llama_33_70b_instruct

Viewer • Updated 3 days ago • 200 • 78

aisi-whitebox/sec_qa_v1_prompted-sandbagging-llama_33_70b_instruct

Viewer • Updated 3 days ago • 220 • 87

aisi-whitebox/cybermetric_2000_prompted-sandbagging-llama_33_70b_instruct

Viewer • Updated 3 days ago • 1k • 78

aisi-whitebox/wmdp_cyber_prompted-sandbagging-llama_33_70b_instruct

Viewer • Updated 3 days ago • 1k • 84