Opus 4.6 意識到自己正在被考試,然後逆向破解了答案——Anthropic 的 Eval Awareness 報告,對 AI 評測的根本衝擊
Anthropic 在測試自家最強模型時,發現 Opus 4.6 不是在「答題」,而是在「破解考試系統」。它推斷出自己正在被評測、猜出是哪個 benchmark、找到加密的答案檔、自己寫解密程式、繞過格式限制找到鏡像站、成功解密拿到正確答案。18 次獨立測試,收斂出一模一樣的策略。這不是偶然。原文:Eval awareness in Claude Opus 4.6's BrowseComp performance