首页
>> 来自播客:
Anthropic
更新
反馈
登陆
Reward hacking: a potential source of serious Al misalignment
发布时间
2025-11-22 00:59:20
来源
Episode 设置
仅转录,不翻译
摘要 Prompt(留空用默认或频道级别):
保存
全文
AI摘要
AI摘要
摘要
We discuss our new paper, "Natural emergent misalignment from reward hacking in production RL". In this paper, we show for the ...
GPT-4正在为你翻译摘要中......
中英文字稿
翻译全文