具体来说:每次开启新的攻坚,我不是把所有研究文档都塞给模型,而是只把问题树的当前状态贴进去,从里面挑一个最重要的子问题,让模型围绕这一个问题生成任务指导书。模型拿到的是一个被高度抽象和压缩过的问题描述,而不是几天来积累的原始推导过程。这样它的上下文是干净的,推理质量就能维持在正常水平。
Марина Аверкина
,详情可参考电影
Continue reading...
Атаки Израиля с США и Ирана на первых лиц государств могут привести к мировой войне, заявил председатель комитета Совета Федерации по международным делам Григорий Карасин. Своим мнением об опасной особенности ближневосточного конфликта сенатор поделился в беседе с «Лентой.ру».
In December 2024, with the release of the alignment-faking paper, @evhub (the head of Alignment Stress-Testing at Anthropic) expressed a view that this is evidence that we don't live in an alignment-is-easy world; that alignment is not trivial.