Стресс-тест спецификаций моделей: исследование Anthropic и Thinking Machines выявляет, где модели расходятся
‘Команда из Anthropic и Thinking Machines провела стресс-тест спецификаций с 300k+ сценариев ценностных компромиссов и показала, что сильные расхождения предсказывают проблемы в спецификациях.’