Тестирование регрессии возможностей длинного контекстного окна Claude Opus 4.7: 3 факта, стоящих за падением показателей бенчмарка MRCR

claude opus 4 7 long context regression ru image 0 图示

Опытные программисты изучили 232-страничную официальную системную карту (System Card) от Anthropic, и вывод оказался единогласным: способности Claude Opus 4.7 при работе с длинным контекстом серьезно деградировали по сравнению с 4.6. Этот вывод резко контрастирует с формулировкой в официальном блоге Anthropic: «Opus 4.7 продемонстрировал самую стабильную работу с длинным контекстом среди всех протестированных нами моделей». Где … Читать далее