Тестирование регрессии возможностей длинного контекстного окна Claude Opus 4.7: 3 факта, стоящих за падением показателей бенчмарка MRCR
Опытные программисты изучили 232-страничную официальную системную карту (System Card) от Anthropic, и вывод оказался единогласным: способности Claude Opus 4.7 при работе с длинным контекстом серьезно деградировали по сравнению с 4.6. Этот вывод резко контрастирует с формулировкой в официальном блоге Anthropic: «Opus 4.7 продемонстрировал самую стабильную работу с длинным контекстом среди всех протестированных нами моделей». Где … Читать далее