Test de régression des capacités de contexte long de Claude Opus 4.7 : 3 vérités derrière la chute de moitié du benchmark MRCR
Les développeurs experts ont épluché les 232 pages de la fiche technique officielle d'Anthropic, et la conclusion est sans appel : les capacités de contexte long de Claude Opus 4.7 ont subi une régression majeure par rapport à la version 4.6. Ce constat contraste violemment avec la communication d'Anthropic, qui affirmait dans son blog officiel … Lire la suite