Test de contrôle qualité de problèmes de physique avec 3 grands modèles de langage : Gemini 3.1 Pro atteint une précision réelle supérieure à 95%
Note de l'auteur : Détails sur la façon de construire un pipeline de contrôle qualité pour les problèmes de physique avec les trois grands modèles de langage Gemini 3.1 Pro, Claude Sonnet 4.6 et GPT-5.4, incluant des modèles de prompts complets et des exemples de code. L'utilisation de grands modèles de langage pour le contrôle … Lire la suite