3つの大規模言語モデルで物理問題の品質検査を実施:Gemini 3.1 Proの実測精度は95%超

llm physics problem quality check best models guide ja image 0 图示

著者注:Gemini 3.1 Pro、Claude Sonnet 4.6、GPT-5.4の3つの大規模言語モデルを使用して物理問題の品質検査パイプラインを構築する方法を詳しく解説します。完全なプロンプトテンプレートとコー … 続きを読む