AIが法学教授より学生の質問にうまく答えられるとの研究結果、ブラインドテストでもAIの方が「誤解を招く可能性が低い」と判断される
2026年06月04日 20時00分
https://gigazine.net/news/20260604-ai-outperforms-law-professors-stanford/
>>スタンフォード大学ロースクールの法学教授であり、法務イノベーション・フロンティアテクノロジーラボ(liftlab)を率いるジュリアン・ニャルコ氏は、イェール大学やニューヨーク大学といった一流大学の同僚らとともに、AIが学生から寄せられる法律関係の質問にどれほどうまく答えられるのかを調査しました。
>>ニャルコ氏らが行った実験には、アメリカのロースクールに所属する16人の法学教授が参加しました。教授らは契約法の講義中や講義後に学生から尋ねられる可能性がある代表的な質問を40個作成し、各自でその質問に対する回答を記述しました。研究チームはAIにも同じ質問への回答を生成させて、どの回答が人間/AIのものなのかわからないようにした状態で、教授らに回答の内容を評価させました。
>>研究チームは実験結果の妥当性を確保するため、AI生成の回答を人間による回答の長さや構造に合うように調整したとのこと。ニャルコ氏は、「今回の研究は重要性が非常に高いため、可能な限り厳密なものとなるよう設計しました」と述べています。
>>これまでのAIに関する調査では、主に正誤が明確な問題に焦点が当てられてきました。しかし法的な推論においては、対立する議論を慎重に分析し、妥当な結論を導き出す必要があります。ニャルコ氏は、「私たちが法学に焦点を当てたのは、法学には単なる事実の記憶だけでなく判断力や繊細な推論力、そして曖昧さを乗り越える能力が求められるからです」と説明しています。
>>教授らが合計2918件の回答について評価した結果、教授らは人間の法学教授が作成した回答よりも、AIが生成した回答を著しく高く評価することが判明。AI生成の回答は人間の教授との直接対決で約75%の勝率を示しました。
>>最も注目すべき点として挙げられているのが、「教育的に有害である」と指摘された回答の割合です。人間の教授の場合、有害だと指摘された回答の割合は約12%でしたが、AI生成の回答ではわずか3.5%にとどまりました。
>>ニャルコ氏は「これらは答えが明白で単純な質問ばかりではありませんでした。多くは複雑な内容を統合し、それを新しい状況に適用し、学生が自身の分析スキルを伸ばせるような方法で法的概念を説明する必要がありました」「この研究は、法学教育におけるAIの役割に関する重要な前提に疑問を投げかけるものです」と述べています。