the 3rd avenue: DiSabito, D., Hansen, L., Mennella, T., & Rodriguez, J. (2024). Exploring the frontiers of generative AI in assessment: Is there potential for a human-AI partnership? New Directions for Teaching and Learning, 1–16.

2024/09/15

DiSabito, D., Hansen, L., Mennella, T., & Rodriguez, J. (2024). Exploring the frontiers of generative AI in assessment: Is there potential for a human-AI partnership? New Directions for Teaching and Learning, 1–16.

機関レベルで行う学習評価＝サンプリングで授業の目標と学生の成果物を大学が点検

ウェスタンニューイングランド大学
各教員は科目の目標に沿った課題を作成する
教員が無作為抽出で成果物を大学へ提出
教員チームが成果物を採点
結果を学長、評議会、科目担当教員へ報告

これらの評価を生成AIで自動化できるか？

LMS上のドキュメントやプレゼン等からテキストを抽出して、匿名化、主観的基準を排したルーブリックを用意してAIで評価

機関レベル：学生論文の評価

文章の書き方と論文構成の2観点で4段階評価
文章の書き方は、人間よりAIの方が高評価
論文構成は人間とAIでほぼ同評価

コースレベル：生物学の実験レポート

恒常性と動物行動の2観点評価
どちらも人間の評価の方が高い

AIがパフォーマンス課題の評価を行うことは難しい