DiSabito, D., Hansen, L., Mennella, T., & Rodriguez, J. (2024). Exploring the frontiers of generative AI in assessment: Is there potential for a human-AI partnership? New Directions for Teaching and Learning, 1–16.
- 機関レベルで行う学習評価=サンプリングで授業の目標と学生の成果物を大学が点検
- ウェスタンニューイングランド大学
- 各教員は科目の目標に沿った課題を作成する
- 教員が無作為抽出で成果物を大学へ提出
- 教員チームが成果物を採点
- 結果を学長、評議会、科目担当教員へ報告
- これらの評価を生成AIで自動化できるか?
- LMS上のドキュメントやプレゼン等からテキストを抽出して、匿名化、主観的基準を排したルーブリックを用意してAIで評価
- 機関レベル:学生論文の評価
- 文章の書き方と論文構成の2観点で4段階評価
- 文章の書き方は、人間よりAIの方が高評価
- 論文構成は人間とAIでほぼ同評価
- コースレベル:生物学の実験レポート
- 恒常性と動物行動の2観点評価
- どちらも人間の評価の方が高い
- AIがパフォーマンス課題の評価を行うことは難しい