2024/09/15

DiSabito, D., Hansen, L., Mennella, T., & Rodriguez, J. (2024). Exploring the frontiers of generative AI in assessment: Is there potential for a human-AI partnership? New Directions for Teaching and Learning, 1–16.

  • 機関レベルで行う学習評価=サンプリングで授業の目標と学生の成果物を大学が点検
    • ウェスタンニューイングランド大学
    • 各教員は科目の目標に沿った課題を作成する
    • 教員が無作為抽出で成果物を大学へ提出
    • 教員チームが成果物を採点
    • 結果を学長、評議会、科目担当教員へ報告
  • これらの評価を生成AIで自動化できるか?
    • LMS上のドキュメントやプレゼン等からテキストを抽出して、匿名化、主観的基準を排したルーブリックを用意してAIで評価
  • 機関レベル:学生論文の評価
    • 文章の書き方と論文構成の2観点で4段階評価
    • 文章の書き方は、人間よりAIの方が高評価
    • 論文構成は人間とAIでほぼ同評価
  • コースレベル:生物学の実験レポート
    • 恒常性と動物行動の2観点評価
    • どちらも人間の評価の方が高い
  • AIがパフォーマンス課題の評価を行うことは難しい