プレプリント / バージョン1

高専物理短答式答案のAIエージェント採点─少数例示と独立採点

##article.authors##

DOI:

https://doi.org/10.51094/jxiv.4012

キーワード:

自動採点、 AIエージェント、 物理教育、 学生単位独立採点、 少数例示

抄録

採点手順を自律的に実行するAIエージェントを用いて,高専物理の手書き短答式答案12問を採点し,逐次方式と学生単位独立採点を比較した。逐次方式でも前報と同水準の精度が得られた。独立採点では採点例3件で4指標が数値上改善したが,逐次方式では改善しなかった。逐次方式は160名の事前採点後も明確な精度低下を示さず,不一致は指数表記の誤読に集中し,単位換算を伴う等価表現の扱い,複合回答の部分点判定,英語記述の等価性判断でも生じた。

利益相反に関する開示

本研究に関して、開示すべき利益相反はありません。

ダウンロード *前日までの集計結果を表示します

ダウンロード実績データは、公開の翌日以降に作成されます。

引用文献

佐藤桂輔:「大規模言語モデルを用いた物理試験の採点支援システムの実践」,大学の物理教育,印刷中.

渡會兼也,梅田貴士:物理教育73-3(2025)191-194.

田﨑稜,梅田貴士:物理教育73-3(2025)217-218.

G. Kortemeyer:"Toward AI grading of student problem solutions in introductory physics: A feasibility study", Phys. Rev. Phys. Educ. Res. 19(2023)020163-1-20.

G. Kortemeyer, J. Nöhl and D. Onishchuk:"Grading assistance for a handwritten thermodynamics exam using artificial intelligence: An exploratory study", Phys. Rev. Phys. Educ. Res. 20(2024)020144-1-24.

Y. Wei, R. Zhang, J. Zhang, D. Qi and W. Cui:"Research on intelligent grading of physics problems based on large language models", Education Sciences 15-2(2025)116.

T. Wan and Z. Chen:"Exploring generative AI assisted feedback writing for students' written responses to a physics conceptual question with prompt engineering and few-shot learning", Phys. Rev. Phys. Educ. Res. 20(2024)010152-1-13.

A. Milani, V. Franzoni, E. Florindi, A. Omarbekova, G. Bekmanova and B. Yergesh:"When AI Is Fooled: Hidden Risks in LLM-Assisted Grading", Education Sciences 15-11(2025)1419.

Z. Chen and T. Wan:"Grading explanations of problem-solving process and generating feedback using large language models at human-level accuracy", Phys. Rev. Phys. Educ. Res. 21(2025)010126-1-25.

ダウンロード

公開済


投稿日時: 2026-04-17 23:35:43 UTC

公開日時: 2026-05-11 08:02:18 UTC
研究分野
物理学