GPT_ScoreAid~生徒の記述した文章の添削や採点を行うソフトウエア~

1 はじめに

 ChatGPTに代表される生成AIが社会の様々な場面で活用され、生成AIについての認識が大きく変わりつつあります。初期の頃にあった、”なんとなく胡散臭い…”というイメージは影を潜め、自分の仕事の中で、この新しいツールをどのように役立てるのかを考えることが最近のトレンドになりました。
 教育界でも、進取の気性を持った先生は果敢にその活用に挑戦し続けています。また、これまであまり興味を示さなかった先生達の間にも、”もしかしたら役に立つかも…”という認識が広まりつつあり、生成AIは教育界においても着実に浸透してきているように感じます。

 調べ学習で子どもたちの書いたレポートの下書きに、「こんな視点を加えてみたら?」とアドバイスしてくれたり、「ここの表現は、こう書いたらもっと分かりやすいのでは?」と表現を工夫してくれたり、「あなたが述べている○○の考えについて、こんな資料があります。これも加えて主張の根拠を明確にしましょう」といった考えの述べ方を示唆してくれたりと、生成AIの活用場面は、教育においても、本当にいろいろな可能性を秘めているように感じます。

2 学校での生成AIの活用は…

 ”もしかしたら役に立つかも…”と変わりつつある先生方の認識ですが、実際の教育場面や職員室の中の業務という面では、未だ実際の仕事を変えるまでには至っていないというのが本当のところです。
 A.トフラーが富の未来(The Future of Wealth)という著書で述べているように、教育の世界は変化のスピードがとても緩慢です。教員の職員室での業務や授業の電子化への取組も一部の学校を除いて、実にゆっくりと進んでいます。生成AIの利用についても状況は似ていて、これを使わなければならないという決まりはないので、こうしたことが好きな先生や、長けている先生が使っているというのが現在の職員室の風景です。(振り返ってみると、半年前とほとんど変わっていないですね ^^; )
 しかし、私はここ数ヶ月、いろいろな業務に生成AIの一つであるChat-GPTを試してみて、「もはや無縁ということはなく、教育の世界でも生成AIは間違いなくその活用がごく当たり前になる。授業や教員の業務の面でとても大きな変化をもたらす。」ということを強く感じました。

 次節では、そう感じたいくつかの事例を紹介するとともに、「生徒の記述した文章の添削や採点」を素早く行うことができる GPT_ScoreAid という新しいソフトウエアを開発し、生成AIの教育の領域における活用がもっと手軽にできる環境を構築したいと思います。

3 学校での様々な場面での生成AIの活用

(1)記述されたアンケートをまとめる
 私が、教育での生成AIの有効性を強く感じたのは、あるアンケート調査を分析する仕事に携わった時のことでした。これまでのやり方では、アンケートに記述された文章を担当の先生が一つ一つ読んで、その後、それらの文章をいくつかの項目に分類して、結果をまとめていくという作業になります。
 今回、携わった「生徒の外泊についてどう考えるのか」というアンケートでは、賛成、反対、迷っているという3つの選択肢と、その事についての保護者が記述した多くの意見が寄せられました。この記述された意見から個人情報や機密情報などに関わることを注意深く取り除いて、Chat-GPTを使って意見を分類してみることにしました。(注:今回の問い合わせでは、入力した情報がAIに学習されることがないよう、APIを用いるGPT-ScoreAIDを使用して行いました。)

 賛成の方が記述した200件近くの意見をいくつかの項目にまとめるようにAIに伝えると、保護者からの意見は「 1. 子供の成長と社会性の育成に役立つ、2. 親同士の了承と管理の下でならOK、3. 子供の自由を尊重する、4. 信頼関係の構築が図られていれば可とする」といった4つの主張に分類されることが示されました。
 反対の方の意見や、迷っている方の意見も、数分で同じようにまとめることができましたので、今回の試用を通じて、生成AIの持っている学校業務での可能性を強く実感することができました。

 学校でこうした手法を用いることができるようになると、文章を読んでまとめることにかかる作業のコストは大きく低減されます。そして、いくつかの項目に分類されたところを起点として、今後の方針を考えたり、対策を立てたりといった、より問題解決の本質に集中して仕事ができるようになります。

(2)新任の先生が教員として成長する様子を分析する
 教育関係の仕事をしていると、時々新任の先生の指導を担当することがあります。こうした仕事に携わったときには、2~3ヶ月や1年という少し長いスパンでその成長を助言していくのですが、新任の先生が頑張っている姿にも絆され、少し緩い指導や判断をしてしまう事があります。

 そこで、もう少し客観的に、新任の先生の成長や変化を捉えることができないかと考え、分析にAIを使ってみることにしました。
 昨年度は、新任の先生がいる学校に週に1度お邪魔して、その先生の授業や諸活動を観察する仕事に携わりましたので、毎週、その時の様子を観察した記録がありました。4月から7月の1学期の間に書きためた資料は、テキストファイルで72,000字程のボリュームとなりましたが、ここから個人情報や機密情報などを取り除いて、若い先生の成長をAIを使って分析してみました。

プロンプトは次のとおりです。

  • 次の文章は、新採用となった先生の授業や学級での活動の様子を1週間に1度観察した記録です。この記録を読んで、この先生が、4月から7月までの間で、教師としてどのような力を身につけたと思われるか4項目程度にまとめてください。また、次の8月以降の研修では、どのようなことに留意して学んでいくべきか、4項目程度にまとめて助言してください。(この後に、4月~7月までの観察記録をテキストファイルにて入力)

Chat-GPT:この先生が4月から7月までに身につけた力

  1. 授業進行の改善: B先生は授業を円滑に進めるため、様々な工夫を実践し、子供たちの興味や理解を引き出す方法を試みている。例えば、実物投影機を活用したり、クラス内でのペア活動を取り入れるなどのアプローチが見られた。
  2. 子供たちとのコミュニケーション: 授業中や学級運営において、積極的に子供たちに声をかけ、彼らの話を聞き、意見や悩みに注意を払うことで、子供たちとの関係を築き上げる力が向上している。
  3. 安全管理とトラブルへの対応:学級運営において、子供たちの安全を確保し、子供の間に起こったトラブル発生時に適切に対応する方法を学び、実践している。
  4. 教材活用の改善:教科書やその他教材の活用方法について、授業の中で柔軟に取り入れ、子供たちの学習への関心を高めるのに貢献している。

Chat-GPT:今後の研修で留意して学んでいくべきこと

  1. クラス運営のスキルアップ: 騒がしい時や注目を集める時の授業進行技術を含む、効果的なクラスマネジメントの技術。
  2. 評価方法の多様化: 学習の到達度を測る多様な評価方法を学び、子供たちの学習進度や理解度を的確に把握する。
  3. 特別支援教育の理解: 特別支援が必要な子供たちに対する適切な理解と支援策に関する知識。
  4. ICTを活用した教育: さらにICTツールを活用した授業の効果的な展開方法を学ぶことで、より魅力的で理解しやすい授業を目指す。

 返ってきた答えは、私にも確かにそう思えるものでした。特に、「授業の進行の改善」や「教材活用」についての指摘は、私が毎週つけた観察記録からAIが導き出した結論です。私が直感的に新任の先生が「授業がうまくなった」と感じたものを、より具体的な例を挙げて指摘しており、自分の判断の客観性を高めることに役立ちました。

 1年間を通した振り返りはテキストにして190,000字と膨大なものになりました。折角ですから、それも問い合わせて年間の成長を分析してみようと試みました。しかし、さすがにここまで情報量が大きくなると、分析に利用したGPT_ScoreAidというソフトウエアでは回答を得ることができずタイムアウトしてしまいました。今のChat-GPTの最新モデルは、この位のデータでも問題なく読み込めるらしいのですが、やり取りする通信量が莫大になるため、それに伴って、トークンという使用料を算出するための値も高くなり、この問合せはこれ以上は無理せずに控えることにしました。

 この取組から、学校が普段残しているテキストで書かれた様々な記録の中にも、もし必要があれば分析の対象とできることが判ってきました。 
 また、Chat-GPTの利用では、「やりとりするテキストの量」と「そこから得られる情報の価値」をバランス良く判断し扱うことが、実際の運用では大切であることに気づくことができました。

(3)学習した内容を総合的にまとめたレポートの添削
 神奈川県の桐蔭学園中等教育学校で探求科を担当されている郡司直孝先生は、以前、附属函館中学校で研究をご一緒した先生です。郡司先生に、生成AIが授業で本当に活用できるのかどうかを検証する材料について相談をしたところ、彼が以前授業で出題した課題のレポートを資料として提供して下さいました。
 課題は、地理の学習で日本の事をいろいろな視点から学んだ後、それらの学習を踏まえて総合的に日本という国を論述するというものでした。

課題

  • 地理的な視点から見たとき、日本はどのような国であると説明することができますか?「地形」「気候」「人口」「産業」「交通・通信」「自然災害」「資源・エネルギー」の学習を踏まえて論述してください。

 郡司先生から提供いただいた生徒の回答は、1700字を超える立派なレポートとなっていて、どの生徒の論述も素晴らしく、このぐらい歯ごたえのある文章に対して、Chat-GPTは本当に助言できるのだろうかと思いました。そして、それを検証すべく、さっそくプロンプトの作成に取りかかりました。

プロンプト:

  • 「中学校2年生に、「地理的な視点から見たとき、日本はどのような国であると説明することができますか?「地形」「気候」「人口」「産業」「交通・通信」「自然災害」「資源・エネルギー」の学習を踏まえて論述してください。」という問題を出しました。この問題の模範解答は次のとおりです。(注:ここで、郡司先生が書かれた1300字の模範解答を全文読み込ませます)この後、生徒の回答を一つずつ順に読んでもらい、生徒の書いた回答と、模範解答を比較して、生徒の回答が優れている点と改善が必要な点について、それぞれ2点ずつあげてください。

 試行錯誤の末、このようなプロンプトを作って、生徒が書いたレポートを、GPT_ScoreAidを使ってChat-GPTに連続的に問い合わせ、Chat-GPTの分析を得ました。以下では、2人の生徒への助言をみてみましょう。

Student1へのAnswer:
 この生徒の回答を模範解答と比較して、優れている点と改善が必要な点を挙げます。

優れている点

  1. 気候についての詳細な説明: 生徒の回答は、日本が温暖湿潤気候であること、及び各地域の特徴的な気候(北海道の気候、南西諸島の気候など)について具体的に説明している。これは、日本の気候の多様性を理解していることを示しています。
  2. 自然災害対策の具体例: 緊急地震速報やハザードマップについて具体的な説明が加えられており、自然災害に対する日本の対策や仕組みを理解し、そしてそれを正確に伝えることができています。

改善が必要な点

  1. 論理的な構成: 回答全体を通して、模範解答にあるような明確なカテゴリー(地形、気候、人口 etc.)に従って整理されているわけではありません。情報が多岐にわたっており、特に「資源・エネルギー」や「産業」に関する見解が分散しており、トピックごとに整理し、その関連性を明確にする必要があります。この生徒の回答には、日本の地理的特徴や問題点に対する深い理解が示されていますが、論述の構成やデータの使用に関して改善の余地があります。より整理された構造と具体的な事実やデータを用いることで、読み手に対する理解度をさらに高めることができるでしょう

Student2へのAnswer: この生徒の回答も模範解答と比較して評価します。

優れている点

  1. 地理・地形に関する深い説明: 生徒は、日本がプレートの移動によって現在の島国の形になった経緯や、フォッサマグナと日本アルプスの存在に触れることで、日本の地形の成り立ちについて深い理解を示しています。また、扇状地や盆地の特徴を具体的に説明し、それが農業にどのように影響するかを述べている点は、地理に関する具体的な知見を反映しています。
  2. エネルギーと産業の変遷に対する洞察: 生徒は、日本のエネルギー自給率の低さや、時代に応じた発電方法の変遷(水力発電から火力、原子力発電への移行)について詳細に説明しています。また、日本の産業構造がどのように変化してきたか(第一次産業から第三次産業への移行)についても明確に指摘し、これは模範解答にも共通する重要な点です。

改善が必要な点

  1. 情報の組織化: 生徒の回答は、多くの重要な情報を含んでいますが、情報が一部散漫になっている印象を受けます。例えば、気候、地形、人口、産業などのトピックが模範解答のように明瞭に区分けされておらず、全体的な流れがやや追いにくいです。各トピックごとに段落を分け、それぞれの見出しを設けることで、情報の構造を明確にし、読者の理解を深めることができます。
  2. 気候区分の詳細性: 生徒は、日本の気候を大きく3つの気候区分に分けて説明していますが、冬に降水量が多い日本海側の気候や太平洋側の気候など、更に細かな気候の違いについての説明が不足しています。これらの区分は、日本の気候を理解する上で重要であり、特に日本海側と太平洋側で大きく異なる気候の特徴を把握しておくことが、地理的な視点から日本を理解する上で役立ちます。
     生徒の回答は、日本の地形や気候、産業に関する詳細な情報を提供していますが、情報の組織化や気候区分に関する更なる詳細な説明が必要です。全体として、日本の地理的特徴を理解し、説明する努力は認められますが、回答をより効果的にするためには、情報の整理と明確化が求められます。

 2024/01/19に「共通テストを色々な生成AIに解かせてみた」という記事がWebで配信されました。LifePromptさんという方が書かれた記事です。その記事ではChat-GPTは国語や社会(世界史、日本史)の教科で大学の受験生の平均得点を上回る能力を持っていることが示されました。郡司先生から提供された生徒のレポートを読み込み、アドバイスを返してくるChat-GPTをみると、LifePromptさんの指摘は、確かに納得できるように感じました。

 この他にも、例えば「主体的に学習に取り組む態度」を看取るために、いろいろな教科でつくっている振り返りシートの生徒の記述から、

  • t1:生徒が知識や技能を獲得したり、思考力や判断力、表現力を身に付けようと、粘り強い取組を行ったと看取れる記述
  • t2:そのために、自分の学習を調整して、いろいろ工夫して取り組んだことが看取ることができる記述

があれば書き抜いてもらうといった使い方もできそうですし、全国学力学習状況調査で、学校が取り組む自己採点(自校採点)にも、採点の観点をプロンプトにうまく反映させることで活用できる可能性が出てきているように感じています。

4 生徒の記述した文章の添削や採点を効率的に行うGPT_ScoreAid

 実は、前節のChat-GPTの利用例は、多くの方が使っているWebからチャットの形で問い合わせを行ったのではなく、GPT_ScoreAid という新たに私が開発したソフトウエアを使って行いました。Wagner Landgrafさんという方がDelphiというPASCAL言語を使って書いたコードをもとに作成したものです。このプログラムの特徴は、OpenAI社から提供されるAPIキーを使って、Excelに格納した生徒の回答を同じプロンプトで連続的に問い合わせることができる機能を実装しています。

 実は、教育でChat-GPTを使う際には、問い合わせを行う「プロンプト」という、子どもたちの回答をどのように扱って欲しいのか、どのような視点から採点して欲しいのかを伝える指示書をつくるところに大切なポイントがあります。指示書を正しく作るためには、収集した子どもたちの回答や文章へ何度かテストを繰り返して、その有効性を確認し、必要に応じて修正なども加えながら、プロンプトをつくりあげていく必要があります。
 そこで、GPT_ScoreAidには、子どもたちが書いた文章へのプロンプト(解釈の指示)を何度も試したり、作り替えたりする作業が容易に行うことができる機能を持たせました。

 GPT_ScoreAidは、新しい機能が盛り込まれたソフトウエアですので、ここでさらに詳しい説明をしても伝わりきれないところがあると思います。そこで、よりイメージしやすいように、使い方を解説した動画を作成しました。もし、興味を持たれた方は、この記事のリンクをたどって動画をご覧頂き、GPT-ScoreAidが目指している学校での利用場面などについてご理解を深めて下さればと思います。
 GPT_ScoreAidの有効性や活用場面についての検証については、今後、できるだけいろいろな情報を集め、このブログからもお伝えすることができればと思っています。


5 おわりに


 前章でお話しした郡司先生とは、「こうしたツールが出現することによって、生徒の回答をツールを使って採点し、そのまま自分で確認しないで返してしまう先生が出てこないか心配ですね」ということが話題となりました。生成AIは確かに、これまでの学校で使われてきたツールとは明らかに一線を画す革新的なツールです。しかし、使い方を間違ってしまうと、その力もマイナスの方に大きく働いてしまうことが懸念されます。

 子どもを育てる「教育」という営みには、小原国芳が「全人教育」という言葉を提唱したように、知識や認知的なものだけでは足りない大切なものがあります。ガンジーも「7つの大罪」の中で「人格なき教育」という指摘をしていますが、人が人を教え育てていく際に、認知的なものと併せて道徳観や美に対する感性など、人間性や人格といわれる領域に届く大切なものも育て・伝承しているのが教育の本質的な姿といえます。
 私は、将来、生成AIが教育の様々な分野で活用されるようになっても、その核(コア)となる部分では、人としての先生の係わりや営みが必ず残るものと信じています。
 やがて生成AIの助けを借りてアップデートされる、学校での諸活動や諸業務が、本当に大切な教育の本質の部分に、時間と労力を注ぐことができる形に進化していくことを願っています。

6.追録

 この論考の最後に、今回のGPT_ScoreAidの使用について、忙しい教頭先生の働き方改革への利用という視点からの考察を付記します。
 学校で一番忙しいのは教頭先生というのは既に諸調査から明らかになっていますが、その教頭先生の業務を忙しくしているものの一つに、通信簿の所見の確認という作業があります。
 通信簿でのミスは学校の信用を大きく毀損するため、どこの学校でも細心の注意を払って間違いが無いように何度も確認が行われているのが常です。
 通信簿を発行する時期になると、教頭先生や主幹教諭は、本当に目を皿のようにして通信簿の所見や、総合的な学習の時間や道徳などの記述式による評価を確認し、間違いをチェックしています。
 こうした部分にもGPT_ScoreAidは力を発揮してくれるように思います。下書きの段階の所見の文章をExcelに縦に並べて、表現の修正や誤字・脱字などの間違いの訂正を行うことはGPT_ScoreAidの得意とする作業の一つです。特に児童生徒の人数の多い学校では、業務の軽減に劇的な効果を発揮する可能性があります。
 こうした業務で苦労されている学校は、GPT_ScoreAidをぜひ試してみて下さい。

GPT-ScoreAid ver1.0 のダウンロードはこちらです。また、質問や感想等がありましたらフォームはこちらです。

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です