分析:Institution for a Global Society株式会社(大学入学共通テスト×「Ai GROW」データ分析)2026年2月
学校教育の現場では、テストの点数を上げるために「より多くの問題を解く」「もっと暗記する」といったアプローチが中心になりがちです。一方で、近年注目を集めているのが「非認知能力」─つまり、テストでは直接測定しにくいけれども、学びや成長の土台になると考えられている力。具体的には、自分を信じて物事に取り組む力(自己効力感)、課題を見つけて計画を立てる力(課題設定)、困難に粘り強く向き合う力(耐性)、自分の考えを他者に伝える力(表現力)などが含まれます。
こうした力が、実際に大学入学共通テストの結果とどのような関わりをもつのか。この問いに対して、今回、3つの統計手法を用いて多角的な分析を行いました。以前の分析から対象人数やデータも増え、より精度の高い知見が得られています。本記事では、その分析の内容をできるだけ分かりやすくお伝えいたします。
今回の分析は、全国の複数校の高校3年生を対象としています。科目によって受験者数は異なりますが、もっとも多い英語で842名のデータが得られました。使用したデータは大きく2種類あります。1つ目は、大学入学共通テストの各科目の得点です。2つ目は、Institution for a Global Society株式会社(IGS株式会社)が提供する非認知能力のアセスメント「Ai GROW」で測定された、生徒の非認知能力のスコアです。
「Ai GROW」では、生徒同士がお互いの力を評価する「相互評価」の仕組みを取り入れており、表現力や論理的思考などの「コンピテンシー」は、複数の他者からの評価で測定されています。加えて、IAT方式(潜在的な意識を測る手法)を用いた自己効力感や自己肯定感、心理的安全性の変化を測定する「傾向チェック」も用意しています。今回の分析では、コンピテンシー(相互評価)とともに「傾向チェック」のデータを使用。なお、本記事中に登場する「自己効力感(傾向チェック)」はIAT方式による診断の結果、「自己効力」は相互評価によるコンピテンシーのスコアを指しており、両者は異なる測定方法に基づく別の指標です。
また、各コンピテンシーについて、「全期間の平均値」「直近1回の値」「変化の傾き(トレンド)」という3つの集約方法でデータを整理し、どの見方が得点との関連が強いかも分析しています。
今回の大きな特長は、3つの統計手法を組み合わせた多角的な分析を行っている点です。それぞれの手法の概要は以下の通りです。
|
分析手法 |
目的 |
結果の見方 |
|
Ridge回帰(主分析) |
学校やパーソナリティの影響を取り除いた上で、非認知能力がどれだけ得点予測に貢献するかを検証 |
ΔR²(デルタ・アールスクエア)が大きいほど、非認知能力の追加的な予測力が高い |
|
相関分析 |
各非認知能力と各科目得点の相関を一覧で把握 |
相関係数(r)が高いほど、その能力と得点が連動 |
|
決定木分析 |
得点を分ける「分岐ルール」を抽出し、どの能力がどの順番で得点を分けるかを可視化 |
第1分岐の変数が、その科目の成績をもっとも強く左右する非認知能力 |
Ridge回帰とは、多くの変数(ここでは20以上の非認知能力スコア)を同時に扱うときに、予測が不安定になるのを防ぐ工夫を加えた回帰分析の一種です。「決定係数(R²)」は0から1の間の値を取り、1に近いほど「うまく予測できている」ことを意味します。今回はまず「どの学校に通っているか」と「パーソナリティ特性(Big5)」だけで予測したR²を基準線とし、そこに非認知能力を加えたときのR²の上昇分(ΔR²)を評価しています。決定木分析は、「もしこの能力が○○以上なら高得点グループ、以下なら低得点グループ」というように、データを条件分岐で分類していく手法です。結果がフローチャートのように視覚的に分かりやすいのが特長です。
なお、Ridge回帰では「学校」と「Big5」を統制変数として含めていますが、決定木分析では学校変数を含めていません。これは、学校変数を入れるとほぼ確実に第1分岐が学校名になってしまい、「どのコンピテンシーが重要か」という本来の分析目的が埋もれてしまうためです。このため、両手法のR²の値は直接比較できない点にご注意ください。
なお、この分析はあくまで「関連性」の検証です。「非認知能力を上げれば得点が上がる」と断定できるものではなく、「非認知能力が高い生徒は、大学入学共通テストで高い得点を取る傾向にある」という関係性を示すものです。この点は最後まで念頭に置いてお読みください。
Ridge回帰で科目別に分析した結果、非認知能力を追加することで予測精度(R²)がもっとも向上した科目は以下の通りでした。
|
科目 |
人数 |
学校+Big5のみ(R²) |
+非認知能力(R²) |
ΔR² |
MAE(点) |
|
物理 |
282 |
0.131 |
0.226 |
+0.095 |
13.4 |
|
日本史探究 |
214 |
0.032 |
0.074 |
+0.042 |
13.1 |
|
化学 |
331 |
0.146 |
0.185 |
+0.038 |
16.7 |
|
リスニング |
784 |
0.218 |
0.243 |
+0.026 |
13.0 |
|
公共・ 政治経済 |
212 |
0.127 |
0.139 |
+0.012 |
12.3 |
|
国語 |
795 |
0.236 |
0.242 |
+0.006 |
23.6 |
|
リーディング |
788 |
0.323 |
0.326 |
+0.003 |
15.2 |
※MAE(平均絶対誤差)は、モデルで予測した得点と実際の得点のずれの平均。小さいほど予測が正確です。
物理がΔR²=0.095で最大の上乗せ効果を示しました。元々「学校の違い+パーソナリティ」だけでR²=0.131だったところに、非認知能力を追加するとR²=0.226に達しています。続く日本史探究(ΔR²=0.042)、化学(ΔR²=0.038)も理数系・社会系で非認知能力の追加予測力が大きいことが分かります。
一方、国語やリーディングではΔR²がごく小さく、非認知能力を追加しても予測精度はほとんど変わりませんでした。これは非認知能力の影響がないということではなく、これらの科目ではすでに「学校の違い+パーソナリティ」でかなり予測できているため、非認知能力の「追加的な」効果が見えにくくなっている可能性があります。
Ridge回帰の結果から、各科目で非認知能力のスコアが「下位25%の生徒」から「上位25%の生徒」に動いたとき、得点がどれだけ変化するかを推定しました。以下、主要科目ごとの結果を見ていきましょう。
英語合計(n=842)
英語合計では、「外交性(直近値)」が+9.1点と最も大きなインパクトを示しました。続いて「組織へのコミットメント(直近値)」が+7.4点です。相関分析でも「組織へのコミットメント」(r=0.372)、「解決意向」(r=0.337)、「外交性」(r=0.316)が上位を占めています。
「外交性」とは、不慣れな状況でも積極的に人と関わろうとする能力のことです。英語はコミュニケーションの道具ですから、人と関わることに積極的な生徒ほど、英語を「使う」機会を自ら作り出し、それが英語力の向上につながっていると考えられます。また、「組織へのコミットメント」─集団への帰属意識が高い生徒は、チームで課題を解決するような協働的な学びの場で英語を活用する傾向があるのかもしれません。
|
コンピテンシー |
集約方法 |
p25 |
p75 |
得点差(目安) |
|
外交性 |
直近 |
0.639 |
0.778 |
+9.1点 |
|
組織へのコミットメント |
直近 |
0.644 |
0.785 |
+7.4点 |
|
組織へのコミットメント |
平均 |
0.640 |
0.792 |
+7.2点 |
国語(n=795)
国語では「成長(傾き)」が+7.4点と最大のインパクトでした。「成長」とは、いわゆる「成長マインドセット」─「能力は努力によって伸ばせる」という信念のことです。ここでの「傾き」とは、在学期間中にそのスコアがどのように変化したか(上昇トレンドか下降トレンドか)を示す指標です。つまり、成長マインドセットが高まり続けている生徒ほど、国語の得点が高い傾向があるということです。
続いて「地球市民(平均値)」+6.6点、「論理的思考(平均値)」+4.4点が並びます。相関分析でも「地球市民」(r=0.331)、「論理的思考」(r=0.257)、「課題設定」(r=0.255)が上位です。広い視野を持ち、論理的に考え、自ら問いを立てられる生徒ほど国語の成績が高い傾向が見て取れます。
|
コンピテンシー |
集約方法 |
p25 |
p75 |
得点差(目安) |
|
成長 |
傾き |
-0.028 |
0.050 |
+7.4点 |
|
地球市民 |
平均 |
0.585 |
0.748 |
+6.6点 |
|
論理的思考 |
平均 |
0.585 |
0.736 |
+4.4点 |
|
自己肯定感(傾向チェック) |
直近 |
0.168 |
0.520 |
+4.4点 |
物理(ΔR²=0.095、n=282)
物理では「個人的実行力(直近値)」が+3.0点、「柔軟性(平均値)」が+2.2点、「自己効力(平均値)」が+1.9点と、「自分で粘り強く取り組む力」に関連する項目がすべて上位に並びました。物理は公式の暗記だけでは太刀打ちできず、自分で考え、試行錯誤を繰り返す必要がある科目です。「やり抜く力」をもつ生徒ほど、物理の得点が高い傾向にあるという結果は、直感的にも納得しやすいのではないでしょうか。
|
コンピテンシー |
集約方法 |
p25 |
p75 |
得点差(目安) |
|
個人的実行力 |
直近 |
0.566 |
0.753 |
+3.0点 |
|
柔軟性 |
平均 |
0.540 |
0.687 |
+2.2点 |
|
自己効力 |
平均 |
0.528 |
0.711 |
+1.9点 |
|
柔軟性 |
直近 |
0.564 |
0.734 |
+1.6点 |
|
自己効力 |
直近 |
0.544 |
0.745 |
+1.6点 |
日本史探究(ΔR²=0.042、n=214)
日本史探究では「創造性(傾き)」が+2.7点で最大でした。「創造性の傾き」とは、新しい見方や発想を生み出す力がどれだけ伸びているか(トレンド)を示します。また「ヴィジョン(直近値)」が+2.2点と続いています。「ヴィジョン」は将来像の明確さに関する項目で、「なぜ歴史を学ぶのか」という目的意識をもっている生徒ほど、歴史の知識を体系的に理解し、高得点につなげている可能性があります。
|
コンピテンシー |
集約方法 |
p25 |
p75 |
得点差(目安) |
|
創造性 |
傾き |
-0.004 |
0.011 |
+2.7点 |
|
ヴィジョン |
直近 |
0.606 |
0.793 |
+2.2点 |
|
創造性 |
直近 |
0.611 |
0.777 |
+1.8点 |
|
決断力 |
直近 |
0.587 |
0.782 |
+1.6点 |
|
論理的思考 |
平均 |
0.605 |
0.742 |
+1.5点 |
|
表現力 |
平均 |
0.570 |
0.733 |
+1.5点 |
決定木分析では、非認知能力の値に基づいて生徒をグループに分けていき、各グループの平均的な得点を予測します。この手法は、「まず最初にどの能力で分かれるか(第1分岐)」→「次にどの能力で分かれるか(第2分岐)」という形で、得点を左右する要因の優先順位が視覚的に分かるのが利点です。
特筆すべきは、現代文でR²=0.683という極めて高い予測精度が得られたことです。ただし、この値は「過学習」(手元のデータにモデルが過度に適合し、新しいデータに対しては同じ精度が出ない現象)の可能性を含んでいる点に留意が必要です。交差検証(データを分割して検証する手法)は実施されていますが、データ数が限られているため、新たなデータに対して同水準の予測精度が再現されるとは限りません。以下、主な科目の決定木の結果をご紹介いたします。
|
科目 |
人数 |
R² |
MAE |
第1分岐の変数 |
|
現代文 |
341 |
0.683 |
13.1 |
自己効力感 (傾向チェック・直近) |
|
古文 |
292 |
0.543 |
11.5 |
ヴィジョン(平均) |
|
リーディング |
788 |
0.309 |
15.0 |
誠実さ(平均) |
|
化学 |
331 |
0.273 |
15.2 |
論理的思考(平均) |
|
リスニング |
784 |
0.224 |
13.0 |
誠実さ(平均) |
|
英語合計 |
842 |
0.215 |
27.8 |
誠実さ(平均) |
|
国語 |
795 |
0.198 |
23.8 |
課題設定(平均) |
|
物理 |
282 |
0.174 |
13.8 |
論理的思考(平均) |
現代文(R²=0.683):「自己効力感」が最大の分水嶺
現代文の決定木では、「自己効力感(直近値)」が第1分岐を占めました。自己効力感のスコアが一定値以下の生徒群は約17〜24点にとどまるのに対し、それを超える生徒群は約28〜78点と大きな差が開きます。さらに高得点グループの中では「自己効力感(平均値)」と「論理的思考(直近値)」で分岐が続き、両方が高い生徒は約78点に達します。
「自己効力感(傾向チェック)」とは、自己報告型の診断で測定される「自分はやればできる」という感覚です。現代文は難解なテキストに向き合い、筆者の主張を読み解く必要があります。途中で投げ出さずに粘り強く取り組む姿勢─それを支えるのが自己効力感であり、そこに論理的に文章を分析する力が加わることで高得点に結び付く、という構図が浮かび上がります。ただし前述の通り、R²=0.683という値には過学習の可能性が含まれており、新たなデータで同水準の精度が再現されるとは限りません。「自己効力感が現代文の成績と関連する傾向がある」という方向性の示唆として受け止めるのが適切です。
英語(R²=0.215〜0.309):「誠実さ」がすべての第1分岐
英語合計・リーディング・リスニングのいずれにおいても、決定木の第1分岐は「誠実さ(平均値)」でした。「誠実さ」とは、コツコツと地道に努力する姿勢のことです。英語合計を例にとると、誠実さのスコアが0.674以下の生徒群は71〜118点にとどまりますが、0.674を超える生徒群は136〜162点と大幅に高くなっています。
興味深いのは、Ridge回帰では「外交性」や「組織へのコミットメント」が英語のインパクト上位だったのに対し、決定木では「誠実さ」が最初の分岐を占めている点です。これは2つの手法が異なる側面を捉えていることを意味します。英語力の土台には「日々コツコツと学ぶ誠実さ」があり、その上で「人と積極的に関わって英語を使う外交性」が加わることで、さらに得点が伸びるという解釈ができます。
理数系:「論理的思考」が最初のゲート
化学(R²=0.273)と物理(R²=0.174)の決定木では、いずれも「論理的思考(平均値)」が第1分岐です。化学では、論理的思考のスコアが0.669以下の生徒群は約41点にとどまるのに対し、0.671以上の生徒群は約52〜81点と大きな差が出ています。Ridge回帰で物理の上位に入った「個人的実行力」や「柔軟性」は、決定木では第2分岐以降に登場しています。つまり理数系では「まず論理的に考える力、その上で柔軟に思考を広げる力」という順序が重要であることが示唆されました。
古文(R²=0.543):「ヴィジョン」と「論理的思考」
古文の決定木では「ヴィジョン(平均値)」が第1分岐、「論理的思考(平均値)」が第2分岐を占めました。ただし、古文の決定木には注意点があります。第1分岐の「ヴィジョン」は、スコアが0.629と0.630という極めて狭い帯域で高得点グループと中得点グループを分けており、ヴィジョンが低い方が高得点という、一般的な解釈とは逆方向の結果が出ています。これは「過学習」─手元のデータのノイズ(偶然の偏り)をモデルが拾ってしまい、実態を反映していない分岐が生じている可能性が高いと考えられます。古文のR²=0.543という高い値も、現代文と同様に過学習の影響を含んでいる可能性があり、新しいデータで再現されるかは慎重に見る必要があります。第2分岐の「論理的思考」については、古文の文法・構文を論理的に解析する力と関連していると考えられますが、こちらも同様の留保が必要です。
3つの分析手法の結果を総合すると、いくつかの横断的なパターンが見えてきます。
第1に、「平均値」が「直近値」よりも得点との関連が強い傾向があることです。これは多くの科目・多くの非認知能力項目で共通して観察されたパターンです。「最後に急に頑張った」生徒よりも、「最初からずっと高いレベルを維持していた」生徒の方が得点が高い傾向にあるということで、早い時期からの非認知能力育成の重要性を示唆しています。
第2に、「傾き(トレンド)」が重要な科目があることです。国語では「成長の傾き」が+7.4点と科目内最大のインパクトを示し、日本史探究でも「創造性の傾き」が+2.7点で最大でした。「今の値」だけでなく「伸びているかどうか」が得点と関連しているという発見は、非認知能力の「変化」を追跡することの意義を裏付けています。
第3に、手法によって「重要」と判定される非認知能力が異なる場合があることです。たとえば英語では、Ridge回帰では「外交性」と「組織へのコミットメント」が上位でしたが、決定木では「誠実さ」が第1分岐でした。これは矛盾ではなく、それぞれの手法が異なる角度から「得点との関連」を捉えているためです。1つの手法に頼らず、複数の手法を組み合わせることで、より立体的な理解が得られます。