【共通テスト2026】AIが9科目で満点…図形や濃淡に課題 | NewsCafe

【共通テスト2026】AIが9科目で満点…図形や濃淡に課題

子育て・教育 リセマム/教育・受験/高校生
LifePrompt「共通テスト2026を最新版AIに解かせてみた」
LifePrompt「共通テスト2026を最新版AIに解かせてみた」 全 1 枚 拡大写真
 LifePromptは2026年1月、最新の生成AI3モデルに2026年度の大学入学共通テスト全科目を受験させる実験を実施した。9科目で満点を達成したものの、イラスト問題や色の濃淡を読み取る問題では誤答し、視覚情報処理に課題があったという。

 LifePromptは2023年から毎年、最新AIに大学入学共通テスト(以下、共通テスト)を受験させる実験を継続している。2023年は「生成AI」が流行語大賞に選ばれ、2025年には「チャッピー」がノミネートされるなど、AIは3年間で日常生活に深く浸透した。2025年の実験では、AIが東大合格ラインを突破したが、2026年はさらに次元が異なる結果となった。

 今回の実験は、GPT-5.2 Thinking、Gemini 3 Pro、Claude 4.5 Opusの3モデルで行った。英語(リーディング・リスニング)、国語(現代文・古文・漢文)、数学(数学I・A/数学II・B・C)、社会(歴史総合・世界史探究/歴史総合・日本史探究/地理総合・地理探究/公共・政治・経済)、理科(物理・化学)、理科基礎(物理基礎・化学基礎・地学基礎・生物基礎)、情報(情報I)の全科目を対象とした。

 人間によるコピペミスや恣意性を完全に排除するため、同企画専用の自動受験システムを開発し、API経由で試験を実施した。なお、英語リスニングは音声データの直接入力が難しいため、試験センターが公開している「読み上げスクリプト(台本)」をテキストで入力。国語(縦書き)は、事前に外部ツール(NotebookLM)で文字起こししたテキストデータを使用したという。

 全科目の得点結果は、文系・理系ともにGPT-5.2 Thinkingが圧勝した。文系では900点台後半、理系でも同様の高得点を記録し、GeminiとClaudeが900点台前半で激しく競り合う形となった。一方で、解答時間はGeminiとClaudeが1時間40分前後で、試験時間10時間10分の約6分の1という速度で完走したのに対し、GPTは5時間30分程かかり、明暗がくっきり分かれた。

 満点科目は、英語リーディング、国語(現代文)、数学I・A、数学II・B・C、歴史総合・世界史探究、歴史総合・日本史探究、地理総合・地理探究、物理、化学の9科目で達成した。

 一方で、3モデルのAIが共通して間違えた問題が存在した。もっとも多くのモデルがつまずいたのが、「テキストは完璧に理解できているのに、図が選べない」という現象だという。象徴的だったのが、英語リスニングの「バスの乗り方」(問18-21)だ。音声スクリプトでは「後ろから乗って、前から降りる」とはっきり指示されており、すべてのAIが思考ログでこの手順を完璧に書き起こしていた。しかし、いざ選択肢の「バスのイラスト(矢印が前後のドアに向いている図)」を選ぶ段になると、全モデルが誤答した。AIにとって、イラストの微妙な矢印の意味や、空間的な奥行きを論理と結びつけるのは、まだ至難の業のようだ。

 LifePromptは「AI vs 東大受験企画」を始動。「東大理III合格」を成し遂げた2025年に続き、「2年連続合格」を果たすことで、その知性が本物であることを証明するという。

《吹野准》

アクセスランキング

  1. 【中学受験2026】灘中、定員180人に対し282人合格

    【中学受験2026】灘中、定員180人に対し282人合格

  2. EXITりんたろー。近隣住民から決まってかけられる言葉にモヤモヤ 「テレビの評価そんなに低い?」

    EXITりんたろー。近隣住民から決まってかけられる言葉にモヤモヤ 「テレビの評価そんなに低い?」

  3. 【高校受験2026】長崎県公立高、特別選抜の志願倍率…佐世保北3.1倍

    【高校受験2026】長崎県公立高、特別選抜の志願倍率…佐世保北3.1倍

  4. 【共通テスト2026】AIが9科目で満点…図形や濃淡に課題

    【共通テスト2026】AIが9科目で満点…図形や濃淡に課題

  5. 「俺、再婚して子ども産まれたから。もう養育費は無理」元夫から毎月6万円が振込まれなくなった41歳女性。約束したのに、諦めるしかないの?

    「俺、再婚して子ども産まれたから。もう養育費は無理」元夫から毎月6万円が振込まれなくなった41歳女性。約束したのに、諦めるしかないの?

ランキングをもっと見る