AI東大理3首席超えが示した受験突破後の競争軸と人間の評価軸
ChatGPT 5.2 Thinkingが東大理科3類で503.59点を記録し、合格者最高点453.60点を上回りました。Gemini 3.1 Proも続いた一方、世界史論述や理科三類の面接は別の評価軸です。372人が志願した最難関入試で何が測られ、何がまだ測れないのかを技術と制度の両面から読み解きます。
ChatGPT 5.2 Thinkingが東大理科3類で503.59点を記録し、合格者最高点453.60点を上回りました。Gemini 3.1 Proも続いた一方、世界史論述や理科三類の面接は別の評価軸です。372人が志願した最難関入試で何が測られ、何がまだ測れないのかを技術と制度の両面から読み解きます。
OpenAIのGPT-5.2はAIME 2025で100%、GoogleのGemini 3.1 ProはARC-AGI-2で77.1%を記録。2025年の河合塾協力実験と2026年の東進調査、東大理三の最高点453.6点という公式データを踏まえ、入試でAIが強くなった理由と教育が見直すべき評価軸を解説。