来源|多知
作者|Sally
高考这几天,为了防止作弊,多个AI聊天助手主动关闭了识图功能或关闭了“拍题解答”功能。现在,2025年高考结束,可以测试大模型推理能力进展了。
学而思旗下九章大模型针对2025年高考数学全国卷(Ⅰ卷、Ⅱ卷)的选择题和填空题进行自测,结果显示:在Ⅰ卷的14道选择填空题中,九章大模型答对12道;在Ⅱ卷的14道选择填空题中,全部正确。
据了解,测试聚焦于选择题和填空题,这两类题型有明确的客观答案,便于评估AI的准确率;而解答题、证明题涉及步骤分、逻辑表述等主观评分因素,对于AI输出结果的判断存在差异,因此未纳入本次测试范围。
在高考中,数学是最能体现大模型推理能力的学科。此次评测可以看到,教育垂类大模型在正确率和解题规范方面占据优势,相比去年已经有了较大的进步。
对于学生的成长来说,学习之外,心理健康尤为重要。九章大模型在这两方面持续精进。
高考季,好未来旗下九章爱学App(原九章答疑APP)宣布,依托自研九章大模型技术,将持续为青少年提供“学习辅导+心理疏导”双重服务,希望通过“小思聊聊”功能免费为考生提供更多心理支持。
01 教育垂类大模型更重视正确率和解题规范
整体情况如图,在两套全国试卷中的28道选择题中,九章大模型做错了全国Ⅰ卷的6、9两题,在共28道主观题当中,共做对26题,整体正确率约93%。

单选、多选的最后一题一般为该题型下最难的题目,大模型也完成了思考和计算,给出正确答案:


值得注意的是,以文本输出见长的大模型,在面对数学公式、特殊符号的表达时,往往会采用"代偿性表述"——例如用"a的平方加b的平方"代替"a²+b²"。而九章大模型作为教育垂类专用模型,其训练数据中包含了大量教材、教辅资料的专业表达,使得它在输出时能直接使用数学符号。
九章大模型在解答后还会附加“考点分析”和“易错点提示”,这种结合知识图谱的结构化输出,更接近学生和老师使用大模型辅助学习的真实场景。
在业内人士看来,目前大模型在限定领域的客观题上表现优秀,但在开放性、创造性题目上仍有很大空间。现阶段AI赋能教育的体现,更多是在对老师的教学辅助和对学生的个性化学习和心理辅导上。
02 九章爱学App“小思聊聊”功能关注青少年心理健康
大模型之外,好未来将更多细节方面的功能设计在各个产品应用当中。如九章爱学App,集“学习辅导和心理关怀”于一体,且专门针对青少年。
在九章爱学App,用户通过“小思”聊天入口,点击“开始聊天”,即可展开对话。九章爱学App的心理支持并非阶段性功能叠加,而是融入日常使用的自然陪伴。例如学生在刷题间隙问及“总担心考砸怎么办”,AI会结合其近期学情数据生成个性化疏导方案,例如“抱抱你,其实你已经做得很好了。数学成绩波动是查漏补缺的信号,不要担心”。
九章爱学APP相关负责人表示,“希望通过‘小思聊聊’功能将专业心理知识与AI技术结合,为青少年提供‘触手可及的心理支持’。这有望成为学校心理健康服务的重要补充。”
一本书洞察教育行业全貌,《教育科技这一年:教育+AI新纪元》火热销售中从业者必入,点击小程序购买⬇
扫码加入多知新书交流群,共同探讨教育+AI的未来