(通讯员:万仟)近日,亚洲必赢国际437刘三女牙教授团队在教育大模型研究方向取得重要进展,创新性提出基于经典教育学理论“经验之塔”的教育大模型塔式构建法,在此基础上设计了多智能体自主驱动的教学场景数据合成框架,为促进教育大模型创新发展提供了一种新颖且有效的技术途径。此外,研究团队成功获批本年度国家自然科学基金重点项目“面向智慧教育的多模态模型构建方法”。
研究成果“COMET: ‘Cone of Experience’ Enhanced Large Multimodal Model for Mathematical Problem Generation”在《中国科学:信息科学》英文版《SCIENCE CHINA Information Sciences》在线发表。数学试题作为重要的知识载体与考核手段,其自动生成技术在教学过程中具有重要的应用价值。传统出题与解题分离的研究路径、单调的微调数据结构以及单一的模型优化目标,限制了数学试题生成模型在教学场景中的应用。该成果从能力互促与应用逻辑出发,在一个大模型上整合了题干生成与题目解析两种能力;提出了一种基于“经验之塔”的三阶段塔式构建框架,以类人学习的视角探索大模型训练过程类比人类学习经历的有效性,通过剖析优秀人类教师的成长历程,将微调数据按照抽象、观察和实践三个层次的经验内涵分别构造,并设计多种精细化的数据形式与注入方法;构建了一个中文多模态数学试题数据集CMM12K,为后续研究提供测评基准。在三个数据集上执行10个模型参与的高达15个测试维度的性能对比:相比开源大模型,所提方法在12个测试维度上达到了当前领域最佳水平。
研究成果“VCR: A ‘Cone of Experience’ Driven Synthetic Data Generation Framework for Mathematical Reasoning”被人工智能国际顶级会议AAAI《The 39th Annual AAAI Conference on Artificial Intelligence》正式接收录用。大语言模型在自然语言处理方面性能出色,但面对数学推理往往存在较大挑战。随着训练模式的逐渐固化,学术界提出以数据为中心的人工智能思想,强调开发更高质量的数据以增强大语言模型性能。现有研究扩展数据集构建面向数学推理的合成数据,进而监督微调大语言模型。这类方法大多关注数量而忽视质量,具有挑战性的样本在数据合成过程中没有得到充分的考虑,导致数据构建成本高、密度低、同质化严重。该成果提出了一种名为Virtual ClassRoom(VCR)的多智能体环境,利用大语言模型驱动多种智能体角色构建高质量、多元化的合成数据。基于“经验之塔”理论,VCR类比人类学习,在数据合成过程中引入三个层次的经验,精心设计了用户友好的指令集和角色扮演系统,使VCR能够自主规划合成数据的规模。该系统实现了包括讲授、研讨、问题设计、问题解决等多种教育场景的自主模拟。多个实验表明VCR生成的合成数据具有更高的质量密度和泛化能力,能够以较小的训练代价提高大语言模型的数学推理性能。
近年来,刘三女牙教授带领研究团队立足“人工智能+教育”国家战略需求和学术前沿,系统化开展教育可计算理论、方法与应用创新研究,在教育研究、Nature Computational Science、C&E、ACM/IEEE Trans,以及AAAI、ACM MM、AIED、WWW等教育科学、信息科学领域的顶刊顶会发表了一系列成果,发展了AI4EduSci教育科学智能新范式、计算教育学新方向以及教育大模型构建新方法,服务于中国特色教育科学知识体系建构与教育强国建设。
SCIENCE CHINA Information Sciences是由中国科学院和国家自然科学基金委员会共同主办的期刊,致力于发表在计算机科学与技术、控制科学与工程、信息与通信工程、微电子与固体电子、量子信息等信息科学领域的高质量、原创成果。该刊是SCI JCR Q1期刊,也是中国计算机学会CCF推荐A类期刊。
AAAI是人工智能促进协会主办的国际顶级人工智能学术会议,旨在推动人工智能科学研究,促进人工智能领域研究人员、从业者、科学家、学生和工程师之间的学术交流,主题包括机器学习、自然语言处理、计算机视觉、数据挖掘、多智能体系统、知识表示和人在回路人工智能等。AAAI是中国计算机学会CCF推荐A类会议。
刘三女牙教授为SCIENCE CHINA Information Sciences与AAAI两篇论文成果的第一作者,万仟博士后、沈筱譞博士后与孙建文教授为论文共同通讯作者,bwi437官网为SCIENCE CHINA Information Sciences论文成果的第一完成单位,以及AAAI论文成果的唯一完成单位。浙江大学为SCIENCE CHINA Information Sciences论文成果的合作完成单位,罗亚威研究员参与该论文的合作研究。研究获得了国家自然科学基金重点项目“面向智慧教育的多模态模型构建方法”、国家自然科学基金重大项目“人工智能赋能教与学的理论与关键技术研究”、新一代人工智能国家科技重大专项项目“面向智慧教育的学习者认知与情感计算研究”等资助。
相关链接:
https://engine.scichina.com/doi/10.1007/s11432-024-4242-0
https://mp.weixin.qq.com/s/vtpeGydR9Nr8gL2-ycrlkw
审读人:左明章