摘要 (参照 Nature 规范)
教科书作为教育的基石,其“一刀切”的媒介形态构成了根本性局限。任何新材料的增补或呈现方式的改变都需要巨大的人力投入,使其无法规模化地适应学习者的个性化需求。传统教育材料的静态本质,限制了其在日益多样化的学习环境中的有效性。我们的目标是利用生成式人工智能(GenAI)从根本上重塑这一范式,创造能够动态适应个体学习者需求、同时保持内容完整性和高质量的教育资源。
在此,我们展示了一种利用GenAI转换和增强教科书的方法论,并构建了一个名为“Learn Your Way”的实验性系统。
该系统通过一个两步生成流程,首先依据学习者的年级水平和个人兴趣对源文本进行个性化重写,随后将其转换为多种互补的表征形式,包括沉浸式文本、音频课程、叙事幻灯片和概念心智图,并嵌入了形成性评估工具。我们对系统的各项功能进行了教学法专家的评估,结果显示其在准确性、参与度和认知负荷等多个维度上均表现出色(综合评分 > 0.90)。
更重要的是,一项随机对照试验(n=60)的结果表明,使用“Learn Your Way”的学生在即时评估(77% vs. 68%, p=0.03)和三天后的记忆保留评估中,其学习成绩显著优于使用标准数字阅读器的对照组。这些发现共同证明,AI增强的个性化和多模态学习体验不仅能提升学习者的参与感和满意度,更能切实有效地提高学习成果。这项工作为在生成式AI时代重新构想教科书这一基础教育媒介提供了坚实的实证基础,预示着一个更加公平、高效和引人入胜的个性化学习新纪元的到来。
引言:挣脱“一刀切”的枷锁
大家好,我们是Google的LearnLM团队。今天,我想和大家分享一段旅程——一段关于如何用AI重新想象和塑造我们这个时代最基础的学习工具:教科书的旅程。
想象一下,教科书就像一张为所有游客绘制的固定地图。无论你是经验丰富的徒步者,还是悠闲的城市漫游者;无论你对历史古迹充满热情,还是只对美食感兴趣,你拿到的都是同一张地图。它准确、可靠,但终究是静态的、普适的。它无法告诉你哪条路风景最美,无法为你规划一条符合你体力的路线,更无法在你迷路时提供实时的引导。这就是传统教科书面临的困境:它是“一刀切”的媒介,为了服务所有人,最终可能无法完美地服务于任何一个人。
图1:从“广播”到“对话”
传统教科书如同一个广播站,向所有不同背景和兴趣的学习者发送相同的信息。而我们的愿景是创造一场个性化的对话,让知识主动适应每一位学习者。
教科书
传统模式 (一对多)
AI引擎
个性化模式 (一对一)
我们团队一直在思考:在生成式AI的浪潮之下,我们能否创造出一种“活的”教科书?一本能够理解你、适应你,并以你最容易接受的方式与你交流的教科书?这不仅仅是把纸质内容搬到屏幕上,而是从根本上重塑学习材料的形态和功能。于是,“Learn Your Way”项目应运而生。我们的核心信念是,学习不应该是一条单行道,而应是一场量身定制的探索。
两大基石:个性化与多重表征
我们的整个系统构建在两大核心的教育学理论之上:个性化 (Personalization) 和 多重表征 (Multiple Representations) 。它们就像我们探索未来教育的“南”与“北”,指引着所有技术的研发方向。
个性化:让知识说你的“语言”
个性化学习的核心在于,将新知识与学习者已有的知识网络连接起来。这就像向一位朋友介绍新朋友,如果你说“这位新朋友和你一样热爱篮球”,他们之间的连接会瞬间建立。我们的AI做的就是这件事。它首先会了解两个关键信息:你的年级水平 和你的个人兴趣 。
然后,AI会像一位经验丰富的翻译,将原始的、略显枯燥的文本,“翻译”成符合你认知水平和兴趣背景的语言。比如,在解释牛顿第三定律时,原始文本可能会用“你踢到脚趾”这个例子。但如果你热爱篮球,AI会为你重写成:“想象你运球,你用力将球拍向地面,地面同样用力将球弹回你的手中。” 这就是作用力与反作用力。这个小小的改动,却能瞬间点燃学习的火花。
动画1:个性化引擎的魔力
点击下方按钮,亲身体验同一段关于“牛顿第三定律”的知识,是如何根据不同兴趣进行实时“翻译”的。
🏀 篮球
🎨 艺术
🎵 音乐
多重表征:从不同角度看同一颗钻石
单一的文本描述就像从一个角度观察一颗钻石,你只能看到它的一个切面。为了全面理解它的璀璨,你需要从不同角度、在不同光线下观察。学习科学中的“双码理论” (Dual Coding Theory) 告诉我们,当信息以语言和视觉等多种形式同时编码时,记忆和理解会更加深刻。
因此,在对文本进行个性化之后,我们的AI会扮演一位“内容创作大师”,将同一核心知识点,创作成多种不同的形态:
沉浸式文本 :这是核心,图文并茂,并嵌入了互动问题。
叙事幻灯片 :像一堂迷你课,提炼要点,配上生动的图片和旁白。
音频课程 :模拟老师和学生之间的对话,用问答形式揭示知识的微妙之处。
心智图 :将知识结构化,让你一目了然地看到各个概念之间的联系,就像一张知识的“地铁图”。
学习者可以根据自己的偏好和需求,在这些形态之间自由切换。想快速了解梗概?看幻灯片。想深入细节?读沉浸式文本。想在通勤路上学习?听音频课程。这种选择的自由,正是我们所说的“Learn Your Way”——以你的方式学习。
动画2:双码理论的力量
大脑通过建立语言和视觉之间的联系来强化记忆。这个动画模拟了当一个概念同时被文字和图像表征时,大脑中建立连接的过程。
🔄 下一个概念
揭秘幕后:两步走的AI生成流程
你可能会好奇,这一切是如何实现的?我们的系统遵循一个清晰的两步生成流程,这保证了内容的质量和相关性。
图2:AI内容生成流程图
从单一的原始文本出发,经过AI的个性化和多重表征转换两道“工序”,最终产出丰富多样的学习材料。
原始文本
第1步: 个性化引擎
(年级 + 兴趣)
个性化文本
第2步: 转换引擎
(多重表征)
幻灯片
音频课程
心智图
沉浸式文本
文本个性化阶段 :我们首先将原始的教材内容输入到我们的核心模型(Gemini 2.5 Pro)中。我们给AI下达明确的指令,比如:“请将这段关于‘市场经济’的文本,改写为适合7年级学生阅读的水平,并融入‘足球’相关的例子。” AI会首先进行文本的“降级”或“升级”,以匹配目标阅读水平,然后巧妙地将“足球转会市场”作为市场经济的案例,替换掉原文中可能较为抽象的例子。
内容转换阶段 :个性化后的文本成为了新的“事实源泉”。我们基于这段新文本,再次调用AI,但这次的指令不同。我们会要求它:“根据这段文字,生成一个5页的幻灯片,包含关键概念、提问和总结。”或者“将这段文字改编成一段老师和学生之间的对话,老师负责讲解,学生负责提问和确认。” 甚至,我们会为图像生成模型(一个为教育场景特别微调过的模型)提供文本片段,生成与个性化内容紧密相关的视觉插图。
这个过程确保了所有生成内容,无论形式如何,都源于同一个经过个性化处理的核心,从而保证了知识的一致性和准确性。
实践是检验真理的唯一标准
一个听起来很酷的系统,如果不能真正帮助学生学习,那它也只是一个华丽的玩具。因此,我们进行了两轮严格的评估。
教学法专家的“火眼金睛”
我们邀请了多位教育领域的专家,对“Learn Your Way”生成的数千份材料(涵盖从历史到物理的10个不同主题)进行全面评估。他们使用的“标尺”是一个包含12个维度的专业教学法量规,比如准确性 、认知负荷 、能否激发好奇心 等等。
结果令人振奋:所有组件的平均分都非常高。例如,“音频课程”和“嵌入式问题”在激发主动学习方面得分最高。专家们认为,AI生成的个性化案例不仅有趣,而且在教学上是恰当的。唯一的“短板”是视觉插图,这反映出即便是最先进的AI,在创作具有精确教学意义的示意图方面仍有挑战——这也是我们未来需要攻克的方向。
真实学生的学习效果:随机对照试验
最关键的考验来自真实的学生。我们在芝加哥地区招募了60名15-18岁的学生,将他们随机分为两组:
实验组 :使用“Learn Your Way”学习一篇关于“青少年大脑发育”的陌生文章。
对照组 :使用标准的PDF阅读器学习同样的文章。
在40分钟的学习后,所有学生都参加了相同的即时测试。三天后,他们又参加了一次记忆保留测试。
结果是决定性的。 无论是在即时测试还是在三天后的记忆测试中,使用“Learn Your Way”的学生得分都显著高于 对照组的学生。这不仅仅是学生们觉得“更有趣”(在随后的调查中,90%的学生认为我们的工具使用起来很愉快,而对照组只有57%),而是他们实实在在地学到了更多,也记住了更多。
“我感觉这个工具真的在为我着想。那些例子都是我喜欢的东西,让我一下子就明白了。” —— 一位参与研究的学生
未来展望:这仅仅是开始
“Learn Your Way”证明了AI增强型教科书的巨大潜力,但这只是冰山一角。我们正站在一个教育新纪元的黎明。未来,我们可以做得更多:
更深度的自适应 :系统可以根据你的答题情况,动态调整后续内容的难度和重点。如果你在某个概念上卡住了,它会为你提供更多的例子和解释。
更丰富的互动形式 :想象一下,你可以和一个AI生成的“苏格拉底”进行对话,或者在虚拟实验室里完成物理实验。
赋能教师 :我们希望将这个工具交到教师手中,让他们可以轻松地为整个班级创建个性化的学习材料,并实时了解每个学生的学习进度和难点。
动画4:自适应学习循环
未来的学习系统将是一个动态的闭环。它会不断地根据你的表现进行调整,为你提供最有效的学习路径。
模拟测验
状态:学习中...
我们的工作表明,通过将尖端的生成式AI技术与坚实的学习科学原理相结合,并由教育专家精心雕琢和评估,我们完全有能力为下一代学习者创造出远超今日想象的学习体验。教科书不再是一本静态的书,而是一位永远耐心、充满智慧、并且真正懂你的个人导师。
附录:技术细节与设计思考
本部分为对技术实现和研究设计感兴趣的读者提供更深入的细节。
系统架构与提示工程
我们的系统后端的核心是Gemini 2.5 Pro模型,它处理了绝大多数的文本生成任务。整个流程可以被视为一个“提示链” (Prompt Chaining)。
第一步:个性化提示。 我们的输入不仅仅是原始文本,还包括一个结构化的元数据对象,例如:`{ grade_level: 7, interest: 'music', source_text: '...' }`。我们的主提示会明确指示模型扮演一个特定的角色,例如:
“你是一位经验丰富的初中科学教师,同时也是一位音乐爱好者。你的任务是将以下科学文本改写,使其在语言上符合七年级学生的理解力,并在解释关键概念时,尽可能使用与音乐(如乐器、节奏、和声)相关的类比和例子。保持原文的核心事实不变。”
这种角色扮演式的提示,能引导模型产生更自然、更具一致性的输出。
第二步:转换提示。 在获得个性化文本后,我们会将其作为输入,用于下游任务。例如,生成幻灯片的提示可能是:
“基于以下文本,创建一个五页的演示幻灯片。每一页应包含一个标题、不超过三个要点,并提出一个引导性问题。为第五页生成一个总结。请以JSON格式输出,结构为 `[{page: 1, title: '...', points: [...], question: '...'}, ...]`。”
请求结构化输出(如JSON)使得我们能轻松地将AI的生成结果解析并渲染到前端UI中。
视觉生成模型的微调
我们发现,通用的文生图模型(Text-to-Image)虽然能生成精美的图片,但往往难以理解“教学示意图”这类需要简化、突出核心逻辑而非追求逼真细节的需求。例如,要求它画一个“细胞结构图”,它可能会生成一张显微镜下的真实细胞照片,而不是带有清晰标注的教科书式图表。
为了解决这个问题,我们收集了一个包含数万张教科书插图、科学图表和教育性示意图的数据集,并对一个基础图像生成模型进行了微调。这使得我们的模型更倾向于生成线条简洁、色彩对比鲜明、易于理解的教育性视觉材料。
动画5:交互式心智图
心智图是组织和理解复杂信息的强大工具。点击节点来展开或折叠知识分支,感受信息是如何层层递进的。
🔄 重置
研究设计与评估量规
在随机对照试验中,我们选择“青少年大脑发育”作为学习材料,主要基于以下几点考虑:
中等熟悉度 :这个主题对大多数高中生来说既不是完全陌生,也不是课程内的核心内容,这有助于减少已有知识带来的干扰。
高相关性 :内容与参与者自身的经历直接相关,能自然地激发学习兴趣。
文本复杂度 :原文包含了一定的专业词汇和复杂概念,为AI的“降级”和“个性化”功能提供了用武之地。
我们的评估量规(见原论文附录B)设计得非常详尽,其目的是超越简单的“对”或“错”。我们关注的是更高层次的教育目标。例如,“加深元认知” (Deepen Metacognition) 维度评估的是内容是否能促使学生反思自己的学习过程。“认知负荷” (Cognitive Load) 维度则评估信息呈现是否清晰、有条理,避免了不必要的复杂性。这些基于成熟学习理论的维度,为我们提供了一个全面、深刻的视角来衡量AI生成内容的真实教学价值。
图3:布鲁姆教育目标分类学
我们的评估不仅仅停留在底层的“记忆”和“理解”,而是旨在通过互动问题和形成性评估,推动学习者向更高层次的“应用”、“分析”和“创造”迈进。
创造 (Create)
评价 (Evaluate)
分析 (Analyze)
应用 (Apply)
理解 (Understand)
记忆 (Remember)