《人类经验与AI算法的镜像之旅》
该报告由浙江大学陈静远撰写,围绕人类语言理解、AI 语言处理、大语言模型和推理模型展开,并探讨了 AI 在教育领域的应用,呈现了人类经验与 AI 算法的关联及 AI 的发展与影响。
人类语言理解机制:语言对人类意义重大,它赋予人类秩序、是思维和合作的关键。人类理解语言基于对词语的理解和词语间关联关系的把握,并且在解译语言时高度依赖语境 。
AI 的语言理解发展:计算机依靠数字化处理信息,但理解人类语言存在困难。词向量模型曾面临多义词和上下文依赖的问题,大语言模型借助 Transformer 架构和注意力机制解决了这些难题,能够为每个词生成上下文相关的词向量 。大语言模型通过类似文字接龙的方式,依据内部参数和训练数据预测下一个词的概率来生成回答,其参数在大量数据训练中不断优化 。
DeepSeek-V3 大语言模型解析:它有多种配置,训练需经过预训练、指令微调、奖励建模和强化学习等阶段 。在预训练阶段,模型通过完形填空式的自监督学习,在海量多样语料库上优化参数,形成基座模型;指令微调阶段借助少量高质量样本优化模型以执行任务指令;奖励建模和强化学习则利用基于人类反馈的强化学习方法,使模型生成更符合人类偏好的文本 。
DeepSeek-R1 推理模型探究:推理模型能处理复杂推理任务,其推导过程可显式或隐式呈现 。DeepSeek-R1 的训练包括纯强化学习的 R1-Zero 阶段,该阶段学会通过更多思考解决问题,但存在可读性差等缺陷 。之后通过有监督微调和强化学习改进,还利用模型蒸馏提升小规模模型效果,在多个测试中表现出色 。
AI 在教育领域的应用前景:AI 在教育领域应用广泛,如 DeepSeek 结合其他工具可自动生成 PPT、辅助编程、实现英语课堂智能管理、生成图片等 。通过构建苏格拉底式教学智能体,能推动教育从知识本位向能力本位转变,培养学生批判性思维和自主学习能力 。
