AI+教育笔记系列(4)_认知篇_案例“AI好老师”智能育人助理

本篇分享的“AI好老师”育人助教系统是北京师范大学,未来教育高精尖创新中心的余胜泉教授团队的科研成果。 参考文献:“AI好老师”智能育人助理系统关键技术 通过阅读本篇文章,读者可以了解AI助教系统的模块构成,主要包括:知识图谱和智能对话系统技术架构以及涉及的AI技术概念。

本篇分享的“AI好老师”育人助教系统是北京师范大学,未来教育高精尖创新中心的余胜泉教授团队的科研成果。

参考文献:“AI好老师”智能育人助理系统关键技术

通过阅读本篇文章,读者可以了解AI助教系统的模块构成,主要包括:知识图谱和智能对话系统技术架构以及涉及的AI技术概念。

【1】需求及核心功能概述

需求概述

实践表明在教学的过程中,教师的“育人”行为,将有助于提升中小学生的主观兴奋感,减低抑郁水平,有效减少攻击性行为和违法行为。但现实情况,教师在育人环节会遇到以下问题:

1. 缺乏体系化全面科学的育人知识的指导 --- 普通老师的育人知识储备不足,遇到问题经常依赖于个人经验,但是现实问题往往会超出老师的个人经验认知。

2. 育人问题解决的复杂性 --- 育人的决策要综合考虑外界环境的多样性和个人内在的个性化,普通教师没有足够的时间和精力去完成对外界环境和个人内在个性的综合分析。

为解决上述问题,“好老师”智能系统具备以下核心功能。

核心功能

1. 领域知识系统化 --- 解决老师没有完整知识体系储备问题

2. 问题分析综合化 --- 系统会结合心理学,教育学,社会学模型基于外部环境,学生内在个性数据,综合分析输出解决方案

3. 智能语音交互 --- 采用对话系统实现语音交互

【2】核心模块介绍

接上文该AI助理的核心模块由两部分组成“知识图谱”和“对话系统”,知识图谱负责领域知识库的搭建以及问题综合分析功能;对话系统负责实现该系统的语音交互的实现。下面分别介绍一下两个模块:

知识图谱概述

知识图谱:通常利用多关系图结构描述真实世界或特定领域各类实体及实体关系的知识库

常规应用领域: 智能搜索,个人智能助理,智能深度问答系统

构建知识图谱三步骤:

(1) 图谱模式定义 --- 定义实体的类型及关系的类型。(此类工作一般由特定的领域专家人工完成)。

(2) 知识获取 --- 从原始数据中利用机器学习的算法来识别图谱模式定义的实体及关系类型的实例。

(3) 知识融合 --- 融合知识获取环节中像冲突的知识实体或实体关系。大致分两种:1. 相同实体在不同数据中被识别为不同实体,比如:名字叫法不一致;

2. 不同实体在图谱在被识别为同一实体,比如:都是“李娜”一个是网球运动员,一个是跳水运运动员。

对话系统概述

对话系统:能够与人进行连贯对话的计算机系统,可以采用文本,语音,图形,触觉,手势及其他方式与人进行交互,常以语音交互为主。

管道模型(pipeline)

语音自动识别(ASR) --- 负责识别用户语音输入变换成文本

自然语言理解(NLU)--- 对用户输入的文本进行语义理解,包括用户意图识别和语义槽填充

对话管理(DM)

对话状态跟踪(DSP)---对当前对话状态信息的表征,通常以语义槽形式表示,同时基于识别的用户意图和语义槽更新对话

对话策略学习(DPL)--- 基于当前状态生成下一步操作

自然语言生成(NLG)--- 主要依据模板或深度生成的模型生成用户可以理解的自然语言文本

从文本到语音(TTS) --- 将自然语言文本转化成语言输出

【3】AI好老师技术架构拆解

构建知识图谱

(1)图谱模式定义

结合实际的育人场景,该系统抽炼三个核心因素作为图谱解决问题的逻辑支撑:“问题行为” , “内部个体特征” 和 “外部环境因素” 。

问题行为 --- 阻碍学生个体身心发展的行为

内部个体特征 --- 学生内部存在的独特特征,人格特征和气质类型

外部环境因素 --- 影响个体成长的外部因素(学校,家庭,社会文化等)

将具体案例,才分出三个核心因素,依据三个核心因素,推演出“问题原因”,“解决策略”以及“理论依据”提供给老师。

(2)知识获取

知识获取是依据定义的图谱模式,从数据中识别实体及关系实例,以填充图谱的数据层。

本研究的知识获取任务建模为基于文本的多分类问题,通过案例的文本描述,确定案例对应的图谱模式和定义的类别。

文本分类问题采用的是深度学习的循环神经网络模型(LSTM),LSTM模型分三个层:输入层,LSTM层,分类层

输入层:利用当前的词嵌入算法,学习词组的语义向量表示,捕捉词组之间语义之间的关系作为LSTM模型的输入特征向量。

LSTM层:描述如何利用层级LSTM模型对案例文本进行语义分析,识别案例描述对应的各类育人问题相关信息。

分类层:基于产生的文档语义向量,利用基于神经网络的多分类器,确定案例描述中的不同因素信息。

(3)知识融合

本案例中,图谱概念名词定义清晰,相互间不存在混淆和常见的知识融合问题。

知识图谱推理机制

推荐机制的核心是:如何用知识图谱定义学生的具体问题

原理: 知识图谱的问题信息对比学生的相关信息,计算相似度;得出他们的匹配度;最终采用穷举法,推荐出学生信息与图谱问题信息匹配度最高的解决对策给用户。

智能对话系统

自然语言理解(NLU) --- 对用户输入的文本进行语义理解

(1)对用户意图的理解(属于分类问题)

(2)针对用户的输入,依据图谱定义的知识结构进行语义槽的填充(属于信息抽取问题)

本案例采用的是:LSTM模型对输入的文本进行语义解析,然后用分类模型和CRF模型对用户意图和语义槽识别标注,进行结果优化。

对话状态跟踪(DSP) ---对当前对话状所处的阶段的表示。

基于LSTM模型更新对话状态

结合3方面信息(1. 上一时刻的系统操作;2. 当前的用户意图 3.相应的语义槽信息)LSTM可以生成当前时刻的对话状态向量。

对话策略学习 (DPL)--- 基于当前状态生成下一步操作

案例采用规则与多分类器结合的模型。

当案例变量为0 --- 输出 “没有找到案例”

当案例变量为1 --- 输出“唯一案例解决方案”

当案例变量>1 --- 基于多分类模型进行决策, 输出概率最大的因素,作为决策方案

自然语言生成(NLG) --- 主要依据模板或深度生成的模型生成用户可以理解的自然语言文本。

彩蛋 --- AI领域三大学派

符号主义学派:人类认知和思维的基本单元是符号,主要基于逻辑推理的方案模拟智能; 相关技术为专家系统,知识图谱

联结主义学派: 人类智能归结为人脑高层活动,利用神经网络及网络间的连接机制与学习算法模拟智能。代表成果为卷积神经网络(CNN)和循环神经网络(RNN)

卷积神经网络用于:图像识别,视频分析等领域

循环神经网络用于:捕捉数据的前后依赖关系,常被用于序列数据的处理

行为主义学派:智能是对外界复杂环境的适应,主要基于“感知-行动”,行为模拟智能。代表的技术是 增强学习,应用与各种决策场景。

0条评论 添加新讨论

登录后参与讨论
Ctrl+Enter 发表