第一站 - 轻松上网从此开始!

上网第一站

当前位置: > SEO >

关于语音交互,你不得不知的技术知识(3)

时间:2017-10-17 10:46来源:我来投稿获取授权
以下内容来自网络或网友投稿,www.swdyz.com不承担连带责任,如有侵权问题请联系我删除。投稿如果是首发请注明‘第一站首发’。如果你对本站有什么好的要求或建议。那么都非常感谢你能-联系我|版权认领
该IF的含义为:说话人为c,该句子的意图是提供信息,主题概念为预订房间, 关于 房间的具体信息由一组属性-值对描述:房间类型(room-type)为单人间(si

  该IF的含义为:说话人为“c”,该句子的意图是提供信息,主题概念为“预订房间”,关于“房间”的具体信息由一组“属性-值”对描述:房间类型(room-type)为单人间(single),数量(quantity)为1;“预订”的具体要求通过“相对时间(relative-time)”这一参数描述,参数值取“明天(tomorrow)”。

  2.词汇分类

  据词汇的语义功能,把每个词汇划分到不同的类。其分类依据是词汇在句子中的语义功能,语义功能相同的词汇归为一类,例如,“单人间”和“双人房”属于同一个语义类;“大”和“小”虽然词义不同,但在句子中的语义功能是相同的,所以,把它们也归为一类。

  

关于语音交互,你不得不知的技术知识

  3,语义组块分析

  根据语义组块具体的意义,对语义组块进行了语义分类。例如,所有对时间的表达,“明天”、“后天”、“星期一”、“三天后”等,都归属于时间类语义组块,记作TIME;对房间类型的表达,如“单人间”、“双人间”、“一个人住的房间”、“宽敞的房间”等,都归属于房间类语义组块,记作ROOM_TYPE。

  4,统计解析过程

  手工标注一定数量的语料。对于语料中的每一个句子,首先对它进行语义组块分析,得到该句子对应的组块序列,然后给出该句子的IF语义表示,最后把IF语义表示线性化并且和语义组块序列对齐。用这些语料来对模型的参数进行训练,就得到一个统计解析模型。

  对于一个需要解析的句子,首先对它进行语义组块分析,得到该句子对应的语义组块序列,然后把语义组块序列作为统计解析模型的输入,则解析模型的输出就是输入句子的线性化后的IF框架。

  5,组块解释方法

  在语义组块分析时,通过规则方法获得语义组块的同时,也可以得到语义组块内部的层次结构,但这种层次结构并不是我们所需要的IF表示,因此,我们设计了语义组块解释模块,用来把这种层次结构转换为IF表示。语义组块解释模块是与组块分析模块配合工作的,组块分析过程中用到的每一条规则都对应一个规则的解释方法,利用这些解释方法可以把规则所涉及的词汇解释为相应的IF表示。循环调用生成语义组块的每一条规则所对应的解释子程序,就可以得到该语义组块对应的IF层次表示。

  6,IF的生成

  从上面的介绍可以看出,基于HMM的解析模块输出的结果和语义组块解释的结果都只是IF的片段,只有把它们合并才能得到完整的IF表示。语义组块解释模块把每个语义组块转换为IF片段,同时每个语义组块经过统计解析模块解析后,又对应一个标注符号,并且该标注符号最终要作为IF表示中的一个结点。在各组块合并时,IF生成器把语义组块解释结果作为该结点的子结点,把经过简化处理的concepts序列还原为原来的concepts序列,这样就得到了IF表示。

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发布者资料
第一站编辑 查看详细资料 发送留言 加为好友 用户等级:注册会员 注册时间:2012-05-22 19:05 最后登录:2014-08-08 03:08
栏目列表
推荐内容
分享按鈕