该IF的含义为:说话人为“c”,该句子的意图是提供信息,主题概念为“预订房间”,关于“房间”的具体信息由一组“属性-值”对描述:房间类型(room-type)为单人间(single),数量(quantity)为1;“预订”的具体要求通过“相对时间(relative-time)”这一参数描述,参数值取“明天(tomorrow)”。 2.词汇分类 据词汇的语义功能,把每个词汇划分到不同的类。其分类依据是词汇在句子中的语义功能,语义功能相同的词汇归为一类,例如,“单人间”和“双人房”属于同一个语义类;“大”和“小”虽然词义不同,但在句子中的语义功能是相同的,所以,把它们也归为一类。
3,语义组块分析 根据语义组块具体的意义,对语义组块进行了语义分类。例如,所有对时间的表达,“明天”、“后天”、“星期一”、“三天后”等,都归属于时间类语义组块,记作TIME;对房间类型的表达,如“单人间”、“双人间”、“一个人住的房间”、“宽敞的房间”等,都归属于房间类语义组块,记作ROOM_TYPE。 4,统计解析过程 手工标注一定数量的语料。对于语料中的每一个句子,首先对它进行语义组块分析,得到该句子对应的组块序列,然后给出该句子的IF语义表示,最后把IF语义表示线性化并且和语义组块序列对齐。用这些语料来对模型的参数进行训练,就得到一个统计解析模型。 对于一个需要解析的句子,首先对它进行语义组块分析,得到该句子对应的语义组块序列,然后把语义组块序列作为统计解析模型的输入,则解析模型的输出就是输入句子的线性化后的IF框架。 5,组块解释方法 在语义组块分析时,通过规则方法获得语义组块的同时,也可以得到语义组块内部的层次结构,但这种层次结构并不是我们所需要的IF表示,因此,我们设计了语义组块解释模块,用来把这种层次结构转换为IF表示。语义组块解释模块是与组块分析模块配合工作的,组块分析过程中用到的每一条规则都对应一个规则的解释方法,利用这些解释方法可以把规则所涉及的词汇解释为相应的IF表示。循环调用生成语义组块的每一条规则所对应的解释子程序,就可以得到该语义组块对应的IF层次表示。 6,IF的生成 从上面的介绍可以看出,基于HMM的解析模块输出的结果和语义组块解释的结果都只是IF的片段,只有把它们合并才能得到完整的IF表示。语义组块解释模块把每个语义组块转换为IF片段,同时每个语义组块经过统计解析模块解析后,又对应一个标注符号,并且该标注符号最终要作为IF表示中的一个结点。在各组块合并时,IF生成器把语义组块解释结果作为该结点的子结点,把经过简化处理的concepts序列还原为原来的concepts序列,这样就得到了IF表示。 (责任编辑:admin) |