人工智能概述
|
||
文本由单句组成,但不等同于句于的简单叠加。它具有特定的篇章结 构,即文本的各部分之间存在的关系必须能够保证文本语义的连贯。 从语言学角度而言,篇章的结构特征是区分篇章是否完整,区分不同的 体裁形式或语域断定领域中使用的语言的基本原则。通常而言,人们在写作 或组织话语时,对于应采用何种手段,这些手段怎样衔接形成篇章,都会遵 守一些约定的、普通接受的方式,也就是“篇章结构”。 例如:科技语体结构:
REPOrt 报告的目的 取何种方式保证所生成的文本中的每部分都通过一定的方式与整体相关。 目前,描述篇章结构的代表性方法,也就是篇章语法,主要有两种: 框架理论和修辞结构理论。 ·框架理论 第一个明确地引入篇章结构的生成系统是TEXT84。它把篇章结构的基 本组成因素定义为“修辞谓词”。修辞谓词间的排列次序和联接关系是固 定于系统中的。通过这种人为的规定保证文本的连贯性。这种方法没有明确 提出关于文本成分间联接关系的理论。 该系统使用了“框架”.预定义了典型的段落结构,以控制段落中句子 的内容与顺序。框架由一系列的修辞谓词组成、它通过限定输人概念必须包 含的语义内容来选择可填入的概念。其灵活性体现在框架本身是可嵌套的, 以及依据输入概念的要求。部分修辞谓词可被忽略或重复出现。本质上,这 种框架等价于段落模板。规划模块对模板进行选择或通过嵌套动态构造新的 模板,并依据知识库内容对模板空槽进行填充。 |