说明:收录全网最新的团体标准 提供单次或批量下载
UDC, 681.3 : 651.2 L 74 中华人民共和国国家标准 GB/T 14814- 93 信息处理 文本和办公系统 标准通用置标语言(SGML) Information processing-Text and office systems Standard generalized markup language(SGML ) 1993-12-24 发布 1994-08-01实施 国家技术蓝督局 電发布 中华人民共和国国家标准 信息处理文本和办公系统 GB/T 14814 93 标准通用置标语言(SGML) Information processing-Text and office systems Standard gener alized markup language(SGML) (SGML)》及修正1-1988。 0引言 本标准规定了一种用于文件表示的语言,称之为"标准通用置标语言"(SGML)。就其最广泛的定义 而言,可以将SGML用于排版,其范围包括从传统的单一媒体数据的排版直到多媒体数据的排版。此 外,也可以将SGML用于办公文件的处理,以满足人们阅读和在排版系统之间进行文件交换的需要。 0.1背景 可以抽象地将文件看成是由多种类型的元素组成的一种结构。例如,作者可以将若干章组成一本 书,每章中又含有段落和附有文字性注解的插图。又如,编辑人员可以将若干篇文章编成一本刊物,而每 篇文章中又可以含有若干段,段中又可以含有文字,等等。 处理程序采用不同的方法来处理上述这些元素。例如,格式化程序就可用醒目的字体打印标题,在 段首或各段之间留空,这就从视觉上将文件的结构和属性展示给了读者。而当为信息检索系统建立标题 字典时,则可能对标题中的文字赋予特别的含义。 虽然在文件的属性与其处理之间的这种联系现在看来是清晰的,然而就早期的文本处理方法而言, 这种联系是模糊的。在自动化排版出现之前,编辑人员先使用特殊的处理指令对底稿进行"置标",然后 再由排版工人按照这些指令排出所要的格式。指令和文件结构之间的所有联系完全存在于编辑人员的 脑中。 早期计算机排版继承了上述方法,用与处理相关的置标"加入计算机可读的文件卷中。虽然加入的 置标依然由特定的处理指令组成,但这些处理指令采用的是格式化程序的语言,而不是排版工人使用的 语言。然而,这种文卷如果不改变其中的全部置标,就很难再用于其他不同的目的或不同的计算机系统 中。 随着用户水平日益提高及文本处理程序功能日益增强,人们开发出许多解决上述问题的方法。例 如,使用"宏调用"(或格式调用")将文件中需要处理的地方标识出来,而将实际的处理指令放在文件外 部的"过程"之中(或"宏定义"或"存储格式"之中),这样就能够比较容易地对它们进行修改。 虽然可以将宏调用放在文件中的任意位置上,但是用户开始逐步认识到大部分宏调用都是放在文 件元素的开头或结尾处。于是,很自然地选择表示元素类型的"通用标识符"来命名这些宏调用,而不是 用特定处理的名字命名(例如,用"heading"代替"format一17",即用"标题"代替"格式17"),这是实行" 通用编码"(或"通用化的标记")的开始。 通用编码使自动文本处理系统迈出重要的一步,它反映了文件属性与处理之间的自然关系。七十年 代初,"通用置标语言"的出现为通用编码技术提供了一种形式化语言的基础,从而进一步推动了这种发 国家技术监督局1993-12-24批准 1994-08-01实施 1 GB/T 14814—93 展趋势。通用置标语言主要遵循以下两条原则: a.描述性置标起主要作用,并与处理指令相区别。 描述性置标包括通用标识符和文件元素的其他属性,它们可调用处理指令。处理指令可用任何语言 表示,并且常被汇集在文件外部的过程中。 当为了发现置标而扫描源文卷并识别出各种元素后,处理系统执行与每个元素和属性相关的过程。 若用其他处理系统,同样的元素及属性可与不同的过程相关联,而不必改变文件的置标。 当需要直接将处理指令放入文件中时,它的定界不同于描述性置标,这样可以容易地使不同的处理 系统找到并修改。 b.对每种文件类型都形式化地定义其置标。 通用置标语言用加入”文件类型定义"的做法使文件置标形式化。类型定义包括哪些元素和属性可 以在文件中出现并以何种顺序出现等方面的说明(类似于形式文法)。根据这些信息可以确定对某一文 件的置标是否正确(即是否与类型定义相符合),还能提供被漏掉的置标,因为可从其他置标中准确地作 出推断。 注:对通用编码和标准通用置标语言概念的更加详细的介绍参见附录A(参考件)。 0.2目标 标准通用置标语言对通用编码和通用置标概念的应用进行标准化。它为描述用户选定的内容提供 了一种清晰的且无歧义的语法。该语言包括: 一一用于文件元素的描述性置标的"抽象语法"; 一一将抽象语法与特定的定界符字符和数量相结合的"基准具体语法"。用户可定义变异的具体语 法以满足自己的需要; 一一置标声明,允许用户针对不同的文件类型定义通用标识符和属性的特定词汇; 一一对任意数据内容的规定。在通用置标中,"数据"是指未用置标语言定义的内容,包括特定的并 格式化文本或图形等; 一一实体引用:为了引用文件的主数据流之外的内容(如:分开编写的章节、临时补入的字符、照片 等)而采取的一种非系统特定的技术; 一一将处理指令与描述性置标相互区别用的专用定界符。对于那些不能由过程来处理的情况,需要 时可以插入处理指令,但当文件送到另一个处理系统时,又能很容易地找到并修改这些处理指 令。 然而,为使通用置标语言成为一种可以接受的标准,还需要更多的功能。为了满足在复杂环境中使 用该语言所需的各种约束条件,该语言还必须具有元语言的特征。现将主要约束条件,以及标准通用置 标语言用以满足这些约束条件的方法总结如下: a.该语言"置标"的文件必须能被广泛使用的文本处理系统和文字处理系统所接受。 具有全部可选特征的完整语言为高级系统提供了可以利用的通用性和灵活性;而功能较弱的系统 可以不支持这些特征。为了便于在不同的系统之间进行文件交换,可用"SGML声明"描述文件中使用 的所有置标特征或具体语法的变异。 b.必须支持现有的大量正文输入设备。 用基准具体语法的SGML文件,没有机器帮助也能易于被人们键入和理解。因此: 一一SGML的使用并不需要等到开发出新一代硬件,只需要能在现有机器上处理文件的软件; 易。 c. 由于可在不同的设备上键入文件,因而该语言必须不依赖于任何字符集。 该语言不依赖于某一特定字符集。如果一个字符集中含有以位组形式表示的字母、数字、空格以及 2 GB/T 14814-93 定界符等字符,那么该字符集就是可以接受的。 d.必须具有相对于处理程序、系统或设备的独立性。 由于通用置标主要是描述性的,因而它在本质上就具有这种独立性。又由于偶然出现的处理指令都 被特别加以定界,所以当不同的处理程序要放弃与其不相关的指令或要进行文件交换时,就可以查找出 这些指令,并对其进行转换。 对文件外部部分的引用是间接的。对实际系统存储的映射是由出现在文件开头部分中的"外部实体 声明"实现的,故在文件交换时,能很容易对它们修改。 可以通过SGML声明来改变具体语法,以适应任何保留的系统字符。 e。必须没有任何民族语言偏向。 可以用任何特定民族语言中的字符来扩充用于命名的字符。描述性置标中使用的通用标识符、属性 名、以及其他名字都由用户在元素和实体声明中定义。 置标声明中使用的声明的名字和关键字也都可以改变。 就象在多语种文件中使用的那样,也支持多种字符表。 f.该语言必须适应人们熟悉的有关打字机和文字处理程序方面的习惯。 用"便捷引用"和"数据标记"性能支持打字机文本输入方面的习惯。对于含有段和引文的常规文本 可按照SGML解释,尽管没有键入看得见的置标。 g.该语言必须不依赖于任何特定的数据流或物理文卷的组织。 置标语言采用的是虚拟存储模型,其中文件由一个或多个存储实体组成,而每个存储实体又是一个 字符序列。对于所有实际文卷的访问都由处理系统完成。处理系统确定是否将字符序列看成是连续的, 或确定字符序列是否表示物理记录的边界。 h."已置标"的正文必须与其他数据共存。 只要能够确定出文本的开头和结尾,那么处理系统就能够使符合本标准的文本出现在带有其他内 容的数据流之中。 类似地,系统可以允许未被SGML定义的数据内容出现在符合本标准的文件之中。为了便于交换, 这类数据的出现由置标声明指明。 i.置标对人和程序均是可用的。 标准通用置标语言的目的是不需要预处理程序就能成为键盘输入和交换的合适接口。为了适应用 户在文本输入方面的习惯及经验,以及各种类型的键盘和显示设备的要求,允许对语言进行广泛的剪 裁。 然而,人们认识到许多实现者都将试图利用通用置标语言在信息获取能力上的长处,以提供智能编 辑或从文字处理前端环境中建立SGML文件的功能。通过提供下述功能将使SGML能够满足上述这 些应用: 一一元素内容可以和置标分开存储; 一一控制字符可以作为定界符使用; 一一文件中允许出现数据表示的混合模式; 一支持多重并发逻辑结构和版面结构。 0.3组织 本标准的内容组织如下: a.实体结构方式的SGML文件的物理组织,在第6章说明; b.元素结构方式的SGML文件的逻辑组织和采用描述性置标的表示法,在第7章说明; c. 处理指令在第8章讨论; d. 公用置标构件,如字符、实体引用、以及处理指令在第9章说明; e. 具有通用性的置标说明(注释、实体、以及特殊标出节)在第10章说明; 3 GB/T14814-93 f

.pdf文档 GB-T 14814-1993 信息处理 文本和办公系统 标准通用置标语言(SGML)

文档预览
中文文档 5 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共5页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 14814-1993 信息处理  文本和办公系统  标准通用置标语言(SGML) 第 1 页 GB-T 14814-1993 信息处理  文本和办公系统  标准通用置标语言(SGML) 第 2 页 GB-T 14814-1993 信息处理  文本和办公系统  标准通用置标语言(SGML) 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2026-01-05 02:41:28上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。