ICS35.240.30 CCS L 67 中华人民共和国国家标准 GB/T20092.3—2022 部分代替GB/T20092—2013 中文新闻信息内容 第3部分:数据交换的XML格式 Chinese news information content- Part 3:XML format for data exchange 2022-10-12实施 2022-10-12发布 国家市场监督管理总局 发布 国家标准化管理委员会 GB/T20092.3—2022 目 次 前言 引言 1范围 2 规范性引用文件 3 术语和定义 缩略语 规则和约定 5 5.1 XMLSchema格式定义 5.2 拼写规则 5.3 元素表达及描述要求 5.4 XML组件的命名 5.5 XMLSchema的版本和变更约定 5.6 编码方式 6 公共结构和基本数据类型 6.1 目标命名空间声明 6.2 基本简单类型 6.3 公共结构类型 6.4 复杂元数据项类型 16 6.5 元数据相关的Schema定义 68 7关系机制 63 7.1 关系概述· 63 7.2 关系定义 64 受控词描述机制 69 8.1 概述和分析 69 8.2 受控词表的建模 70 8.3 受控词引用的建模 81 8.4 受控词表的例子 83 9 数字签名 86 9.1 概述 86 9.2 元数据描述 9.3 数字签名样例· 88 10 文档层 93 10.1 概述 93 10.2 CNML元素(<CNML) 94 10.3 词表编目结构 95 1 GB/T20092.3—2022 10.4 信封结构 97 10.5 稿件容器 129 10.6 稿件关系容器 143 11 稿件层 146 11.1 稿件层定义 146 11.2 稿件层结构 147 11.3 稿件层元数据组 153 12内容项层 252 12.1 内容项层结构 252 12.2 内容项层实体内容 255 12.3 内容项层元数据组 267 13 内联智能标记 331 13.1 概述 331 13.2 内联智能标记的命名空间 331 13.3 规范说明 331 13.4 内联智能标记类型(cim:IntelligentMarkupType) 331 附录A(规范性) XMLSchema 341 附录B(资料性) 应用实例 419 附录C(资料性) 类继承总图 445 附录D(规范性) 内联智能标记XML,Schema 446 参考文献· 449 GB/T20092.3—2022 前言 起草。 本文件是GB/T20092《中文新闻信息内容》的第3部分。GB/T20092已经发布了以下部分: 一第1部分:概念模型; 一第2部分:新闻元数据; 一第3部分:数据交换的XML格式。 本文件代替GB/T20092一2013《中文新闻信息置标语言》中的第5章“规则和约定”、第7章 “CNML公共结构和基本数据类型”、第8章“CNML的关系机制”、第9章“受控词描述机制”、第1O章 “数字签名”、第11章“CNML文档层结构”、第12章“CNML稿件层”、第13章“CNML内容项层”、第 14章“CNML内联智能标记”,附录A(资料性附录)“CNML应用实例”、附录B(资料性附录)“CNML 标准元素中英文对照表”、附录C(资料性附录)“CNML类继承总图”、附录E(规范性附录)“CNML 构调整和编辑性改动外,主要技术变化如下: a) 增加了“XMLSchema格式定义”(见5.1)和"编码方式”(见5.6); 删除了有关“CNML”的词语(见2013年版的第6章、第10章、第11章、第12章、第13章等); c) 更改了“视音频内容项元数据组类型"的部分内容(见12.3.4.5,2013年版的13.3.4.5、13.4.4.6); 删除了“CNML标准元素中英文对照表”(见2013年版的附录B)。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任 本文件由全国中文新闻信息标准化技术委员会(SAC/TC352)提出并归口。 本文件起草单位:新华通讯社、清华大学、国家应用软件产品质量检验检测中心、北京中联合超高清 协同技术中心有限公司、北京北大方正电子有限公司、中国科学院计算机网络信息中心、北京智途云天 科技有限公司、视觉(中国)文化发展股份有限公司、北京北科光大信息技术股份有限公司、中国人民大 学、中国传媒天学、中国大百科全书出版社有限公司、杭州前方信息技术有限公司、东南大学、新华网股 份有限公司、中国互联网新闻中心、南方报业传媒集团、重庆日报报业集团、青苹果数据中心有限公司、 北京中科大洋科技发展股份有限公司。 本文件主要起草人:武国卫、黄菁、张鹏、王威、王付生、朱建波、朱艳华、丁峰、王骏清、王垫越、许向东、 陈锐、张弛、曹学军、刘方福、杨鹏、杨滇、王建平、何昆、张晓伟、张晴、付蓉、路海燕、张贤良 本文件所代替文件的历次版本发布情况为: 一2006年首次发布为GB/T20092一2006,2013年第一次修订; 一本次为第二次修订。 II GB/T20092.3—2022 引言 GB/T20092一2013自发布实施以来,已在很多新闻媒体单位的应用系统中使用。近年来,在标准 实施过程中不断涌现一些新的应用场景,产生一些新的应用需求,新闻媒体的部分应用系统也逐渐不再 使用XML格式,使用JSON格式传输稿件的应用越来越多。因为GB/T20092一2013定义的技术内容 主要是基于XML格式定义的,已经逐渐不适应新闻媒体的应用需求,所以本次修订的主要目的是避免 GB/T20092旨在定义普遍适用于中文新闻信息内容采集、编辑、生成、发布、交换、存储、检索、评 估反馈等新闻信息生命周期的各个环节的描述规范,为适应最新技术在新闻媒体中的实际需要,使标准 更具有可用性,将标准名称修改为《中文新闻信息内容》,拟由四个部分构成。 第1部分:概念模型。目的在于建立新闻行业中文新闻信息的抽象概念模型,规范中文新闻信 息文档的总体结构和描述方式,为新闻内容使用者提供指导 一第2部分:新闻元数据。目的在于规范描述中文新闻信息内容的各类元数据,便于在新闻媒体 行业信息系统中实现信息内容的统一表达,一致描述 第3部分:数据交换的XML格式。目的在于规定基于XML的中文新闻信息数据交换格式, 为新闻媒体信息系统的建设提供技术支持。 一第4部分:数据交换的JSON格式。目的在于规定基于JSON的中文新闻信息数据交换格式, 为新闻媒体信息系统的建设提供技术支持。 TV GB/T20092.3-—2022 中文新闻信息内容 第3部分:数据交换的XML格式 1范围 本文件规定了中文新闻信息数据交换的XML格式,包括规则和约定、公共结构和基本数据类型、 关系机制、受控词描述机制、数字签名、文档层结构、稿件层结构、内容项层结构和内联智能标记 本文件适用于新闻信息内容的“采集、编辑、生成、发布、交换、存储、检索、评估反馈”等新闻信息生 命周期的各个环节。也适用于包括报刊、广播、电视、通讯社、新闻网站、社交媒体等新闻内容提供商及 媒体应用与研究机构, 2 2规范性引用文件 件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于 本文件。 GB/T4880.2语种名称代码第2部分:3字母代码 GB/T4881中国语种代码 GB/T7408数据元和交换格式信息交换日期和时间表示法 GB/T20092.1一2022中文新闻信息内容第1部分:概念模型 3术语和定义 3 GB/T20092.1—2022界定的术语和定义适用于本文件。 4 缩略语 下列缩略语适用于本文件。 URI:统一资源标识符(UniformResourceIdentifier) URL:统一资源定位器(UniformResourceLocator) URN:统一资源名称(UniformResourceName) UTF-8:8位统一码转换格式(8-bitUnicodeTransformationFormat) XML:可扩展置标语言(ExtensibleMarkupLanguage) 5 规则和约定 5.1XMLSchema格式定义 本文件按照GB/T20092.1一2022中4.1的定义,给出了中文新闻信息数据交换的XML格式描 1 GB/T20092.3—2022 述,XMLSchema具体定义应符合附录A的规定,新闻信息文档的完整示例见附录B,XMLSchema类 继承总图见附录C。 5.2拼写规则 每个单词的首字母大写,其余字母均小写,不使用任何连字符,在名称中不使用下划线“”、句点“” 和连字符“”。单词应完整使用,在名称中不使用缩略语,以保证语义的清晰,提高可读性。 5.3元素表达及描述要求 在本文件Schema的不同位置出现的元素如有不同的语义,一般要求采用不同的元素名。标准文 档中出现元素名称时要求用<>括起来作为提示,便于同其他类型的名词出现相区别,如,信封元素在本 文档中出现时应表示为<Envelop>,而不是Envelop。本文件中元素标记的声明通常不以该元素的相关 父元素或祖先元素的路径表达式作为前缀。当相同语义的元素名在Schema中出现不止一次时,需要 的当日发稿序号,可根据其不同语境表达为SentTo/SingleRecipient/RecipientInfo/DailySequence或 SentTo/GroupRecipient/DailySequence 5.4XML组件的命名 本文件中与元素、属性、简单类型和复杂类型概念相关的命名基于如下约
GB-T 20092.3-2022 中文新闻信息内容 第3部分:数据交换的XML格式
文档预览
中文文档
454 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共454页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 思安 于 2023-01-18 17:30:18上传分享