关于定界数据

定界数据是具有可变长度的一组记录或字段。定界符用于标记记录或字段的开始或结束,如下图所示:

图 1. 定界数据示例,其中记录的各个字段由逗号定界(LastName、FirstName 和 CustomerId),文件的记录由换行符定界。

记录还具有称为记录标识的识别代码。在图 2 中的数据内,每个记录以记录标识开始,以定界符结束。

图 2. 具有标记代码的记录

图 2 所示,记录可以单独重复;重复的结束用下一个记录的记录标识来标记。记录还可以以记录集合的形式重复;重复的结束用未包含在该集合中的下一个记录的记录标识来标记。

记录包含字段;每个字段以字段定界符开始。字段以下一个字段开始处的定界符结束,或以记录的结束而结束。

字段可以是复杂的,包含由组件定界符定界的多个组件。字段还可以包含多个数据值,这些数据值可以重复并在值之间使用重复定界符,如 phone1 和 phone2 字段所示。

要使用记录标识为该示例数据实施平面文件模式,可映射该数据的每种特征,如下表所示:
平面文件特征 平面文件模式实施
数据中最高级别结构的定界格式 对于根节点,将结构属性设置为定界
记录定界符 对于根节点或记录节点,设置子定界符
记录标识
  • 对于根节点或记录节点,将记录标识属性设置为相应的标识值
  • 对于根节点或记录节点,将记录标识偏移量属性设置为 1
重复记录 对于记录节点,将最大出现次数属性设置为无限制或某个特定值。
重复记录集合 为每个集合创建一个组节点,并把集合中的记录作为该组的内容
字段定界符 记录节点,设置子定界符属性
重复字段 记录节点,设置重复定界符属性
复杂字段 将每个字段定义为子记录,作为包含该字段的记录的子代
复杂字段内的组件 定义为子记录中的字段子代
组件定界符 复杂字段的记录节点,设置子定界符属性