元数据拾取工具(如XML、JDF和XMP拾取)可将元数据从多个源头作为元数据集与工作的内部作业单相关联。该工具支持用多个不同机制定位元数据源及其对应的资产,如下子章节所述。
元数据源:包含被拾取元数据的(部分)文件。
资产:元数据所描述的文件或工作文件夹。在某流程内部作业单拾取元数据后,这些文件或工作文件夹送至此流程。
拾取模式:用于定位元数据源及其资产的特殊的机制/算法。
元数据源(始终为一个单独文件)及其对应资产(始终为一个文件或一个工作文件夹)放在一个拾取工具的输入文件夹(同一个文件夹或不同文件夹)的顶层(即输入文件夹的下一层)。名称相同但文件扩展名不同。拾取工具支持的文件扩展名类型通过流程元素属性定义。
拾取工具在资产和元数据源到达后执行如下步骤:
创建一个元数据集,此元数据集包含一个作为备份文件的元数据源。
在通过流程元素属性为拾取工具命名的数据集下,关联此数据集与资产的内部工作单(用同一名称替代所有现有的关联)。
移除元数据源。
将资产移至输出文件夹。
属性 |
描述 |
|---|---|
元数据文件名样式 |
一个或多个文件类型或文件扩展名(识别为元数据文件) |
孤立超时(分钟) |
时间延迟之后,传入元数据源或传入资产被认为是孤立的,因为无法与配对物匹配 孤立工作被移动到问题工作文件夹 |
资产(始终为一个工作文件夹)放至其中一个拾取工具的输入文件夹,元数据源(始终为一个文件)位于工作文件夹中。在工作文件夹内拾取工具为定位元数据源提供流程元素属性(嵌套层数和文件名样式)。
拾取工具在工作文件夹完全到达后执行如下步骤:
定位元数据源。如没有定位到元数据源,则跳过以下两个步骤。
创建一个元数据集,此元数据集包含一个作为备份文件的元数据源。
在通过流程元素属性为拾取工具命名的数据集下,关联此数据集与资产的内部工作单(用同一名称替代所有现有的关联)。
将工作文件夹移至输出文件夹。
此情况下,不移除元数据源。
属性 |
描述 |
|---|---|
元数据文件过滤器 |
确定文件工作夹中哪些文件代表源数据。从文件最顶层嵌套层级开始扫描(每一层均设置文件扫描),文件过滤器对每个文件进行评估,第一个匹配的文件作为元数据源 |
搜索深度 |
从中搜寻元数据的嵌套层级数目。"1"表示仅最顶层 |
元数据源(始终为一个文件)包含一个资产引用,放在其中一个拾取工具的输入文件夹下。该资产(一个文件或者工作文件夹)放在可通过文件系统访问的其他位置。因此,资产本身不直接放在一个流程输入文件夹下。
此拾取工具提供流程元素属性,可定位元数据源(位置路径)内的资产引用,决定是否移除原始版本资产。
当拾取工具检测到了输入文件,工具期望这是元数据源并做如下操作:
在原始数据源中定位资产引用,定位该资产,并保证其可读。如任一步骤失败,报错并退出。
创建一个元数据集,此元数据集包含一个作为备份文件的元数据源。
在通过流程元素属性为拾取工具命名的数据集下,关联此数据集与资产的内部工作单(该工作单实际是元数据源,用同一个名字替代所有现有的关联)。
将资产从原始位置复制或移动(取决于属性设置)到输出文件夹。
移除元数据源。
属性 |
描述 |
|---|---|
资产路径 |
计算结果为被复制的资产引用到的文件或者文件夹的脚本表达式或者包含变量的单行文本(*) |
删除资产 |
决定资产的原始版本是否在其被复制如流程后被删除。属性值可是一个确切值或者一个脚本表达式(*) |
(*)通常情况下,脚本表达式在输入工作的上下文中,工具处理工作之前被计算。作为该规则的一个例外,这里的脚本表达式在输入元数据被拾取后(资产被定位前)被计算。因此,脚本表达式可访问元数据以计算返回值。
资产(始终是一个文件)放至其中一个拾取工具的输入文件夹,元数据源按照一定格式(取决于拾取工具)被嵌入到资产文件中。
当拾取工具检测到输入文件,工具预计其为是元数据源并执行以下操作:
从资产中提取元数据并存储在一个独立的文件中。如该资产不包含适当类型的嵌入元数据,则跳过以下两个步骤。
创建一个元数据集,此独立文件充当该元数据集的备份文件。
在通过流程元素属性为拾取工具命名的数据集下,关联此数据集与资产的内部工作单(用同一名称替代所有现有的关联)。
将资产文件移至输出文件夹。
属性 |
描述 |
|---|---|
同步 EXIF/IPTC 域 |
如属性值设置为"是",对于支持的文件格式,二进制 EXIF 和 IPTC 标签的值与嵌入的 XMP 数据包在拾取前合并(嵌入资产的数据包保持不变) 如属性值设置为"否",嵌入的 XMP 数据包(如有)按原样拾取 |
拾取工具有四种拾取模式:"元数据是资产"用于实施 JDF、XML 和 XMP 格式拾取。
当一个工作(例如 JDF)文件通过该功能发送至了拾取工具,结果文件就是该 JDF 文件,该文件的内容即 JDF 数据集。因此,工具只有三个属性:名称、数据集名和拾取模式。如选择该拾取模式,无需添加其他属性。