如何指定要从 Hadoop 系统中检索的数据 1 在数据资源管理器中,右键单击“数据集”,然后选择“新建数据集”。 2 在“新建数据集”中,指定以下信息: 1 在“选择数据源”中,选择要使用的 Hive 数据源。“数据集类型”将显示“HQL SELECT 查询”。 2 在“数据集名称”中,为该数据集输入名称。 3 选择“下一步”。 3 在“HQL 查询”中,从“查询文本”输入用于指示要检索的数据的 HQL 语句。图 2-12 显示了在数据集编辑器中所指定的 HQL 查询的一个示例。 图 2-12 显示了 HQL 查询的数据集编辑器 4 选择“完成”以保存数据集。“编辑数据集”将显示这些列,并提供用于编辑该数据集的选项,如图 2-13 中所示。 图 2-13 显示输出列的数据集编辑器 5 选择“预览结果”以查看由数据集返回的数据行。