如何指定要從 Hadoop 系統中擷取的資料 1 在「資料總管」中,用滑鼠右鍵按一下「資料集」,然後選擇「新建資料集」。 2 在「新建資料集」中,指定下列資訊: 1 在「選取資料來源」中,選取要使用的 Hive 資料來源。「資料集類型」會顯示「HQL Select 查詢」。 2 在「資料集名稱」中,輸入資料集的名稱。 3 選擇「下一個」。 3 在「HQL 查詢」的「查詢文字」中,輸入一個 HQL 陳述式,來指出所要擷取的資料。圖 2-12 顯示資料集編輯器中指定的 HQL 查詢範例。 圖 2-12 顯示 HQL 查詢的資料集編輯器 4 選擇「完成」,以儲存資料集。「編輯資料集」會顯示直欄,並提供用來編輯資料集的選項,如圖 2-13 所示。 圖 2-13 顯示輸出直欄的資料集編輯器 5 選擇「預覽結果」,以檢視資料集傳回的資料列。