資料倉儲中心管理手冊

相關 轉換程式

使用「相互關係」轉換程式,可以判定一個屬性值 (如僱用時間) 的變更,與另一個屬性 (如薪資) 的變更之間相互關聯的程度。相關分析的資料由兩個輸入直欄組成;每個直欄都含有要注意的屬性值。「相互關係」轉換程式可以計算兩個輸入直欄間的各種關聯程度。您可以為某個給定的輸入直欄配對,選取一個以上的統計值來計算。

您也可以將輸入直欄中的資料視為從一個較大的移入群中取得的範例,並使用「相互關係」轉換程式來測試移入中的各屬性之間是否相關。在這個脈絡中,虛無假設斷言這兩個屬性不相關,替代假設 則斷言這兩個屬性相關。

「相關」轉換程式 會在一或多個任何輸入直欄配對上,進行下列中任何關於相關之統計的計算:

相關係數 r
相關係數 r 可用來表示資料的兩個屬性或直欄之間的線性關係性的大小。 相關係數也稱為「皮爾森乘積動差相關係數」。 r 值的範圍在 -1 到 +1 之間,與計量單位無關。 接近 0 的 r 值表示屬性間相關性較少;接近 +1 或 -1 的值則指示較大的相關性。

當兩個屬性有正的相關係數時,一個屬性值的增加表示第二個屬性值也同樣增加。 小於 0 的相關係數表示負相關。 也就是說,當一個屬性值增加時,另一個屬性值會傾向於降低。

我們來設想兩個變數 xy

共變異數
「共變異數」可用來表示兩個屬性或資料直欄之間的線性關係計量。 共變異數值的範圍是負無限到正無限。 不過,如果共變異數值太小或太大,無法由數字來表示,會以 NULL 來表示。

共變異數和相關係數不同,它相依於計量單位。 例如,和英呎相較,以英吋來計量兩個屬性的值,會以 144 為因數而增加共變異數。

T 值
T 值是測試兩個屬性為相關之假設時,所使用的 T 統計的觀察值。 T 值的範圍在負無限和正無限之間。 接近 0 的 T 值是虛無假設的證明,證明屬性之間不相關。 遠離 0 的 T 值 (不論正負) 是替代假設的證明,證明屬性彼此相關。

T 統計的定義如下:

T = r * SQRT((n-2) / (1 - r*r))

其中,r 是相關係數,n 是輸入值配對數,SQRT 是平方根函數。

如果相關係數 r 是 -1 或 +1,則 T 值由 NULL 來表示。 如果 T 值太小或太大,無法由數字來表示,會以 NULL 來表示。

P 值
P 值是在虛無假設為真時,T 統計的絕對值會等於或超出觀察值 (T 值) 的機率。 小的 P 值證明虛無假設為假,屬性事實上相關。

來源表格及目標表格必須處於倉儲資料庫中。此轉換程式可以依您的需要,在含有來源的同一倉儲資料庫中建立目標表格。您只能變更處於開發模式的步驟。


Figure db2db046 not displayed.

若要定義「相互關係」轉換程式步驟,請:

  1. 開啟步驟筆記本。
  2. 指定關於轉換程式的一般資訊。相關資訊,請參閱提供關於步驟的一般資訊
  3. 按一下參數標籤。


    Figure db2db047 not displayed.

  4. 選用項目:按一下要用作群組直欄的直欄,再按一下 >。群組直欄可以包含字元或數值資料。
  5. 定義相互關係統計值:
    1. 在「轉換程式」定義表格的任一位置按一下滑鼠右鍵,再按一下新增,即將一列新增至表格中。
    2. 在新增列的資料直欄 1 標題下,按一下並選取用於計算的第一個直欄。僅列示數字類型的直欄。
    3. 資料直欄 2 標題下,按一下並選取用於計算的第二個直欄。僅列示數字類型的直欄。 在「資料直欄 2」中,您使用的直欄不能與「資料直欄 1」中所用的直欄相同。
    4. 在新增列的統計值標題下按兩下,即可使用 ... 按鈕。
    5. 按一下 ... 按鈕。如此即會開啟「相關 - 選取統計值」視窗。
    6. 可用的統計值清單中,按一下一或多個統計值,然後,按一下 >。統計值即會移至選取的統計值清單中。
    7. 適當地重複步驟 5a-f。
    8. 按一下確定。如此即會關閉「相關 - 選取統計值」視窗。

      「相互關係」轉換程式支援部份資料。例如,如果您選取某個直欄來定義其統計值,但未選取其統計值,則「相互關係」轉換程式將儲存您的直欄選項。不過,您不能為具有部份資料選項的列對映直欄,也不能順利地執行具有部份資料選項的步驟。

  6. 在「直欄對映」頁上,將相互關係統計所得的直欄對映到目標表格中的直欄。

    用於相互關係統計的直欄名稱,以在「參數」頁上選取的資料直欄項目以及您為其選取的統計值為基礎。針對每個所選的統計值及其對應的資料直欄,均會建有一個直欄。例如,如果將相互關係統計值「共變異數」及 T 值定義到資料直欄 Salary 及 Employment,則在「直欄對映」頁上會顯示直欄 Covariance_Salary_Employment 與直欄 T-value_Salary_Employment。輸出直欄會列示在該頁面的左側、來源直欄標題的下方。與步驟相鏈結之輸出表格的目標直欄,則會列示在頁面的右側。使用「直欄對映」頁,可以執行下列作業:

    如果目標直欄對映到來源直欄,則對映會保持不變。 如果「參數」頁未產生輸出直欄,或此步驟尚未鏈結到目標表格,且您未在「參數」頁中指定自動產生預設表格,則您將無法使用此頁面來對映直欄。有些步驟會不允許您變更直欄對映。

  7. 在「處理程序選項」頁上,提供如何處理步驟的相關資訊。相關資訊,請參閱定義處理程序選項
  8. 按一下確定,以儲存變更並關閉步驟筆記本。


[ 頁面頂端 | 前一頁 | 下一頁 | 目錄 | 索引 ]