OLAP Miner 使用的是一种成熟的基于统计信息的多维算法,它扫描 OLAP 立方体(多维数据库)的指定区域中的所有值,以找出偏差。如果某个单元中的值与由 OLAP Miner 算法计算出的预期值显著不同,那该单元中的值就是偏差。该算法基于立方体中某个单元所在位置的上下文计算出该单元的预期值,然后将来自该单元所属的所有维中的因素组合在一起。OLAP Miner 列示偏差、显示每个偏差的各种视图并限定预期值与实际值(量值)之间的差别有多大。OLAP Miner 按其重要性依次列示偏差。
首先,OLAP Miner 使用由 DB2 OLAP Server 创建的已装入并已计算的立方体。然后选择从要挖掘的立方体中抽取的数据子集。此数据子集称为子立方体。子立方体不是作为 DB2 OLAP Server 立方体(多维数据库)而创建的。
子立方体中包含有来自源立方体中的各个维的成员,作为带有后代的成员(成员与后代)或作为不带有后代的成员(仅成员)。例如,如果您要分析收益数据以查找偏差,可从 Accounts 维中选择 Profit 作为“仅成员”。然后,从立方体中选择其它成员作为“仅成员”或“成员与后代”。可在偏差检测定义中指定维中的各个维作为“仅成员”或“成员与后代”。子立方体是一个数据子集,而偏差检测定义则定义该数据是如何组合的。
OLAP Miner 根据环绕值来计算子立方体中的偏差,因此确保子立方体中包含的数据具有相似的性质很重要。例如,不应创建这样一个子立方体:其中既有以美元计的销售数字也有以百分比计的成长数字;不创建的原因是销售数据可能会达到好几万美元,但成长百分比数据可能只有一位数或两位数。此外,还应排除偏差检测定义中不完整或不准确的数据。
运行偏差检测定义时,OLAP Miner 从 OLAP 立方体中抽取已定义的维的值。然后,它将偏差检测算法应用到这些值,以确定它们是否异常以及异常的程度(量值)。
挖掘运行完成后,OLAP Miner 客户机应用程序将显示一份报告,对在子立方体中找到的每个偏差都显示一行。然后可通过打开“偏差查看器”,选择以更详细的方式查看各个偏差。“偏差查看器”在该偏差值的环绕值上下文中显示该偏差值的一个或多个两维视图。
也可以使用标准的电子表格应用程序,在带有环绕值的上下文中查看偏差。
要获取有关 OLAP Miner 是如何工作的更全面的描述,参阅《OLAP Miner 用户指南》。
相关概念 |
相关任务 |