不同溫度帶數(shù)據(jù)管理解決方案指的是將被頻繁訪問的數(shù)據(jù)存儲在快速存儲器中(熱數(shù)據(jù)),而被訪問頻率相對較低的數(shù)據(jù)則存儲在相對較慢的存儲器中(溫數(shù)據(jù)),極少被訪問的數(shù)據(jù)則會被存儲在企業(yè)最慢的存儲器中(冷數(shù)據(jù))。開發(fā)這套解決方案需要一套關(guān)鍵性能指標
不同溫度帶數(shù)據(jù)管理解決方案指的是將被頻繁訪問的數(shù)據(jù)存儲在快速存儲器中(熱數(shù)據(jù)),而被訪問頻率相對較低的數(shù)據(jù)則存儲在相對較慢的存儲器中(溫數(shù)據(jù)),極少被訪問的數(shù)據(jù)則會被存儲在企業(yè)最慢的存儲器中(冷數(shù)據(jù))。開發(fā)這套解決方案需要一套關(guān)鍵性能指標 (kpi),用來測量數(shù)據(jù)的“溫度”并協(xié)助制定包含數(shù)據(jù)的運營和業(yè)務(wù)決策。為了演示這套解決方案,假設(shè)您的數(shù)據(jù)被分段管理為如下幾個類別:
? 31 天內(nèi)的數(shù)據(jù)
? 31 天到 90 天內(nèi)的數(shù)據(jù)
? 91 天到 180 天內(nèi)的數(shù)據(jù)
? 181 天到 365 天內(nèi)的數(shù)據(jù)
? 超過 365天 的數(shù)據(jù)
假設(shè)兩年期的數(shù)據(jù)的被訪問頻率低于 90 天的數(shù)據(jù)的被訪問頻率,雖然這可能合乎情理,但要更詳細地地了解訪問和變化的頻率,則會引起其他業(yè)務(wù)決策的制定。例如,在過去六個月中沒有任何變化而忽然在一個月里有 100 行數(shù)據(jù)完成了抽取、轉(zhuǎn)換和加載的循環(huán) (ETL) 變化,您可能并不想采取任何行動。或者,如果在那一個月里有 10,000 行數(shù)據(jù)完成了 ETL 循環(huán)變化,您可能就該要考慮采取以下一個或多個措施了:
? 執(zhí)行某種形式的采樣行動,確定是否有進一步分析的必要
? 重新執(zhí)行相關(guān)報告
? 調(diào)查 ETL 過程,了解發(fā)生如此重大變化的原因
? 保留受影響的摘要表和物化查詢表 (MQT)
? 使用 IBM DB2 High Performance Unload 來處理受影響的數(shù)據(jù)或整個數(shù)據(jù)表
? 備份數(shù)據(jù)表空間
? 重新整理數(shù)據(jù)(或只整理索引)
? 運行 runstats 工具
? 執(zhí)行某種形式的存儲管理或歸檔
確定已發(fā)生變化的數(shù)據(jù),并同時確定數(shù)量和變化頻率,這能為運營和業(yè)務(wù)決策的制定帶來寶貴的意見。本文分享了一些可用的度量標準來幫助您理解頻率、數(shù)量、變化的百分比和能導(dǎo)致您數(shù)據(jù)發(fā)生變化的行為。
開發(fā)關(guān)鍵性能指標
圖 1 顯示的是一個表格的條形圖表示法,其中十二月、十一月、十月、九月、八月和七月,相對于六月、五月、四月、三月、二月和一月,變化率較高,被訪問率也更高。
圖 1:訪問頻率和變化頻率
理解訪問頻率、變化率和其他有用的度量
當被激活后,DB2 中的“一直連接”度量會提供快速簡單的度量報告,該度量隨后可用于開發(fā)一個關(guān)于數(shù)據(jù)訪問模式和變化的數(shù)據(jù)活動的業(yè)務(wù)視圖。被激活后就會產(chǎn)生這些度量,可存儲于用戶定義的表中以供進一步分析。
表度量
圖 2 列出了一些關(guān)鍵度量,每個表和每個表的范圍分區(qū)都可以通過 MON_GET_TABLE 的表函數(shù)來獲取這些度量。
? 表或范圍分區(qū)被訪問的次數(shù)
? 閱讀行數(shù)(表或范圍分區(qū))
? 插入的行數(shù)(表或范圍分區(qū))
? 更新行數(shù)(表或范圍分區(qū))
? 刪除的行數(shù)(表或范圍分區(qū))
? 對任何行的列值未導(dǎo)致任何變化的更新行數(shù)(表或范圍分區(qū))
? 表或范圍分區(qū)所在的表空間
圖 2:表和范圍分區(qū)的活動度量
這些度量能幫助您回答下列問題:
? 共有多少行發(fā)生變化?給定時期(發(fā)出和存儲調(diào)用表函數(shù)的結(jié)果時)內(nèi)的變化率為多少?
? 給定的一周內(nèi)共有多少“新增的”行被處理?
? 有多少更新語句執(zhí)行后并未引起實際的更新(圖 2 中的第 6 項)?
? 一個表空間中被更新的總行數(shù)是多少?
? 特定時期內(nèi)共有多少行被刪除?
索引度量
當索引度量不提供數(shù)據(jù)溫度的信息時,它們還是可以通過使用表函數(shù) MON_GET_INDEX 來解釋索引利用率和索引性能,從而完成您的數(shù)據(jù)圖。圖 3 中列舉了那些度量的一個子集:
? 惟一掃描的索引次數(shù)
? 訪問掃描的索引次數(shù)
? 關(guān)鍵列的更新次數(shù)
? 包含列的更新次數(shù)
? 索引跳轉(zhuǎn)掃描的次數(shù)
? 頁拆分的的次數(shù)
圖 3:索引利用率度量的子集