正文 計算機環境下的自適應資源監測模型設計(1 / 2)

計算機環境下的自適應資源監測模型設計

探索與爭鳴

作者:董桂平

【摘 要】資源性能監測是計算機平台中一個基礎性技術問題。麵向異構分布計算環境,提出了一種自適應的資源信息和負載監控方法。將周期性的拉模式和事件驅動的推模式結合起來,利用係統資源負載的變化,分析計算機係統常見故障分析及處理措施,闡述了監控方法的模型設計策略。

【關鍵詞】計算機;資源;檢測;模式

監測是保證計算機平台高效工作的基礎,隨著計算機的快速發展,越來越多的應用部署到雲中,勢必對係統的穩定性、健壯性和係統性能提出更高的要求。而有效的資源管理方案能保障係統的正常運行,因此對數據中心的資源進行高效的管理變得尤為重要。資源監測是數據管理的重要組成部分,有效的監測能為數據中心的管理和維護提供可靠依據。建立計算機環境下的資源監測模型,該模型能夠根據係統資源負載的變化,自適應地獲取和公布係統的資源信息和負載情況。

1 計算機係統常見故障分析及處理

由於微機監測係統缺乏維護,致使運行狀態不佳時而發生故障給安全生產工作帶來諸多不便。

1.1 解調器發出連續的響聲

這種響聲是電子設備運行不正常所發出的響聲,通信網絡的通道進行數據傳輸時,將故障範圍鎖定在調製解調器部分。應檢查網絡通道是否被斷開或占用或被嚴重幹擾。

1.2 圖畫麵靜止不更新

計算機操縱台顯示器畫麵靜止不動,鼠標可以進行相關操作但係統不能更新操作信息。 故障出現在DMIS分機的運行狀態上,應該確認微機監測站機的網卡與DMIS機櫃內的集線器相連接的網線是否接插良好。

1.3 通信信號不更新

監測信息停止,無法進行實時更新。通過CAN通信傳輸至相應的采集分機傳輸至開關量CPU板進行數據處理,要檢查CAN通信的采集分機電源和CPU板工作是否正常。

1.4 工作正常而不通信

係統工作正常但現場采集各項數據顯示為空白。應先查看各采集機工作是否正常,采集機插板有故障應應檢查至通信頭的和至通信頭的是否斷線或者查看通信頭與工控機插接是否良好。

2 資源監測的原則

2.1 監測結果必須準確

資源監測模塊是計算機平台數據管理的基礎功能模塊。借鑒現有的資源監測方法,采用基於過濾窗口的異常上報算法,有效降低了異常告警帶來的通信開銷。

監測結果不正確會導致嚴重後果。一個錯誤的狀態告警常常會導致不必要且昂貴的通信開銷,漏過一個狀態告警會使潛在的用戶因為性能不好而放棄這個應用。所以要求資源監測必須傳遞正確的監測結果。

2.2 監測數據傳輸的效率要高

資源監測相關的通信消耗應盡可能小。由於監測通信會消耗帶寬和 CPU,而服務器通常隻能有分配有限的資源用於監測,因此,資源監測要盡力做到最小化通信消耗,避免增加不必要的資源消耗。

2.3 資源監測勢必對係統的穩定性、健壯性和係統性能提出更高的要求

有效的資源管理方案能夠保障係統的正常運行,對數據中心的資源進行高效管理是數據管理的重要組成部分,有效的監測可以為計算環境下的資源監測模型,通過監測各節點對監測信息實現集中管理,建立分布式的資源和負載監控框架,通過本地監測係統搜集係統中各個節點的資源狀況和負載情況,資源監測必須傳遞正確的監測結果

2.4 監測采用直觀的資源監測方法

通常情況下,監測主節點周期性地向各個節點獲取其動態的資源和狀態監測數據,被監測節點隻有在接收到主節點的請求後才會將自身的監測數據發送給主節點。管理節點接收到告警信息,在短期內出現的峰值簡單地表明了運行係統的動態性,采用了一種基於過濾窗口的自適應監測方法,減少相關的通信消耗問題。在保證監測準確性的基礎上能夠有效減少發送告警帶來的通信消耗,自適應的監測方法周期性地向係統中的各個節點進行整合,選取三台服務器作為被監測節點,通過頻率獲取該節點的 CPU 使用率,將采集到的數據發送給監測主節點。需要綜合考慮采集頻率和閾值大小,根據被監測節點的敏感度需求來設置。