正文 應用不間斷是目標(1 / 1)

昆山杯

作者:

跟著愛數備份容災家族百城巡展的腳步,愛數一體化容災的理念走進了全國三十多個城市,獲得了用戶朋友的廣泛認可。愛數一體化容災解決方案需要同時解決兩個問題:數據不丟失和應用不間斷。其中,數據不丟失是基礎,而應用不間斷則是目標。那麼,如何實現應用不間斷呢?

基於 CDP 技術的應用容災

愛數一體化容災解決方案分為三個部分:生產服務器、容災服務器和基於愛數容災家族產品成員的容災管理控製台。這三個部分通過實時複製和持續恢複兩項關鍵技術,緊密地連接在一起。

實時複製技術負責監控生產服務器上用戶選擇的數據源,並將數據傳輸到愛數第三代引擎所特有的 OFS 介質(下文簡稱 OFS)上。用戶可以通過該技術追溯到在任何時間傳輸的數據。

為了使容災服務器和生產服務器的數據保持一致,當OFS 上的數據有變化時,持續恢複技術就會將變化的數據實時複製到容災服務器上。如果OFS 出現應用中斷的情況,容災服務器能將數據恢複到應用中斷的那個時間點。這樣就能夠實現容災服務器的恢複點目標(RPO)接近於 0。

如果生產服務器上的應用發生故障,容災係統的故障檢測模塊就會馬上發揮作用。它會先排除各種異常情況,並嚐試修複生產服務器的應用程序。如果應用無法修複,容災服務器就會自動接管生產服務器的應用(用戶也可設置成手工接管,愛數的管理控製台會在應用出現故障時發出通知)。

容災服務器順利接管了生產服務器上的應用後,並不意味容災過程結束了。接管應用後的容災服務器同時還在對外提供服務,所產生的數據依然需要保護。這時,愛數應用容災的對象隨著應用切換,變成容災服務器。為了讓原來的生產服務器繼續工作,用戶往往需要修複生產服務器,生產服務器被修複好後,愛數一體化容災解決方案可以通過特有的反向複製技術實時地將容災服務器產生的數據通過 OFS 複製到生產服務器上。複製完成後,用戶隻要再進行一次反向接管,即可將應用切換到生產服務器上。

在愛數一體化容災解決方案中,應用中斷的時間隻相當於一次應用接管的時間。縱觀整個容災和應用恢複的過程,應用中斷時間(RTO)僅為兩次接管的時間。

在傳統的容災解決方案中,容災服務器接管並恢複生產服務器的應用時,為了保證數據一致,一般會被要求在數據恢複過程中停止對外提供服務。由於傳統方案中的數據恢複時間會受到數據量的大小和網絡鏈路狀況的限製,常常導致數據恢複時間較長。愛數一體化容災解決方案能夠大幅度地降低應用間斷的時間。

基於級聯複製的遠程應用容災

除了上述容災解決方案外,愛數備份容災家族還提供了十分安全可靠的遠程級聯複製容災方案。

所謂級聯,就是在不同的地點部署容災係統,利用 OFS 的同步功能,將遠程容災中心和本地數據中心的數據進行連接,實現同步。這種數據同步也是實時的, OFS在通過遠程操作時同樣可以將數據恢複到任意時間點。由於異地容災一般是在低速網絡中進行,網絡速度會影響容災的效果,為此愛數專門研發支持斷開重連、斷點續傳等網絡傳輸技術,讓遠程的數據一致性得到了保證。

如果用戶在遠程容災中心部署容災服務器,就會有至少四份數據同時被保存下來。生產服務器上的應用發生故障時,用戶可以選擇使用本地或者異地的容災服務器進行接管。如果本地容災係統癱瘓,用戶可以選擇使用遠程的 OFS 數據。即使本地數據中心發生極端的災難性事故,甚至發生數據中心全部損毀的情況,遠程容災服務器依然可以接管生產服務器的應用,並可以將數據狀態恢複到任意時間點。

災難過後,如果用戶需要修複本地數據中心的生產服務器和容災服務器,同樣也可以通過遠程 OFS 進行數據恢複,解決了數據恢複時間長、遠程數據可能不一致的問題,使應用中斷時間(RTO)降到極短。

愛數備份容災家族采用了實時複製、持續恢複、反向複製、級聯複製等一係列獨特的技術手段,保證關鍵應用持續運行,力求將應用中斷的時間極小化,為用戶提供了安全可靠的應用容災解決方案。愛數應用容災方案和數據容災方案都是一體化容災解決方案不可或缺的重要組成部分。