您的瀏覽器不支援JavaScript語法,但是並不影響您獲取本網站的內容。

混合雲趨勢

106-12-27

工研院資通所 黃俊傑、江啟鈞、李威儒、鄧名杉、江孟寰、李建宏

混合雲應用受重視 三面向探討其挑戰

混合雲應用受重視 三面向探討其挑戰

隨著雲系統使用需求的提升,混合雲的應用逐漸受到更多的注視。混合雲兼具私有雲和公有雲兩個IaaS系統的優點。它允許工作負載在公有雲和私有雲之間移動,並隨著計算需求和成本的變化做動態負載調整,它為企業提供更大的靈活性和更多的部署選擇。本文探討客戶在採用混合雲時所面臨的關鍵挑戰及討論如何在混合雲的環境中,提供網路透通性、管理透通性和儲存透通性等特性,讓租戶易於使用混合雲。

混合雲整合私有雲與公有雲優點

混合雲整合私有雲與公有雲各自的優點,在此環境上,租戶可以實現資料和應用程式可攜性的目的。它大大的提高資源使用效率並實現可擴展性。一般來說,混合雲中的用戶可以在私有雲中高效安全地使用其所有資源,同時能夠使用和擴展公有雲服務。在混合雲的環境中,租戶可以隨意的透過管理中心介面選取虛擬機的需求數、相關的安全政策及地域性的要求。管理中心介面會依據租戶的需求,至不同的雲系統完成租用服務,並將這些虛擬資源,以邏輯網路層方式完成網路的串接,讓租戶於網路的使用、管理介面的操作及儲存管理,如同在單一的操作環境下簡便。

混合雲面臨的技術挑戰

在混合雲中,我們將從三個構面討論混合雲的挑戰,包括:網路、管理和儲存。

1 網路方面面臨的挑戰

混合雲主要的任務就是維護公有雲和私有雲之間網路的連通性,以及在傳輸大量資料時能分配適當的頻寬。因此,需要設計一個全面性的網路管理機制,比如公有雲與私有雲之間的頻寬管理、不同應用程式對網路的需求特性,不同資料類型的資訊安全需求等等,來滿足不同網路使用者的需求。這些要素即是提供高穩定性及可用性網路的重要資訊。IDC白皮書[15]報告提到,網路路由的最佳化以及廣域網路的可用性和延遲是主要議題。所以混合雲所面對的挑戰即是提供高品質的最大網路傳輸量以及高可用性的最低延遲時間。因此,針對廣域網路的最佳化必然是不可少的。在混合雲中,網路服務應該能夠同時為廣域網路和雲端資源提供最佳化、可視化及相關的控制。目前有兩種類型廣域網路的架構,分別是混合廣域網路以及軟體定義廣域網路,或稱為SD-WAN (Software-defined WAN)。混合廣域網路可以監視連接鏈路上的等待時間、使用率以及連線的錯誤率,並藉此來決定哪條鏈路是最佳路徑。上面所陳述的混合廣域網路可能會遇到以下問題[7]:

  • 大量網路頻寬的浪費。
  • 網際網路應用程式的低效能。
  • 應用層相關的報表很難實現。

文章[14]對軟體定義廣域網路有更詳細敍述。軟體定義廣域網路將控制層與資料層分離,意即網路設備只進行轉發網路封包,而控制器根據封包轉發的策略來告知網路設備封包如何轉發。

此外,提供一致性的策略讓企業存取混合雲也是一個重要議題。如果公有雲沒有統一且一致的網路基礎架構,那企業組織也無法從公有雲的整合上獲得所有幫助。Infoblox推出一些企業級網路服務,包括DNS和IP地址管理[12]。Infoblox的解決方案可以確保DNS命名約定和網路/ IP位址配置有統一而一致性的策略。在SearchNetworking報告[18]以及TechTarget公司都指出了一些網路相關的挑戰。比如混合雲網路可能無法實現公有雲和私有雲之間全面的整合。以虛擬機的建立、搬移及管理為例,很難使用一個統一的資源排程系統(orchestration)進行跨多組資料中心來進行控制。

2 管理方面面臨的挑戰

混合雲中的監控機制主要著重於租戶的應用系統效能。在租戶所在的雲系統上測量所有應用程式的回應時間是一個關鍵特性。在混合雲中,提供一個完整的模組來確保各應用程式反應時間是一個重大的挑戰。

災難復原(Disaster Recovery)可包括以下幾項功能:規劃遷移、測試復原和災後復原計劃。傳統的災難復原機制,為滿足RPO/RTO (Recovery Point Objective/ Recovery Time Objective)需求,將產生建立成本提高及維護DR計劃成本提高等問題。因此,各種規模的企業透過雲做為主要解決主軸。文章[11]提供一些調查結果。為此,我們必須克服下述挑戰:儲存延遲、網路和頻寬、容量、雙向複製以及隔離多租戶等。另外,使混合雲中的雲儲存系統看起來像本地端資料中心儲存系統,亦是一個很大的挑戰。

3 儲存方面面臨的挑戰

在混合模式中,部分公司資料儲存在私有雲中,某些在公有雲,大部分兩者皆有。混合雲儲存方法面臨了兩個挑戰:資料同步和網路延遲問題。在資料同步中,當主站的資料更改時,如何防止在公有雲的資料同步前被使用。在網路延遲方面,遷移到新的混合模式版本,如何保留資料在私有雲中,但可以被公有雲中的新虛擬機使用。

在高性能主要儲存系統上長期儲存和管理日益增長的資料可能非常昂貴,也可能影響整個系統和網路的性能,通常會導致昂貴的硬體升級以保持速度。多年來,分層儲存架構已經成為顯學,不同特性的儲存媒體的分層用以次保護企業資料。然而,傳統的分層儲存模式和技術既昂貴又復雜。因此,現在許多機構都在尋求混合雲來提供更便宜、更有效的儲存選項。然而,主要的挑戰是創建一個分層的儲存策略來解決所有的企業使用案例[10],並恰當地為業務流程提供服務。以資料分析這個領域為例,分層儲存系統可能需要支援許多使用案例,如通過機器學習進行欺詐檢測。另外一個挑戰是做詳細的設計和規劃分層儲存架構和自動化分層。


混和雲技術探討與案例研究

本小節將介紹一些混合雲技術和案例研究。我們將從網路透通性、管理透通性和儲存透通性等三個方面介紹和案例研究。

1 網路透通性

軟體定義廣域網路是一種可程式化且能自動化管理企業網路連線的方法。軟體定義廣域網路允許IT部門能夠以較低的成本且以更好的效能,使用多個廣域網路或網際網路來連接在各個企業分支。並且支援在分支機構上,能有選擇性地分流網路流量以及將網路封包直接發送到雲端上目的地的能力,從而減輕昂貴的廣域網路鏈路的負擔。軟體定義廣域網路也提供安全性、廣域網路流量監控以及透過以網路流控制策略為基礎的方式來改善應用程式效能。

文章[5]中有提到,軟體定義網路有可能會產生非常大量的控制流量,從而造成廣域網路效能下降的問題。因此提出了一種解決方案,將路由路徑分成多個區段,並分別散佈到多個交換機。藉此達到控制及平衡網路流量。文章[6]中提出了一種能夠控制光纖設備的網路流量管理系統,以滿足廣域網路中快速傳輸的需求。軟體定義網路在廣域網路發展上面臨到許多挑戰,包含有限的頻寬、高成本且複雜的網路基礎設施,這些都是在未來研究中一個有趣的研究課題。

1.1 管理透通性—災難復原

目前大多數企業都極度關注災難備份還原、災難復原以及工作連續性等議題上。用戶使用雲系統作為備份的場所時,同時也對用戶進行另一個額外的資料做備份,這是基於雲的災難復原(Cloud-based DR)機制,提供了一個簡化且更經濟實惠的解決方案,除了在備份還原及恢復提供了高水準的可靠性,也提升了更高的安全性和更高的成本優勢。

與傳統的IT相比,災難復原即服務(DRaaS)[2]在不同的情境中,各有不同的好處,應用於混合雲環境時,可以改善單一個雲恢復服務的速度及能力;應用於公有雲環境時,採用較低成本的儲存服務,顯著地降低了用戶的花費,因此能提供更有效率的解決方案。

文章[4]闡述了災難復原的解決方案,如圖1所示。基於雲計算的企業應用程式的災難保護和復原,應該在基礎設施等級和應用程式等級分別考慮。在基礎設施等級裡,DR的災難保護通常是針對儲存裝置或伺服器上進行,而儲存級DR可以透過一種無代理器的方法,根據底層儲存系統的鏡像功能,在主站點和備援站點的儲存裝置間進行複製,進而達到備援的效果;而在伺服器級DR中,它則需要在每台服務器上安裝一個代理器做代理,監控所有的狀態及回報,但是對於某些特定服務,儲存級別和服務器級別的災難恢復都不足以令人滿意。因此,針對這些特定服務,可能需要應用程式等級的災難恢復工具,利用關於應用程式的資訊及知識,或使用公有雲供應商所提供用於解決特定應用程式的DR解決方案來實現應用程式等級的DR。

圖. 1 災難救援解決架構

圖. 1 災難救援解決架構

VMware在公有雲和私有雲中皆提供DR解決方案—Site Recovery Manager(SRM)[19]。在公有雲,VMware也提供DRaaS系列產品,vCloud Air為災難復原解決方案,即是為vSphere環境提供本機基於雲的災難恢復功能。VMware vSAN,vSphere Replication和SRM一起用於私有雲DR,分別提供了儲存、虛擬機和災難復原的自動資源排程技術。

1.2 管理透通性—監控

從管理透通性的角度來看,建立一個統一的管理體系成為混合雲的一個重要特性。Science Logic [17]公司提供了一個可以生成混合IT基礎設施的性能關聯圖的產品。它宣稱所有這些流程都會自動發現,映射和監控私有雲和公有雲。其效能視窗圖如圖2所示。要在混合雲中建構這樣的系統,我們需要面對許多挑戰(如文章[3]),例如,混合雲規模和複雜性問題、監測資料的揭露、監測代理的網路問題等。最重要但最困難的是如何建立一個綜合的性能監測流程,可以顯示跨層的效能資訊,並且可以很容易的部署到混合雲。例如,如何解決跨業務應用程式應用於不同層,且使用不同的監控策略,導致監控解決方案不完整。應用程式狀態取決於分佈在公有和私有雲的資料庫、作業系統、儲存和網路設備的運行狀況。作業系統處於良好狀態,但資料庫部分為異常。在無法提供跨層分析且監控資訊不完整的情況下,將使得監控資訊無法整合,難以了解問題原因。人們在做效能調適時,在這樣的監控架構下經常遇到這個問題。由於缺乏足夠的監控整合資訊,他們無法調適應用程式效能問題。要充分利用監控資訊,必須生成一個全面和一致的監控計劃。

圖. 2 效能視窗圖: 監控及監控工具[17]

圖. 2 效能視窗圖: 監控及監控工具[17]

3 儲存透通性

混合雲於軟體定義儲存解決方案,關注三個技術挑戰,包括延遲性、安全性和可靠性。分層儲存(Tiered storage)是將兩個或更多儲存系統整合一起工作的儲存模型。第一層為最接近應用程式,效能最高但也最昂貴。第二層或二級儲存設備往往性能較差、成本較低,它被設計為主要儲存系統的備份系統,或者被設計為儲存主要儲存設備中不常使用的資料。最後,歸檔(Archive)儲存層,它是最便宜的,但系統速度最慢,用來儲存很少使用的資料。


在混合雲解決方案上,一般而言,會將主要儲存系統存用於私有雲上,以確保資料的安全性。第二或第三層的儲存系統則存放於公有雲中。文獻[13]表示,最有用的方式是透過快取和資料壓縮的技術來減少WAN流量。壓縮和快取的效率取決於應用情境,一般來說,壓縮技術可以減少大約6倍的頻寬需求,而快取技術通常將流量減少大約4倍。

藉由軟體定義儲存的彈性,企業開始將雲端儲存加入在其儲存層架構中。DataCore [8]將不同的儲存解決方案集成到一個大的儲存池中。EMC、NetApp、HP和AWS等公司的儲存系統皆可以整合到這個解決方案中。使用這套方案的客戶,可以在不同儲存系統,甚至公有雲間轉移儲存資料。大多數企業將公有雲視為其儲存架構中的備份層。儲存供應商開始將他們的儲存系統移植到雲中,以便他們可以在公有雲上為私有雲中的儲存設備提供備份服務。例如,DataCore Cloud Replication可在Microsoft Azure Marketplace [9]上取得,NetApp ONTAP Cloud for AWS可在AWS marketplace [16]上取得。

在雲系統上,越來越多機密資料的問題受到關注。在文章[1]中,它提出了一個稱為cloud-of-clouds(CoC)的系統。它們將資料副本編碼後分散到多個公有雲的服務供應商,至少需要一定數量的資料碎片(data fragments)才能進行資料恢復,藉此消除機密資料存放到公有雲上的的安全疑慮。


藉由公有雲和私有雲的協同工作及資源配置,混合雲將資源利用率提升到最大。混合雲具有高度靈活性、速度、容量、一致性、敏捷性和成本效益等特性,使企業願意將其工作負載移至此環境。混合雲的技術挑戰包括:網絡、管理和儲存,如何提供這三個構面的透通性,是一個很重要的議題。租戶應該了解其應用服務於展現層和資料邏輯層間的整合及與資料層之間的交互關係,因為這是決定正確應用程式部署的關鍵。工研院擁有自己的資料中心解決方案,稱之為ITRI OpenStack Distribution。為了滿足混合雲趨勢,我們也開始從不同的技術方向,展開研究和設計討論。



Reference

[1] D. Li and Y. Zhou, “A Secure and Reliable Hybrid Model for Cloud-of-Clouds Storage Systems”, 2016 IEEE 22nd International Conference on Parallel and Distributed Systems, Dec. 2016, pp.13-16.
[2] H. B. Rebah and H. B. Sta, “Disaster Recovery as a Service”, 2016 Global Summit on Computer & Information Technology (GSCIT), Sousse, 2016, pp. 32-37.
[3] M. Natu, R. K. Ghosh, R. K. Shyamsundar, and R. Ranjan, “Holistic Performance Monitoring of Hybrid Clouds: Complexities and Future Directions”, IEEE Cloud Computing, Vol. 3, Issue 1, Jan. –Feb. 2016, pp. 72-81.
[4] L. Wang, R. E. Harper, R. Mahindru, and H. V. Ramasamy, “Disaster Recovery for Cloud-Hosted Enterprise Applications”, 2016 IEEE 9th International Conference on Cloud Computing (CLOUD), San Francisco, CA, 2016, pp. 432-439.
[5] X. Dong, Z. Guo, X. Zhou, H. QI, and K. Li, “AJSR: an Efficient Multiple Jumps Forwarding Scheme in Software-Defined WAN”, IEEE Access, Vol. 5, Feb. 22, pp. 3139-3148.
[6] X. Jin, Y. Li, D. Wei, S. Li, J. Gao, L. Xu, G. Li, W. Xu, and J. Rexford, “Optimizing Bulk Transfer with Software-Defined Optical WAN”, SIGCOMM’16, Aug. 22-26, Florianopolis, Brazil, pp.87-100.
[7] Addressing Hybrid Network Challenges with SD-WAN. [Online]. Available: https://www.networkworld.com/article/3020746/network-management/addressing-hybrid-network-challenges-with-sd-wan.html
[8] DataCore Software. [Online]. Available: https://www.datacore.com/
[9] DataCore Cloud replication on Azure market place. [Online]. Available: https://azuremarketplace.microsoft.com/en-us/marketplace/apps/datacore.datacore-cloud-replication
[10] D. Linthicum, “The Benefits and Challenges of a Tiered Storage Architecture”, SearchCloud Computing. [Online]. Available: http://searchcloudcomputing.techtarget.com/tip/Implementing-a-tiered-storage-architecture-with-hybrid-cloud
[11] D. Pendergraft, “Disaster Recovery 2017: More Cloud, Speed of Recovery, Less Complexity”, IT ProPortal, Jan. 10, 2017. [Online]. Available: https://www.itproportal.com/features/disaster-recovery-2017-more-cloud-speed-of-recovery-less-complexity/
[12] Infoblox White Paper: Ensuring Enterprise-grade Network Services for AWS. [Online]. Available: https://www.infoblox.com/wp-content/uploads/2016/04/infoblox-whitepaper-ensuring-enterprise-grade-network-services-for-aws.pdf
[13] J. O’Reilly, “Hybrid Cloud Storage Challenges”, NetworkComputing, Mar. 26th, 2015. [Online]. Available: