技術探索

台灣雲端運算之現況與未來發展

工研院資通所 鄧鴻毅、林美佐、蔡文翊

工研院積極發展「軟體定義」及「開放標準」關鍵技術,台灣雲端運算產業如虎添翼。工研院積極發展「軟體定義」及「開放標準」關鍵技術,台灣雲端運算產業如虎添翼。

順應「軟體定義」及「開放標準」的兩大國際雲端運算發展趨勢,工研院資通所已發展「大型雲端資料中心管理系統」及資料中心等級之「軟體定義網路」及「軟體定義儲存」核心技術,目標是支持我國ICT廠商跳脫傳統低利代工角色,發展國產自主雲端資料中心整體解決方案,從無到有逐步建立起雲端產業鏈,帶動網通及儲存設備產業升級轉型,突破重圍進入全球雲端運算市場、新興軟體定義網路與儲存市場。面對未來全球人工智慧(AI)浪潮來襲,工研院資通所也將扮演產業領航者的角色,積極投入發展AI系統軟體關鍵技術,除了聚焦我國硬體廠商外,也會同時側重軟體廠商的帶動,期待能為我國建立具競爭力的AI產業鏈,促進AI應用蓬勃發展。

國際雲端運算產業規模爆發性成長

憑藉優異的虛擬化服務及高延展性,雲端運算架構可支援比傳統資料中心更多的工作負載量(Workload),使得越來越多的企業將核心業務移轉至雲端資料中心,促使雲端流量能快速成長。依據思科全球雲端指數(Cisco Global Cloud Index)預測,有超過70%的訊務是產生在雲端資料中心內,光是2015年,雲端資料中心內的流量就已超過72Tbps,預估2019年將達159Tbps,年複合成長率達25%。
為了大幅提升管理靈活性,國際雲端資料中心正朝向「軟體定義」的趨勢發展。軟體定義技術讓整個雲端資料中心的基礎架構不再只由人工和硬體控制,而是交由軟體掌控,將運算、儲存、網路連接、安全設定與可用性設定等資源管理集中化、抽象化及自動化,快速適應所需的工作負載,以最有效率的方式提供雲端應用服務。另一方面,在開源共享的理念下,「國際開放標準」(如:Open Compute Project[1]、OpenStack[2]、OpenDaylight[3])加速了雲端產業技術發展的效率,大幅降低專案開發之成本,同時兼顧到相容性、可替換性,使得產品目標市場不侷限於區域,可放眼國際,成為行銷全球雲端運算市場之重要策略方向。
在2017年Synergy Research Group的研究顯示,現今共有24家超大規模(Hyperscale)營運商(如:Amazon、Microsoft、IBM、Google),他們正在積極地增長關鍵公有雲服務市場比例。以2016年來說,超大規模營運商已占據了雲端基礎設施服務 (Infrastructure as a Service;IaaS)市場的68%及雲端軟體服務(Software as a Service;SaaS)市場的59%,這24家超大規模營運商目前擁有近320個大型雲端資料中心,在每個大型雲端資料中心中部署從數十萬台到數百萬台不等的伺服器。這個發展顯示著很少有公司能夠跟上超大規模營運商的步伐,使得超大規模營運商成為引領雲端運算技術創新之主力。
此外,在RightScale的調查顯示,各類企業最常採用的私有雲平台當中,OpenStack僅列於VMWare之後,領先其他雲端系統。451 Research則預估,OpenStack市場規模持續攀升,2020年OpenStack在亞太區市場規模將達到50億美元,年複合成長率61%。近年中國已大舉進入OpenStack,華為以OpenStack為基礎,建構「華為企業雲」的公有雲平台,2017年成立專屬業務單位,增加投入人員2,000人;而騰訊也建構了14個OpenStack叢集(共6,000個節點)組成的私有雲,支援約1億名用戶,讓騰訊成為OpenStack最大的用戶。

台灣雲端運算產業之發展現況

台灣的資通訊(ICT)製造產業在全球占有優勢地位,除有堅實的產業鏈和技術優勢,更在雲端資料中心三大核心伺服器、儲存、網路等硬體設備上,具備自主製造與平價供應能力。如圖一所示,台灣雲端運算產業平台產業鏈可分為二大部分,一是非IT基礎環境設施,包含了電源供應、冷卻系統、機殼、伺服器導軌,目前國內皆有相關的廠商能提供此技術。另一部分則屬於IT基礎環境設施,主要可區分為伺服器、網通設備、儲存、虛擬化軟體及管理平台、監控平台(DCIM)及系統整合等部分。
台灣為全球伺服器輸出第一大國,硬體品質獨步全球,IDC研究顯示2015年由台灣廠商生產的伺服器主機板與整機產品數量已占全球市場規模91%,領導廠商以英業達、廣達、鴻海、緯創、神達、技嘉為主。目前大多是以OEM/ODM代工型態為主,直接供貨給Google、Microsoft、Facebook等超大規模資料中心(Hyperscale Data Center)。無論如何,國內伺服器廠商因礙於缺乏系統軟體整合能力,無法主導伺服器產品之技術標準,導致缺乏行銷國際市場之品牌價值。相較於伺服器產業,國內網通設備以友訊、合勤為領導廠商,在小型網路交換設備與代工占有一定的市場,但也礙於技術門檻的限制,無法打入大型雲端資料中心市場。在儲存產業的部分,國內廠商在前端晶片、控制器(Controller)上有很強的基礎,主攻中小企業、單機式的儲存解決方案,但也欠缺大型、高速的開放資料中心儲存自主技術,無法進入大型雲端資料中心市場。

台灣雲端資料中心產業價值鏈台灣雲端資料中心產業價值鏈

大型虛擬化軟體及管理平台是雲端資料中心的重要基礎,目前國內有台灣雲端物聯網產業協會、工研院、迎棧科技、雲達科技、雙子星雲端、數位無限等積極推動與發展OpenStack相關解決方案。其競爭重點有自動化布建(Auto Deployment)、高可靠度服務(High Availability)、雲端作業環境監控、 實時升級(Live Upgrade)。為了帶領我國ICT廠商跳脫傳統低利代工角色,工研院資通所發展了一套大型雲端資料中心管理系統 ITRI OpenStack Distribution(IOD),帶領國內硬體製造大廠轉型為雲端服務提供商,同時運用政策工具建立雲端資料中心國家隊,建置全國產業軟、硬體整合之國產化公用雲端資料中心,帶動台灣雲端資料中心解決方案整案輸出。此外,工研院資通所也發展出BAMPI(Bare-Metal Provisioning from ITRI)技術,協助國內硬體製造大廠擊退華為的削價競爭,切入日本電信大廠雲端資料中心供應鏈,加速機房部署效率至少200倍(36個工作天→1.5小時),提高我國伺服器產業的附加價值。

在軟體定義網路方面,主要可分為Overlay與Underlay兩類解決方案。Overlay解決方案使用Tunnel的技術來實現網路虛擬化,具有無需控制底層網路設備、支援百萬個虛擬網路、可跨越L3 Domain等優勢,但是Tunnel技術也有其缺點,如:無法優化底層網路傳輸路徑達到負載平衡、無法修復底層網路的錯誤、Tunnel的封裝與解封裝帶來的CPU運算資源與Header欄位的額外成本。Underlay解決方案通常使用VLAN+VXLAN技術實現網路虛擬化,比起Tunnel技術,在傳輸效能與成本上更具優勢,能對底層網路進行傳輸路徑負載平衡及故障轉移,並能提供網管人員更好的虛擬網路可視性。為了帶動國內軟體定義網路(Software Define Networking)產業鏈,工研院資通所發展了軟體定義網路技術 ITRI Peregrine,ITRI Peregrine支援1,600萬個虛擬網路,僅有0.2% CPU效能損耗,提升6倍網路吞吐量,並於0.17秒內修復100個虛擬網路,目標為扶植國內新興網通系統軟體廠商,發展資料中心級網路次系統解決方案,進軍資料中心核心市場。
在軟體定義儲存方面,快速的資料增長與更大的容量需求,讓儲存問題成為雲端資料中心眾多難題的根本。當企業收集和產生的資料量愈來愈多時,充分了解影響儲存的關鍵問題,才能大幅改善資料中心的整體管理工作。一般來說,儲存產品最重視的是可水平擴展的能力、可靠度、存取效能、資料安全性等基本特性。針對雲端資料中心的多樣化儲存需求,工研院資通所發展了軟體定義儲存系統 ITRI DISCO、高速長效之全快閃記憶體磁碟陣列技術 ITRI SOFA。ITRI DISCO已通過OpenStack Cinder認證,最佳效能可超越Ceph[4]高達2.6倍;ITRI SOFA則具備高達1M IOPS隨機存取效能,提升固態磁碟壽命50%以上,並能增加2倍使用者有效空間。

6項關鍵技術持續推動雲端運算產業

未來人工智慧(Artificial Intelligence;AI)將大幅改變社會型態與民眾生活方式,在製造、零售、醫療、教育、公共安全等應用領域,廣泛運用雲端運算、巨量資料和深度學習等核心技術。資料量(Data)、演算法(Algorithm)與運算能力(Computing)將成為發展的三大主要驅力,AI應用範圍包含影像辨識、語音辨識無人載具、機器人等。因AI應用將無所不在,深度神經網路(Deep Neural Network;DNN)模型之訓練和推理預期會成為未來雲端資料中心的主要工作負載,工研院資通所將發展以下6項關鍵技術來持續推動我國雲端運算產業:

1. 高延展性運算架構(Scalable Infrastructure):單機運算已達訓練效能極限,為加速學習運算,DNN訓練運算平台將朝向大規模分散式運算平台來發展,同時也必須具備可擴展及彈性資源配置功能。因此,發展高延展性運算架構成為AI雲端運算的一大重點,一台伺服器將可同時用多達256個以上AI運算單元進行DNN模型訓練,每一個AI運算單元也能動態分配給任何伺服器,並具備平衡負載(Load Balancing)及高速錯誤復原(Fast Failure Recovery)能力。

2. 異質運算(Heterogeneous Computing):隨著國際大廠陸續推出DNN運算單元(如:NVIDIA P100/V100、AMD Radeon、Intel Xeon Phi Knights Mill、Google Tensor Processing Unit),為了提升整體運算效能或降低系統耗能,如何完善地協同各種處理單元中的運算能力,正確地分割模型運算工作,並分配給最適合的運算單元執行,將成為重要技術挑戰之一。因此,有必要發展支援多種運算單元的新雲端運算架構與軟體應用技術,以同時混和運用GPU/TPU/FPGA/ASIC等各類AI運算單元,增進雲端平台之AI運算能力。

3. 混和雲(Hybrid Cloud):國際公有雲大廠正在積極猛烈地擴張市場,促使企業將大幅運用混和雲技術,統一管理公有雲和私有雲之AI運算資源,讓虛擬機器、應用程式與工作負載,可以橫跨性質迥異的雲資源網路環境運作,完善地整合運算、儲存、安全、網路、應用程式與管理機制。再者,隨著雲端服務的普及化,擁有大量企業機密資料的雲端服務已成為駭客眼中誘人的標的,雲端服務紛紛引入資安防護技術來強化安全性。因應雲端資安需求,工研院資通所也發展出密文空間處理技術(Encryption-Domain Processing),讓雲端資料在加密保護下也可以做到內文關鍵字搜尋、分享、可去重覆等這些雲端儲存服務,既提供了檔案內容的保護,也保持雲端服務的特性。

4. 高效能儲存(High-performance Storage):因DNN模型訓練需要運用到大量資料集,故需有良好的儲存系統支持才能達到高效能、安全穩定的資料存取。目前全快閃記憶體儲存陣列(All Flash Array;AFA)以其優異的存取效能且價格逐漸便宜取得關注,未來發展重點將會是訴求高效能、品質穩定度及成本效益,例如:結合PCIe、NVMe和NVDIMM技術,使AFA的效能符合DNN運算需求;最佳化儲存空間使用效能,達到高成本效益。

5. 具記憶體傳輸速度之網路(Memory-Speed Networking):當跨伺服器間進行大規模DNN平行運算,網路傳輸速率成為一大效能瓶頸。雖然結合Intel Data Plane Development Kit (DPDK)[5],能讓Open vSwitch (OVS)[6]的封包處理效能接近14百萬個封包(14Mpps),但面對未來40Gbps與100Gbps的環境仍遠遠不足,故應發展高速雲網路優化加速軟體技術,使得網路傳輸效能可匹配伺服器記憶體內運算、高速網路硬體之速度,達到100Gb line rate (148Mpps)的傳輸效能。

6. 應用效能管理(Application Performance Management):因雲端應用效能對營運有極大影響,舉例來說:Amazon發現每0.1秒的延遲會影響1%的銷售額(約300多億台幣),使應用效能管理成為未來雲端資料中心必備功能。因此,我國應發展應用效能管理軟體技術,支援大規模雲端服務之營運需求,提供運作軌跡圖、多方錯誤告警之整合分析介面,大幅提升雲端服務之可視性及問題分析能力。

台灣廠商在資料中心伺服器領域已有超過50%的市占率,在交換器、儲存伺服器方面也都是國際大廠重要的OEM/ODM代工合作夥伴。藉由法人科專的支持,目前工研院深耕OpenStack系統軟體技術,發展大型國產自主雲端作業系統、網路及儲存次系統模組,帶領國內軟硬體產業發展資料中心軟硬整合解決方案,轉型切入高附加價值的資料中心產業。未來AI浪潮將持續帶動雲端產業快速成長,但目前國內軟體生態系不足以支持AI產業發展,故法人仍應聚焦於AI系統軟體技術,發展出國產自主DNN高效訓練推理運算平台,實現AI產業化與加速產業AI化之願景。
本期雲端技術新探索單元收錄了4篇各式雲端關鍵技術,「Peregrine網路管理技術應用於IaaS及HaaS」介紹了IaaS與HaaS兩種雲端服務情境,以及Peregrine在不同服務情境中如何實現流量監控及網路虛擬化等功能;「混合雲趨勢」探討在採用混合雲時所面臨的關鍵挑戰及如何在混合雲的環境中,達到網路透通性、管理透通性和儲存透通性等特性;「免代理式應用效能管理系統」介紹工研院資通所自主開發的應用軟體監控專利技術,具備完全零佈署時間零維護與適用無原始程式碼的雲端軟體的兩大特色;「雲端資安多層次防禦技術」提出一多層次雲端資安防禦架構,能針對不同層級的駭客行為,提供無後顧之憂的雲端服務防護。希冀本期期刊豐富且充實的內容,能帶給讀者對於工研院資通所在雲端技術應用與發展相關領域之投入與貢獻有更深一層的認識與了解。

參考文獻

[1] Open Compute Project, Available: http://www.opencompute.org/.
[2] OpenStack, Available: https://www.openstack.org/.
[3] OpenDaylight, Available: https://www.opendaylight.org/.
[4] Ceph, Available: http://ceph.com/.
[5] Intel Data Plane Development Kit, Available: http://dpdk.org/.
[6] Open vSwitch, Available: http://openvswitch.org/.