背景介紹:AI時代,企業級云數據中心不只需要能夠提供計算、網絡、存儲、大數據服務,還需要能夠提供如圖像識別、人臉識別、視頻內容分析,以及能夠模擬人腦進行分析學習的深度學習等服務。 建設這樣一個既能夠提供AI服務、大數據服務、又能滿足企業級核心業務需要的云數據中心,它的底層基礎架構資源池究竟該如何搭建呢? 解決方案介紹: 那么現在就以建設一個千臺規模的數據中心為例來進行介紹! 首先把云數據中心的基礎設施按照業務類型進行劃分,如下圖的這八類資源池,當然可以更多或更少: 
這個比較好理解,主要是部署虛擬化。采用標準X86服務器,在單臺物理機虛擬化的基礎上增加集群的模式,將加入集群的眾多物理機進行資源池化,統一調度管理。 虛擬化主要適用于要求資源相對較少且規格種類多、可以重新分配調度資源的環境,便于資源的合理、充分利用,也便于后期業務擴展所需的資源動態調整。 虛擬化計算資源包括: 
通用型服務器:為運維管理、虛擬主機、內存對象緩存服務等提供基礎計算能力; 混合型服務器:為同時需要高IO和大容量存儲的云服務提供基礎計算能力,可使用SSD硬盤和SATA硬盤混搭的方式,利用SSD的高IO能力和大容量SATA磁盤各自優勢; 網絡型服務器:為網絡控制器、安全、負載均衡等高網絡帶寬要求的云服務提供基礎計算能力。 可根據選用虛擬化技術的不同劃分為不同的虛擬化資源池,例如VMWare和KVM兩個資源池區域。 
高密度虛擬化資源池按照業務用途可以分別連接共享存儲及分布式存儲,在多個機房分別建設,其中共享存儲部分設計可以考慮具備雙活能力,分布式存儲考慮雙中心互聯。 高性能分布式計算資源池主要支撐數據倉庫、大數據處理、結構化與非結構化數據應用,此類大數據處理操作對海量數據的查詢、檢索、分析、挖掘的性能要求高,適合用分布式并行計算框架進行計算。 高性能分布式計算資源池,底層采用標準的X86服務器,通過部署集群管理系統,將各高性能計算資源按照集群進行整合,承載海量數據存儲和實時查詢分析任務,對外提供統一服務。 分布式計算資源包含: 
計算I/O型服務器:為分布式數據庫服務、大數據計算服務等需要高I/O的云服務提供基礎計算能力; 計算存儲型服務器:為運維管理、非結構化對象存儲、離線計算服務等需要大容量存儲的云服務提供基礎計算能力。 高性能數據庫計算資源池,針對傳統業務中對Oracle等高性能數據庫業務的應用需求,對服務器等硬件的CPU、內存、網絡和存儲性能有著嚴格要求,從而劃分部分以物理資源為主的高性能數據庫資源區,包括物理服務器和高性能存儲陣列,為高性能需求的各類數據庫服務,以及非結構化數據存儲提供計算資源服務。 
高性能數據庫資源池采用關鍵計算服務硬件架構,采用業界領先的高速互聯設計,提供了強大的計算處理能力。系統中關鍵部件均實現容錯設計,從芯片級、鏈路級、模塊級、系統級四方面RAS特性,可靠性達99.999%以上。關鍵計算服務硬件性能強勁,穩定可靠,是信息化核心數據庫系統的理想平臺。 針對大量應用系統所需圖像處理、深度學習等人工智能技術需求,而建設的異構計算資源池集群,主要是指帶有GPU、FPGA、MIC等異構計算能力的服務器集群。 深度學習技術是需要模擬人腦進行分析學習而構建深度神經網絡,讓機器能夠像人一樣思考,需要進行海量數據的模型訓練和推理,對計算資源要求十分巨大。 
隨著要處理數據規模的增大,GPU在高性能服務器上應用已逐漸成為現代數據中心規劃的主流,GPU已廣泛應用在圖像增強處理、圖像目標搜索、深度學習等領域。 分布式存儲基于SDS理念,在配置多塊大容量硬盤的服務器上部署存儲軟件,對外提供塊存儲、對象存儲、文件存儲功能,為業務部門提供塊存儲和非結構化數據存儲能力。 非結構化數據宜采用分布式存儲系統,典型如對圖片數據、語音數據等。 
分布式存儲系統主要具有易擴展、超大容量及高帶寬特點,通過軟件定義存儲引擎來承載各種高級軟件功能,物理硬件資源與軟件資源緊密配合,達到快速響應前端應用、存儲大量數據的目的,解決了非結構化數據的數據量較大,在存儲時對容量及系統帶寬要求較高的問題。 關鍵數據存儲和虛擬化重要業務應用存儲采用共用集中存儲的形式。 共享存儲基于SAN存儲實現為傳統應用提供數據庫及虛機支撐,多中心間FC鏈路互聯具備承載應用雙活的能力。 
統一存儲資源池可以利用共享存儲豐富的軟件功能,在存儲端對數據進行優化: 1) 共享存儲具備自動精簡配置功能。 2) 共享存儲具備熱點數據自動分層功能。 3) 共享存儲具備存儲虛擬化整合功能,能夠對不同的存儲孤島進行統一整合管理,降低管理成本、提高靈活性和磁盤利用率、改進性能、以及簡化遷移等目的。 共享存儲雙活能力使數據能在數據中心之間共享、存取或移動,利用跨數據中心的存儲虛擬化功能和數據鏡像功能,結合上層應用集群,使兩個存儲系統都處于運行狀態,可同時承擔相同業務,提高數據中心的整體服務能力和系統資源利用率。 網絡資源池采用SDN+NFV+VxLAN技術,通過在通用服務器上部署網絡功能軟件,實現虛擬網絡功能,為支持OpenFlow協議的交換設備分發網絡配置,實現網絡的靈活定義。通過網絡資源池化和大二層技術,虛擬機可以在各數據中心之間進行無用戶感知漂移,實現網絡即服務。 
多數據中心間采用兩家不同運營商裸光纖互聯,部署波分復用設備互聯,應用跨中心集群部署,通過數據復制技術、跨中心共享存儲技術和虛擬機遷移技術來保證各中心的數據一致性和應用雙活。 安全資源池通過部署統一安全資源池通集成虛擬防火墻、虛擬化IPS等安全防護功能,通過軟件定義安全,實現云平臺南北向、東西向的安全防護。 客戶收益: 這樣建設的好處也非常多,如: 1) 充分滿足AI、大數據、虛擬化、關鍵計算等企業級典型云服務業務需求; 2) 合理利用不同的硬件特點,為不同的云服務提供底層硬件支撐; 3) 減少硬件浪費,并降低純低端硬件的不穩定性和性能風險; 4) 兼容現有架構的業務應用系統,例如基于Oracle等開發的業務系統; 5) 降低業務大規模改造風險和時間成本,不必一刀切全部云化,當然如果需要直接進行業務分布式云化改造,也可以完全支撐; 6) 適合企業級業務需求的數據中心建設架構;
|