計算集群建設
高性能計算集群
高性能計算集群是用于完成高性能計算而將計算所需要的各種資源進行統一協調調度管理并整合而成為一套對外提供高速計算服務的軟硬件集合。因具有運算速度快、多任務、兼容性強、資源利用率高、使用簡單等眾多特點,高性能計算集群廣泛應用于航空、航天,軍工制造、電子電路、天氣氣象、生物工程等行業,同時涉及到計算機輔助設計與制造、數據統計分析等各行業工作均可能需要高性能計算集群來幫助完成。
高性能計算集群建設內容
高性能計算集群不僅僅是硬件、軟件、存儲、網絡和許可證資源等的堆砌,它還需要匹配部署合適多種資源的統一協調調度服務、軟硬件資源與業務系統的集成服務、方便管理人員管控集群的管理監控系統以及適合研發人員使用的平臺服務系統。
集群建設需要精通各類產品的參數和性能特點,以專業標準制定滿足需求的集群配置方案;同時還需要掌握和了解具體的應用特點和業務場景,以確保在設備選型階段控制風險。上海超算科技基于本公司高性能計算業務的積累,上海超算中心逾17年集群建設運維經驗,各行業計算分中心的建設以及相關領域合作伙伴的緊密協作,在集群建設方面具有得天獨厚的優勢。
高性能計算集群建設包括:1)調度集成;2)集群監控;3)集群維護;4)平臺管理。
1 調度集成
l 主要用于完成集群中計算任務的收集與分配工作,并對集群內的資源使用情況進行監控管理。
l 需要對集群內所有可用資源和服務進行調度管理優化。
l 并提供相關的分配策略以滿足企業計算作業需要。
上海超算科技根據技術能力和以往經驗,提供調度系統與軟硬件的集成配置、許可證管理配置、作業調度策略、集群性能優化等方面服務。
2 集群監控
l 提供整個集群的運行狀態監控,包括集群負載、節點硬件信息、GPU監控等。
l 對集群的服務器、網絡、存儲設備、本冷機柜等資源監控等;
基于上海超算中心多年高性能計算機維護管理經驗,上海超算科技采用B/S架構,基于JAVA語言和web技術開發出可跨平臺使用的集群監控服務系統。通過系統,用戶無需安裝任何軟件即可訪問集群基礎信息和各類業務信息。
3 集群維護
l 高性能集群系統的檢查與維護;
l 集群調度系統的維護與保障;
l 集群存儲系統的維護與保障。
高性能集群已成為大型研發設計機構所需的主要計算資源,一定程度上已成為設計研發進度和日常工作的重要保障。上海超算科技基于十余年高性能計算業務積累擁有專業的技術團隊,為您的高性能集群提供包含調度、存儲、網絡等復雜系統維護與保障服務。
4 平臺管理
l 對操作系統并發管理
l 整合其他設備管理軟件
通過整合高性能計算資源,上海超算科技為用戶提供了方便、安全、一站式基于Web的使用方式;并為管理者提供基于用戶角色的資源分配與調度管理、計算數據安全管理、資源監控和使用分析信息管理的安全處理器。
歡迎關注SSCT公眾號
聯系我們
關于我們
友情鏈接
法律聲明 | 版權所有©2016-2019 上海超算科技有限公司 滬ICP備16034967號-3