系統(tǒng)介紹
隨著數(shù)字經(jīng)濟發(fā)展和數(shù)據(jù)量爆發(fā)式增長,眾多研究和實際應用領(lǐng)域需要超級計算和智能計算相結(jié)合進行跨學科研究,異構(gòu)算力調(diào)度系統(tǒng)可通過對包括CPU、GPU等多種算力的調(diào)度使得一定范圍內(nèi)算力需求和供給達到平衡,同時可高效利用計算資源。
![1705949882183156.png 04-04-1.png]()
功能方案
1)適配層:通過構(gòu)建多種調(diào)度執(zhí)行服務和能力接口,對接超算和智算的云管平臺和計算節(jié)點,進行異構(gòu)算力能力接入。
2)能力層:提供異構(gòu)算力設施管理、混合調(diào)度、作業(yè)管理、異構(gòu)算力觀測等功能,實現(xiàn)異構(gòu)資源的統(tǒng)一管理、智能調(diào)度、一體監(jiān)控。
3)開發(fā)層:提供異構(gòu)算力調(diào)度開放能力,包括作業(yè)中心、客戶數(shù)據(jù)接口、算力查詢能力、數(shù)據(jù)上傳/下載能力、模型上傳/下載能力、鏡像部署能力等內(nèi)容。
技術(shù)特點
1、云原生技術(shù);
2、微服務:采用微服務架構(gòu)設計,能夠快速響應業(yè)務變化,確保系統(tǒng)的高可用性和可擴展性;
3、豐富的調(diào)度策略:支持負載均衡、資源限制、Gang調(diào)度、搶占調(diào)度、預留調(diào)度、回填調(diào)度等調(diào)度算法。
應用場景
針對政府、電信運營商、科研機構(gòu)等各類有算力調(diào)度需求的企業(yè),如為生物、新型材料行業(yè)的計算機模擬、數(shù)據(jù)分析、科學計算、AI訓練和推理等計算場景提供多租戶、多種作業(yè)任務管理、多資源池并網(wǎng)、多種異構(gòu)算力統(tǒng)一管理和智能調(diào)度的完整解決方案。