趨動(dòng)科技獵戶座OrionX AI算力池化軟件通過軟件定義異構(gòu)算力,將物理異構(gòu)算力硬件資源進(jìn)行池化管理,將應(yīng)用與物理硬件資源解耦合,實(shí)現(xiàn)業(yè)務(wù)按需調(diào)度異構(gòu)算力資源及跨廠商異構(gòu)算力資源精細(xì)化管理和靈活調(diào)度。方案主要應(yīng)用于人工智能開發(fā)、訓(xùn)練、推理場(chǎng)景下,可實(shí)現(xiàn)GPU算力資源利用率的優(yōu)化提升,已在能源、金融、運(yùn)營(yíng)商、互聯(lián)網(wǎng)、新能源車企等諸多行業(yè)中產(chǎn)生大量的應(yīng)用案例。
此次趨動(dòng)科技聯(lián)合麒麟軟件,攜手打造基于銀河麒麟操作系統(tǒng)的異構(gòu)算力池化解決方案,共同探索AI領(lǐng)域新場(chǎng)景。
芯片架構(gòu) CPU:兆芯、海光、amd64
整機(jī)硬件:中科可控等國(guó)產(chǎn)主流服務(wù)器
加速芯片:海光DCU、寒武紀(jì)MLU、英偉達(dá)GPU
操作系統(tǒng):銀河麒麟高級(jí)服務(wù)器操作系統(tǒng)V10
基礎(chǔ)軟件:OrionX AI算力池化軟件
應(yīng)用軟件:不限
結(jié)合銀河麒麟高級(jí)服務(wù)器操作系統(tǒng)V10提供的內(nèi)生本質(zhì)安全、云原生支持、自主平臺(tái)深入優(yōu)化、高性能、易管理等特性,產(chǎn)品層面適應(yīng)算力資源池技術(shù)框架,提升了系統(tǒng)的整體管理、運(yùn)維、支撐能力。
硬件資源與AI應(yīng)用松耦合,CPU算力與AI算力按需配比;
AI算力資源按需調(diào)用,隨需應(yīng)變;
顯存可擴(kuò)展、算力可超分;
AI任務(wù)根據(jù)資源池內(nèi)算力資源使用情況統(tǒng)一調(diào)度;
AI算力資源聲明式申請(qǐng),資源自動(dòng)聚合滿足單機(jī)單卡,單機(jī)多卡及多機(jī)多卡不同場(chǎng)景要求;
AI算力資源集中管理;
自定義AI算力監(jiān)控規(guī)則及監(jiān)控?cái)?shù)據(jù)可視化;
AI算力數(shù)據(jù)分析及統(tǒng)計(jì)報(bào)表。
本方案主要應(yīng)用于人工智能開發(fā)、訓(xùn)練、推理場(chǎng)景下異構(gòu)算力資源的優(yōu)化使用。
案例名稱:某銀行案例
建設(shè)內(nèi)容:通過異構(gòu)算力資源池化,GPU資源池化,提高GPU資源利用率。實(shí)現(xiàn)GPU資源按照按需分配、隨用隨取、動(dòng)態(tài)回收,使GPU資源從緊缺資源變?yōu)榱藦椥再Y源,資源彈性按需分配、化全局調(diào)用、實(shí)時(shí)釋放、避免占用,有效提升GPU資源的利用率,且對(duì)用戶無感知。同時(shí)實(shí)現(xiàn)英偉達(dá)GPU和國(guó)產(chǎn)GPU異構(gòu)下的統(tǒng)一管理和資源合理分配。
方案價(jià)值:方案整體實(shí)現(xiàn)資源池全棧國(guó)產(chǎn)化,可在各類人工智能應(yīng)用場(chǎng)景提供可靠、穩(wěn)定、高效的算力資源。
基礎(chǔ)設(shè)施層:服務(wù)器采用海光提供的通用算力,海光DCU提供強(qiáng)大AI算力。
操作系統(tǒng)層:銀河麒麟高級(jí)服務(wù)器操作系統(tǒng)V10針對(duì)自主海光CPU平臺(tái)在內(nèi)核安全、RAS特性、I/O性能、虛擬化和國(guó)產(chǎn)硬件(橋片、網(wǎng)卡、顯卡、AI卡、加速卡等)及驅(qū)動(dòng)支持等方面優(yōu)化增強(qiáng)。
虛擬化層:趨動(dòng)科技OrionX將AI算力資源抽象為虛擬資源,實(shí)現(xiàn)AI算力資源的軟件定義。