趨動(dòng)科技基于銀河麒麟操作系統(tǒng)的異構(gòu)算力池化解決方案

方案背景

Programme background

人工智能技術(shù)作為數(shù)字經(jīng)濟(jì)發(fā)展的重要推手，在各行業(yè)業(yè)務(wù)場(chǎng)景中落地需要大量AI算力資源作為有效保障。在IT基礎(chǔ)設(shè)施普遍云化的今天，AI算力一方面需要通過軟件定義的方式完成算力池化，實(shí)現(xiàn)資源敏捷交付和靈活調(diào)度，簡(jiǎn)化運(yùn)維，另一方面，也需要滿足來自政策和信息安全的安全創(chuàng)新轉(zhuǎn)型要求。

方案概述

Overview of the solution

趨動(dòng)科技獵戶座OrionX AI算力池化軟件通過軟件定義異構(gòu)算力，將物理異構(gòu)算力硬件資源進(jìn)行池化管理，將應(yīng)用與物理硬件資源解耦合，實(shí)現(xiàn)業(yè)務(wù)按需調(diào)度異構(gòu)算力資源及跨廠商異構(gòu)算力資源精細(xì)化管理和靈活調(diào)度。方案主要應(yīng)用于人工智能開發(fā)、訓(xùn)練、推理場(chǎng)景下，可實(shí)現(xiàn)GPU算力資源利用率的優(yōu)化提升，已在能源、金融、運(yùn)營(yíng)商、互聯(lián)網(wǎng)、新能源車企等諸多行業(yè)中產(chǎn)生大量的應(yīng)用案例。

此次趨動(dòng)科技聯(lián)合麒麟軟件，攜手打造基于銀河麒麟操作系統(tǒng)的異構(gòu)算力池化解決方案，共同探索AI領(lǐng)域新場(chǎng)景。

技術(shù)路線

Technical route

芯片架構(gòu) CPU：兆芯、海光、amd64
整機(jī)硬件：中科可控等國(guó)產(chǎn)主流服務(wù)器
加速芯片：海光DCU、寒武紀(jì)MLU、英偉達(dá)GPU
操作系統(tǒng)：銀河麒麟高級(jí)服務(wù)器操作系統(tǒng)V10
基礎(chǔ)軟件：OrionX AI算力池化軟件
應(yīng)用軟件：不限

方案架構(gòu)

Scheme architecture

方案優(yōu)勢(shì)

Solution advantage

結(jié)合銀河麒麟高級(jí)服務(wù)器操作系統(tǒng)V10提供的內(nèi)生本質(zhì)安全、云原生支持、自主平臺(tái)深入優(yōu)化、高性能、易管理等特性，產(chǎn)品層面適應(yīng)算力資源池技術(shù)框架，提升了系統(tǒng)的整體管理、運(yùn)維、支撐能力。
硬件資源與AI應(yīng)用松耦合，CPU算力與AI算力按需配比；
AI算力資源按需調(diào)用，隨需應(yīng)變；
顯存可擴(kuò)展、算力可超分；
AI任務(wù)根據(jù)資源池內(nèi)算力資源使用情況統(tǒng)一調(diào)度；
AI算力資源聲明式申請(qǐng)，資源自動(dòng)聚合滿足單機(jī)單卡，單機(jī)多卡及多機(jī)多卡不同場(chǎng)景要求；
AI算力資源集中管理；
自定義AI算力監(jiān)控規(guī)則及監(jiān)控?cái)?shù)據(jù)可視化；
AI算力數(shù)據(jù)分析及統(tǒng)計(jì)報(bào)表。

應(yīng)用場(chǎng)景

Application scenarios

本方案主要應(yīng)用于人工智能開發(fā)、訓(xùn)練、推理場(chǎng)景下異構(gòu)算力資源的優(yōu)化使用。

成功案例

Success case

案例名稱：某銀行案例

建設(shè)內(nèi)容：通過異構(gòu)算力資源池化，GPU資源池化，提高GPU資源利用率。實(shí)現(xiàn)GPU資源按照按需分配、隨用隨取、動(dòng)態(tài)回收，使GPU資源從緊缺資源變?yōu)榱藦椥再Y源，資源彈性按需分配、化全局調(diào)用、實(shí)時(shí)釋放、避免占用，有效提升GPU資源的利用率，且對(duì)用戶無感知。同時(shí)實(shí)現(xiàn)英偉達(dá)GPU和國(guó)產(chǎn)GPU異構(gòu)下的統(tǒng)一管理和資源合理分配。

方案價(jià)值：方案整體實(shí)現(xiàn)資源池全棧國(guó)產(chǎn)化，可在各類人工智能應(yīng)用場(chǎng)景提供可靠、穩(wěn)定、高效的算力資源。

基礎(chǔ)設(shè)施層：服務(wù)器采用海光提供的通用算力，海光DCU提供強(qiáng)大AI算力。

操作系統(tǒng)層：銀河麒麟高級(jí)服務(wù)器操作系統(tǒng)V10針對(duì)自主海光CPU平臺(tái)在內(nèi)核安全、RAS特性、I/O性能、虛擬化和國(guó)產(chǎn)硬件（橋片、網(wǎng)卡、顯卡、AI卡、加速卡等）及驅(qū)動(dòng)支持等方面優(yōu)化增強(qiáng)。

虛擬化層：趨動(dòng)科技OrionX將AI算力資源抽象為虛擬資源，實(shí)現(xiàn)AI算力資源的軟件定義。

首頁(yè)

產(chǎn)品

解決方案

服務(wù)支持

開發(fā)者

生態(tài)適配

合作共贏

教育培訓(xùn)

關(guān)于我們

行業(yè)通用解決方案

人工智能解決方案