銀河麒麟智算操作系統(tǒng)應(yīng)勢(shì)而生,作為自主創(chuàng)新的智能計(jì)算底座,它以“異構(gòu)混訓(xùn)、安全創(chuàng)新、性能高效、生態(tài)統(tǒng)一”為核心理念,突破技術(shù)藩籬,重構(gòu)算力價(jià)值,旨在為各行業(yè)提供強(qiáng)大、靈活、安全、創(chuàng)新、可靠的智能計(jì)算解決方案,為數(shù)字經(jīng)濟(jì)時(shí)代打造全新“智算引擎”!
銀河麒麟智算操作系統(tǒng)是專(zhuān)為AI時(shí)代設(shè)計(jì)的操作系統(tǒng),覆蓋“芯片適配-算力調(diào)度-開(kāi)發(fā)支持-場(chǎng)景落地”全鏈條,打造智能驅(qū)動(dòng)數(shù)字化標(biāo)桿產(chǎn)品。
基于“全棧式技術(shù)架構(gòu)”的核心定位,系統(tǒng)構(gòu)建了“三位一體”端到端能力體系:系統(tǒng)層提供AI增強(qiáng)的銀河麒麟高級(jí)服務(wù)器操作系統(tǒng),實(shí)現(xiàn)芯片級(jí)異構(gòu)算力適配與智能調(diào)度;框架層提供統(tǒng)一訓(xùn)練/推理框架與高效算子庫(kù),打通開(kāi)發(fā)支持關(guān)鍵路徑;資源管理層通過(guò)云化智能調(diào)度平臺(tái),實(shí)現(xiàn)跨地域異構(gòu)算力的動(dòng)態(tài)優(yōu)化配置。這一架構(gòu)貫通了從硅片到場(chǎng)景的全棧價(jià)值鏈路,既保證了底層算力的高效供給,又降低了中層AI工程化門(mén)檻,還完成上層AI應(yīng)用的敏捷創(chuàng)新支撐,形成從基礎(chǔ)算力到場(chǎng)景價(jià)值的完整轉(zhuǎn)化閉環(huán)。
容器啟動(dòng)加速
容器冷啟動(dòng)速度提升30%以上。
GPU拓?fù)涓兄獌?yōu)化的批量調(diào)度
實(shí)現(xiàn)了GPU拓?fù)涓兄{(diào)度,支持多機(jī)多卡拓?fù)涓兄{(diào)度;麒麟AI作業(yè)調(diào)度器與主流開(kāi)源相比,訓(xùn)練任務(wù)完成時(shí)間縮短約30%,提升大規(guī)模訓(xùn)練時(shí)任務(wù)的運(yùn)行效率。
NUMA感知調(diào)度
實(shí)現(xiàn)了集群級(jí)的NUMA感知調(diào)度,支持NUMA結(jié)構(gòu)下的訪(fǎng)存優(yōu)化組合計(jì)算和自動(dòng)親和性綁定;與kubelet原生NUMA分配算法相比,分配耗時(shí)縮短一倍,提升大規(guī)模訓(xùn)練時(shí)任務(wù)的運(yùn)行效率。
算子分析與優(yōu)化
兼容主流框架算子,面向國(guó)產(chǎn)CPU實(shí)現(xiàn)自適應(yīng)并行化和自動(dòng)向量化CPU算子優(yōu)化,算子性能整體提升3倍以上;實(shí)現(xiàn)100+典型GPU算子優(yōu)化。
多GPU訓(xùn)練框架兼容
同源支持多GPU的統(tǒng)一訓(xùn)練框架,消除各類(lèi)AI加速芯片軟件棧間的差異。
國(guó)產(chǎn)“CPU+GPU”推理框架優(yōu)化
綜合拓?fù)涓兄Y源調(diào)度、基于圖優(yōu)化的算子融合、運(yùn)行時(shí)通信優(yōu)化、運(yùn)行時(shí)內(nèi)存優(yōu)化、GPU算子優(yōu)化、CPU算子優(yōu)化、同步域感知的內(nèi)核線(xiàn)程調(diào)度優(yōu)化等技術(shù)進(jìn)行推理框架優(yōu)化。
異構(gòu)加速卡統(tǒng)一通信庫(kù)
支持異構(gòu)GPU間混合GDR,支持Allreduce、Allgather、All2all等典型集合通信,支持多節(jié)點(diǎn)異構(gòu)多卡的DDP并行訓(xùn)練。
? 智慧金融——基于銀河麒麟智算操作系統(tǒng)的金融大模型推理優(yōu)化
方案架構(gòu):適配支持FT5000C+某國(guó)產(chǎn)GPU 64卡集群;
應(yīng)用價(jià)值:適配支持金融大模型及基于金融大模型的風(fēng)控等金融場(chǎng)景推理服務(wù);數(shù)據(jù)訪(fǎng)問(wèn)延遲降低40%-60%,計(jì)算性能大幅提升,推理性能最高提升達(dá)9.67倍。
? 智慧黨建——基于銀河麒麟智算操作系統(tǒng)的智慧審校模型適配優(yōu)化
方案架構(gòu):基于FT5000C+某國(guó)產(chǎn)GPU 4卡AI服務(wù)器;
當(dāng)前,計(jì)算產(chǎn)業(yè)面臨著以人工智能為驅(qū)動(dòng)力的新變革。麒麟軟件將順應(yīng)變革趨勢(shì),持續(xù)投入AI相關(guān)技術(shù)研發(fā),聚焦產(chǎn)業(yè)與市場(chǎng)發(fā)展需要,滿(mǎn)足算力需求,與生態(tài)伙伴加強(qiáng)協(xié)同,賦能千行百業(yè)數(shù)智化轉(zhuǎn)型。
通訊員 | 劉韻
來(lái) 源 | 麒麟軟件研究院