60%到80%！麒麟軟件虛擬GPU方案進一步提升3D渲染性能

發(fā)布時間：2023-11-23 瀏覽次數(shù)：4463次作者：麒麟軟件

近日，麒麟軟件研發(fā)中心虛擬化技術(shù)研發(fā)團隊推出虛擬GPU方案V2.0，該方案采用vhost-user-gpu、3D渲染同步優(yōu)化、基于動態(tài)數(shù)據(jù)的云桌面刷新等技術(shù)，將虛擬機GPU的3D渲染性能大幅提升到后端GPU 3D渲染性能的80%以上，無需專業(yè)顯卡支持，通過消費級顯卡即可使虛擬機滿足圖像處理、平面設(shè)計、3D建模以及游戲等場景的需求，同時可實現(xiàn)1:N的靈活性和隔離性，大大降低了用戶使用成本。

隨著云桌面技術(shù)的發(fā)展和廣泛應用，用戶在云桌面進行圖像處理、平面設(shè)計、3D建模以及游戲等場景需求增多，這對云桌面的圖像渲染能力提出了越來越高的要求。在2022年5月，麒麟軟件基于開源virtio-gpu半虛擬化顯卡技術(shù)和api轉(zhuǎn)發(fā)方案，開發(fā)了自己的虛擬GPU方案V1.0。該方案對virtio-gpu虛擬顯卡進行了深度優(yōu)化，在有后端GPU支持的情況下，可將virtio-gpu的渲染性能提升到后端GPU性能的60%（采用glmark2渲染基準測試）。

然而，與GPU硬件虛擬化方案相比，麒麟軟件虛擬GPU方案V1.0的渲染轉(zhuǎn)發(fā)過程開銷仍比較大，后端物理GPU沒能得到充分利用，損失近40%的渲染性能。針對該問題，對虛擬GPU方案進一步升級優(yōu)化，推出麒麟軟件虛擬GPU方案V2.0，使得渲染過程中的性能損耗降低到兩成以內(nèi)，3D綜合渲染性能可以達到后端GPU性能的八成以上。

方案介紹

麒麟軟件虛擬GPU方案V2.0版優(yōu)化如下：

麒麟軟件虛擬GPU方案V2.0版技術(shù)框圖

GPU方案V2.0采用新技術(shù)框架，使用vhost-user-gpu虛擬顯卡（基于vhost-user技術(shù)實現(xiàn)）替換了V1.0方案采用的virtio-gpu虛擬顯卡。vhost-user-gpu虛擬顯卡無需經(jīng)由宿主機內(nèi)核kvm模塊和用戶態(tài)切換，可以通過共享內(nèi)存直接與虛擬機進行數(shù)據(jù)面通信，減少了大量的用戶態(tài)（vm exit 和 vm entry）切換開銷，V1.0版本額外開銷更小，性能更好。

此外，GPU方案V2.0，還突破了渲染命令執(zhí)行實時監(jiān)聽技術(shù)與快速命令反饋技術(shù)，在渲染命令執(zhí)行過程中，實現(xiàn)實時監(jiān)聽，提升命令執(zhí)行監(jiān)聽精確度，減少物理GPU的空閑等待；在命令執(zhí)行完畢前，預先準備好反饋數(shù)據(jù)，提升反饋速度和減少反饋時間開銷。實現(xiàn)了由完整桌面刷新改為動態(tài)區(qū)域刷新，即只刷新桌面顯示數(shù)據(jù)有變化的區(qū)域，降低云桌面刷新時，讀取物理GPU中未變化圖像數(shù)據(jù)所造成的額外開銷。

為驗證方案效果，基于Intel集顯、AMD RX550以及Nvidia RTX2060三種不同廠商的顯卡，以及glmark2和gputest兩種不同的基準測試程序?qū)host-user-gpu的3d渲染性能進行了測試，結(jié)果如下：

在glmark2基準測試下，vhost-user-gpu在分別以三種不同類型的GPU作為后端渲染加速GPU的情況下，測試得分均達到甚至超過物理GPU的原始測試得分的80%。

glmark2基準測試性能測試數(shù)據(jù)

在gputest基準測試下，對比vhost-user-gpu與物理GPU在7個不同測試場景下的得分，結(jié)果顯示，在大多數(shù)情況下，優(yōu)化后的vhost-user-gpu的性能同樣可以達到物理GPU原始性能的80%以上。

GPUTEST基準測試性能數(shù)據(jù)表

此外，麒麟軟件虛擬化GPU方案V2.0還進行了廣泛的架構(gòu)適配和顯卡適配，在商用x86、arm架構(gòu)下，采用主流顯卡廠商GPU作為后端GPU時，該方案均能正常運行，進一步提升了麒麟軟件虛擬GPU方案的商業(yè)競爭力。未來，麒麟軟件在創(chuàng)新之路上再接再厲，打造好用、易用的操作系統(tǒng)產(chǎn)品，為用戶帶來更好的使用體驗，助力我國數(shù)字經(jīng)濟建設(shè)。

通訊員 | 李富有、韓慶春

來源 | 研發(fā)中心、產(chǎn)品管理部

審核 | 市場與政府事務部

熱點推薦