近日,麒麟軟件研發(fā)中心虛擬化技術(shù)研發(fā)團隊推出虛擬GPU方案V2.0,該方案采用vhost-user-gpu、3D渲染同步優(yōu)化、基于動態(tài)數(shù)據(jù)的云桌面刷新等技術(shù),將虛擬機GPU的3D渲染性能大幅提升到后端GPU 3D渲染性能的80%以上,無需專業(yè)顯卡支持,通過消費級顯卡即可使虛擬機滿足圖像處理、平面設(shè)計、3D建模以及游戲等場景的需求,同時可實現(xiàn)1:N的靈活性和隔離性,大大降低了用戶使用成本。
隨著云桌面技術(shù)的發(fā)展和廣泛應用,用戶在云桌面進行圖像處理、平面設(shè)計、3D建模以及游戲等場景需求增多,這對云桌面的圖像渲染能力提出了越來越高的要求。在2022年5月,麒麟軟件基于開源virtio-gpu半虛擬化顯卡技術(shù)和api轉(zhuǎn)發(fā)方案,開發(fā)了自己的虛擬GPU方案V1.0。該方案對virtio-gpu虛擬顯卡進行了深度優(yōu)化,在有后端GPU支持的情況下,可將virtio-gpu的渲染性能提升到后端GPU性能的60%(采用glmark2渲染基準測試)。
然而,與GPU硬件虛擬化方案相比,麒麟軟件虛擬GPU方案V1.0的渲染轉(zhuǎn)發(fā)過程開銷仍比較大,后端物理GPU沒能得到充分利用,損失近40%的渲染性能。針對該問題,對虛擬GPU方案進一步升級優(yōu)化,推出麒麟軟件虛擬GPU方案V2.0,使得渲染過程中的性能損耗降低到兩成以內(nèi),3D綜合渲染性能可以達到后端GPU性能的八成以上。
方案介紹
麒麟軟件虛擬GPU方案V2.0版優(yōu)化如下:
麒麟軟件虛擬GPU方案V2.0版技術(shù)框圖
GPU方案V2.0采用新技術(shù)框架,使用vhost-user-gpu虛擬顯卡(基于vhost-user技術(shù)實現(xiàn))替換了V1.0方案采用的virtio-gpu虛擬顯卡。vhost-user-gpu虛擬顯卡無需經(jīng)由宿主機內(nèi)核kvm模塊和用戶態(tài)切換,可以通過共享內(nèi)存直接與虛擬機進行數(shù)據(jù)面通信,減少了大量的用戶態(tài)(vm exit 和 vm entry)切換開銷,V1.0版本額外開銷更小,性能更好。
此外,GPU方案V2.0,還突破了渲染命令執(zhí)行實時監(jiān)聽技術(shù)與快速命令反饋技術(shù),在渲染命令執(zhí)行過程中,實現(xiàn)實時監(jiān)聽,提升命令執(zhí)行監(jiān)聽精確度,減少物理GPU的空閑等待;在命令執(zhí)行完畢前,預先準備好反饋數(shù)據(jù),提升反饋速度和減少反饋時間開銷。實現(xiàn)了由完整桌面刷新改為動態(tài)區(qū)域刷新,即只刷新桌面顯示數(shù)據(jù)有變化的區(qū)域,降低云桌面刷新時,讀取物理GPU中未變化圖像數(shù)據(jù)所造成的額外開銷。
為驗證方案效果,基于Intel集顯、AMD RX550以及Nvidia RTX2060三種不同廠商的顯卡,以及glmark2和gputest兩種不同的基準測試程序?qū)host-user-gpu的3d渲染性能進行了測試,結(jié)果如下:
在glmark2基準測試下,vhost-user-gpu在分別以三種不同類型的GPU作為后端渲染加速GPU的情況下,測試得分均達到甚至超過物理GPU的原始測試得分的80%。
glmark2基準測試性能測試數(shù)據(jù)
在gputest基準測試下,對比vhost-user-gpu與物理GPU在7個不同測試場景下的得分,結(jié)果顯示,在大多數(shù)情況下,優(yōu)化后的vhost-user-gpu的性能同樣可以達到物理GPU原始性能的80%以上。
GPUTEST基準測試性能數(shù)據(jù)表
此外,麒麟軟件虛擬化GPU方案V2.0還進行了廣泛的架構(gòu)適配和顯卡適配,在商用x86、arm架構(gòu)下,采用主流顯卡廠商GPU作為后端GPU時,該方案均能正常運行,進一步提升了麒麟軟件虛擬GPU方案的商業(yè)競爭力。未來,麒麟軟件在創(chuàng)新之路上再接再厲,打造好用、易用的操作系統(tǒng)產(chǎn)品,為用戶帶來更好的使用體驗,助力我國數(shù)字經(jīng)濟建設(shè)。
通訊員 | 李富有、韓慶春
來 源 | 研發(fā)中心、產(chǎn)品管理部
熱點推薦