91精品国产手机在线-白筒袜嫩萝双腿之间乳白液体-青青操手机在线视频观看-日本中文字幕人妻日韩-日韩精品在线观看视频网站-天堂资源中文最新版在线一区-欧美专区一区二区三区-国产综合亚洲欧美在线-国产精品久久久久久福利69堂

ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍

除了面向64位移動計算的Cortex-X2、Cortex-A710、Cortex-A510三款全新CPU IP,ARM今天還帶來了多達四款新的移動GPU IP,同樣啟用新的命名規(guī)則,分別是Mali-G710、Mali-G610、Mali-G510、Mali-G310 。
G710、G510、G310分別定位旗艦、主流、入門級市場,依次取代現(xiàn)有的G78、G57、G310 。
G610其實和G710是一回事兒,只是核心數(shù)較少時單獨使用的名字 。
ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

這是ARM Valhall GPU架構(gòu)的第三代產(chǎn)品,也是第一次完整覆蓋高中低端各個領域 。
搭配同時發(fā)布的Cortex-X2/A710/A510 CPU、CoreLink CI-700一致性互連技術(shù)、CoreLink NI-700芯片網(wǎng)絡一起,它們可以構(gòu)成完整、強大的SoC解決方案 。
ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

雖然架構(gòu)變化不大,只是繼續(xù)優(yōu)化提升,但是這一代Mali GPU的性能進步還是很可觀的:
G710號稱綜合性能提升20%、機器學習性能提升35%、紋理性能提升50%、能效提升20% 。
G510綜合性能提升100%、機器學習性能提升100%、能效提升22% 。
G310雖然定位最低但變化最大,號稱紋理性能提升多達6倍、Vulkan性能提升4.5倍、安卓UI內(nèi)容性能提升2倍 。
ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

G710的執(zhí)行引擎設計和G77、G78十分相似,變化更多是一些細節(jié) 。
wavefront/warp大小從8翻番到了16,而且每個執(zhí)行引擎有兩個數(shù)據(jù)路徑,最終形成每個核心32個FMA 。
ISA指令集也有了不小的改進,可以更好地滿足Vulkan等現(xiàn)代GPU的需求,但暫無細節(jié) 。
G710還新增了一個執(zhí)行引擎,每個著色器核心的計算性能因此翻番,同時每核心每時鐘周期的不同吞吐量也有4倍、8倍的增加 。
紋理單元也是全新的,每時鐘周期可以處理最多80億紋理,再加上面積優(yōu)化,單位密度紋理性能提升了50% 。
16寬度執(zhí)行單元單實例變成了4寬度四實例,整體吞吐量不變,但是資源分配更合理,效率更高 。
新的執(zhí)行引擎每核心每時鐘周期FMA翻了一番,同時功耗也優(yōu)化降低了20% 。
另外,傳統(tǒng)的工作管理器(Job Manager)變成了新的“指令流前端”(Command Stream Frontend),負責調(diào)度和處理draw-call,還第一次帶來了固件層,與硬件緊密配合處理主機需求 。
G710可以配置8-16個不同核心數(shù),G610則是最多6個核心,另外二級緩存可以配置2個或4個區(qū)塊,每個區(qū)塊256KB或者512KB,也就是整體最小512KB,最多2MB 。
ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍
文章圖片

G510支持2-6個核心配置,每核心每執(zhí)行單元的配置也可以定制,紋理單元也大大加強 。
執(zhí)行引擎還是2個,但也可以配置為只用1個,每時鐘周期64 FMA會因此減少到48 FMA 。
ARM列舉了G510 10種可能的不同規(guī)格配置,計算能力、填充率各有不同,適合不同應用需求 。
ARM ARM連發(fā)四款Mali GPU:一律全新架構(gòu)、性能飛躍最多6倍

推薦閱讀