国产在线视频精品视频,国产亚洲精品久久久久久青梅 ,国产麻豆精品一区,国产真实乱对白精彩久久,国产精品视频一区二区三区四

加載中...
您的位置:首頁 >基金 > 正文

Arm 技術(shù)媒體分享日:TCS23如何滿足未來計(jì)算復(fù)雜需求-環(huán)球快播

2023-07-03 15:49:44 來源:OFweek電子工程網(wǎng)

5月29日,Arm正式宣布推出2023全面計(jì)算解決方案(TCS23),該解決方案提供一整套針對(duì)特定工作負(fù)載而設(shè)計(jì)與優(yōu)化的最新IP,可作為一個(gè)完整系統(tǒng)無縫地協(xié)同工作,從而滿足日益增長(zhǎng)的移動(dòng)用戶體驗(yàn)需求。


(相關(guān)資料圖)

6月8-9日,Arm在北京舉辦為期兩天的媒體技術(shù)日活動(dòng),來自Arm總部的技術(shù)專家們親臨現(xiàn)場(chǎng),深度解讀了TCS23,包括在CPU、GPU、安全及軟件方面的最新技術(shù)動(dòng)態(tài),并分享了Arm在終端設(shè)備領(lǐng)域的應(yīng)用創(chuàng)新和市場(chǎng)洞見。本文也將整理匯總出各位技術(shù)專家的精彩觀點(diǎn),以饗讀者。

TCS23:滿足未來計(jì)算復(fù)雜需求

在開場(chǎng)致辭中,Arm產(chǎn)品營(yíng)銷副總裁Ian Smythe提到,Arm 2023全面計(jì)算解決方案在設(shè)計(jì)時(shí)充分考慮了智能手機(jī)的需求,它涵蓋了首屈一指的全新旗艦級(jí)Arm Immortalis GPU,帶來最佳的視覺體驗(yàn),它提供了全新的Armv9 CPU集群,延續(xù)了Arm在智能AI的領(lǐng)先性能地位,以及帶來新的提升和優(yōu)化,使Arm開發(fā)者能夠更容易地訪問軟件,這些元素全部結(jié)合在Arm 2023全面計(jì)算解決方案中,為整個(gè)系統(tǒng)的關(guān)鍵工作負(fù)載帶來了顯著提升。

毫無疑問,Arm所發(fā)布的全新的TCS23是針對(duì)移動(dòng)計(jì)算的最優(yōu)選的計(jì)算平臺(tái),它包括了最尖端的CPU 術(shù)和GPU 技術(shù),能夠讓游戲開發(fā)者以及人工智能應(yīng)用開發(fā)者實(shí)現(xiàn)沉浸式體驗(yàn)的打造。它除了在硬件方面,還包括軟件以及安全保駕護(hù)航的一些技術(shù)。與此同時(shí),Arm也給世界各地的開發(fā)者提供無縫的軟件開發(fā)體驗(yàn),并確保開發(fā)者能夠充分釋放其創(chuàng)造潛力,為現(xiàn)代工作負(fù)載充分發(fā)揮設(shè)計(jì)才能。

實(shí)際上,從2019年開始Arm就持續(xù)在以解決方案的角度進(jìn)行技術(shù)產(chǎn)品的開發(fā),并努力促成CPU、GPU、系統(tǒng)級(jí)IP元素的融合,通過方案式的開發(fā)滿足不同客戶共同的需求,真正實(shí)現(xiàn)“1+1>2”這樣的IP集合。這些IP合集除了能讓合作伙伴獲得更高的性能、效率以及水平之外,更重要的是這些解決方案能讓合作伙伴開發(fā)出針對(duì)新的工作負(fù)載和更新的計(jì)算類型的產(chǎn)品。

Arm為什么要采用這種全面計(jì)算解決方案的方法?據(jù)Arm終端事業(yè)部產(chǎn)品管理高級(jí)總監(jiān)Kinjal Dave介紹,每一代新出來的終端設(shè)備,通常都是滿足最終用戶的非常復(fù)雜的期許,比如出現(xiàn)了人工智能方面的應(yīng)用,就會(huì)收到來自開發(fā)者或OEM的反饋,基于這個(gè)反饋Arm會(huì)開發(fā)出新的IP從而提升性能和效率,接著會(huì)推動(dòng)新的軟件能力、應(yīng)用以及移動(dòng)設(shè)備的創(chuàng)新誕生,就是這樣一個(gè)無限的循環(huán)周期,帶來每一年全面計(jì)算解決方案解決效率的雙提升。

Kinjal Dave進(jìn)一步表示:“對(duì)于Arm來說,我們每年推出的TCS在性能跟效率方面都必須實(shí)現(xiàn)進(jìn)步。所以我們要采取一種平衡。一方面,單獨(dú)的IP要不斷把它做強(qiáng),另外一方面把這些單獨(dú)的IP集合在一起時(shí),總體的系統(tǒng)級(jí)別也要實(shí)現(xiàn)性能效率的雙提升,這表示我們不光要考慮在實(shí)驗(yàn)室里的這些基準(zhǔn)測(cè)試數(shù)字的提高,同時(shí)還要考慮到在現(xiàn)實(shí)世界中的實(shí)際用例,從而為我們的合作伙伴提供融合了這些單獨(dú)IP的系統(tǒng)級(jí)解決方案所帶來的完整性能提升?!?/p>

Arm史上最強(qiáng)大CPU計(jì)算集群

據(jù)Arm終端事業(yè)部產(chǎn)品管理總監(jiān)Saurabh Pradhan介紹,這次TCS23之下的三個(gè)大IP:Cortex-X4、Cortex-A720、Cortex-A520,可以被稱為Arm史上最強(qiáng)大,最具高效性,且最有能力的計(jì)算集群。

具體來看,Cortex-X4是Arm連續(xù)實(shí)現(xiàn)第四年雙位數(shù)性能提升的Cortex-X系列產(chǎn)品,在性能方面與上一代安卓旗艦產(chǎn)品相比較提升15%。除了性能之外,它也是最為高效的,面積效率比最高的Cortex核產(chǎn)品。同時(shí)它也具備更高的可伸縮性,最高可以支持每個(gè)核2M的2級(jí)緩存。

Cortex-A520則實(shí)現(xiàn)了最佳的電源效率,與Cortex-A510相比較,它在能效方面提高了22%。尤其針對(duì)于低密度背景任務(wù)而言,能延遲電池的續(xù)航時(shí)間。它也是封裝最小的一款Cortex產(chǎn)品,非常適用于入門級(jí)和終端的手機(jī)設(shè)備。

Cortex-A720是CPU集群產(chǎn)品中的主力產(chǎn)品,它是在持續(xù)性能方面的業(yè)界領(lǐng)先IP。對(duì)比于Cortex-A715,Cortex-A720在高效方面實(shí)現(xiàn)了20%的提升,可以讓合作伙伴的設(shè)備在更長(zhǎng)時(shí)間內(nèi)支持多線程的應(yīng)用處理。除了針對(duì)高端機(jī)的手機(jī)時(shí)長(zhǎng), Cortex-A720在面積配置性方面還做了一個(gè)擴(kuò)展,從而能滿足其他檔次的手機(jī)市場(chǎng)。

值得一提的是,以上三款 IP 都是基于全新的Armv9.2架構(gòu),也都是純64位IP產(chǎn)品。

除此之外,Arm今年還發(fā)布了DSU-120,不光可以把所有的IP很好地結(jié)合在一起,同時(shí)也是催化劑,能夠?qū)崿F(xiàn)CPU集群最好的性能和效率。

據(jù)了解,今年的DSU實(shí)現(xiàn)了三方面的提升,第一是可伸縮性,在一個(gè)集群中可以支持高達(dá)14核的數(shù)量,同時(shí)它能夠支持24M或者最高達(dá)32M的3級(jí)緩存,這可以針對(duì)筆記本及筆記本以上的一些設(shè)備進(jìn)行使用;第二個(gè)提升體現(xiàn)在新的PPA上,可以進(jìn)一步降低漏電,同時(shí)支持更多新的電源模式,進(jìn)一步提高電效,從而延長(zhǎng)電池壽命;第三是全新的功能,基于最新的Armv9.2的架構(gòu),它可以去支持比如帶寬分區(qū)還有節(jié)點(diǎn)最大化和納入一些新的接口。

不難發(fā)現(xiàn),在今年的集群中所有的IP都實(shí)現(xiàn)了極大的能效提升,能滿足合作伙伴的產(chǎn)品高性能以及低功耗的需求。除了性能與功耗之外,Armv9平臺(tái)架構(gòu)一經(jīng)推出就給市場(chǎng)帶來了新設(shè)備的浪潮,這些設(shè)備安全性、性能更高,而且有更好的技術(shù)開發(fā)者可接入性。所以今年這個(gè)架構(gòu)更進(jìn)一步,分別由 Armv9.1和Armv9.2所帶來一些新的功能,比如PMU方面的完善還有工具方面的新功能。所以這些架構(gòu)的進(jìn)步都是針對(duì)TCS23的三大支柱來做的:安全性、性能,以及開發(fā)者的體驗(yàn)或者可及性。

Saurabh Pradhan總結(jié)表示:“總而言之,CPU集群是一個(gè)團(tuán)隊(duì)作戰(zhàn)的任務(wù),對(duì)于 Arm 而言我們一直承諾于不斷地提升我們產(chǎn)品的系統(tǒng)級(jí)的性能、功效。我們整個(gè)產(chǎn)品組合都在追求這些性能功效的提升,從而能夠接入新的市場(chǎng),同時(shí)也讓低端和終端的市場(chǎng)使用到最新的創(chuàng)新技術(shù)?!?/p>

基于第五代全新架構(gòu)的Immortalis-G720

在所有的旗艦級(jí)的SoC中,GPU對(duì)芯片面積預(yù)算的需求每年都在增加,Arm也不例外。去年,Arm推出了旗艦 GPU 產(chǎn)品 Immortalis-G715 ,它是基于第四代Valhall GPU構(gòu)架,當(dāng)時(shí)發(fā)布了Mali-G715和G615 GPU。今年,Arm再次帶來了三款全新的基于第五代架構(gòu)的GPU產(chǎn)品,新GPU將繼續(xù)面向廣泛的市場(chǎng),從高端的智能手機(jī)到筆記本電腦、汽車、電視、VR、機(jī)頂盒、手機(jī)等。

據(jù)Arm終端事業(yè)部產(chǎn)品管理高級(jí)總監(jiān)Anand Patel介紹,第五代GPU架構(gòu)延續(xù)了上一代Valhall GPU架構(gòu)的成功,將專注于系統(tǒng)級(jí)的圖形性能,推動(dòng)下一代視覺計(jì)算的交付。不僅GPU本身能夠提供最佳的性能,同時(shí)它與外部?jī)?nèi)存、CPU 系統(tǒng)級(jí)緩存在執(zhí)行中也能實(shí)現(xiàn)最佳性能。

據(jù)悉,這是通過更為先進(jìn)的渲染管線來實(shí)現(xiàn)的,這些管線能夠提高功效,并且?guī)砀哂谐两械挠螒蛞约皩?shí)時(shí)3D的應(yīng)用程序,而且能讓這些程序有更長(zhǎng)的運(yùn)行時(shí)間??梢哉f是為第五代GPU奠定了基礎(chǔ),讓它能夠進(jìn)一步完善游戲體驗(yàn)新功能。

Anand Patel重點(diǎn)介紹了基于Arm第五代全新架構(gòu)的Immortalis-G720。全新的G720帶來全面系統(tǒng)級(jí)的效率提升,使用內(nèi)存帶寬最終減少40%,從GPU效率來說,每瓦特性能能夠平均節(jié)省15%。

此外,Immortalis-G720上還搭載了DVS(延遲頂點(diǎn)著色)技術(shù),這是全新的渲染管線,徹底解決了集合數(shù)據(jù)流?!癉VS其實(shí)對(duì)很多現(xiàn)在常見的內(nèi)容完善都是非常有增益的,它有助于在用到最復(fù)雜的場(chǎng)景時(shí)保持幀率的一致性,這也就非常好地驗(yàn)證了下一代高幾何內(nèi)容的未來。”Anand Patel展示了Immortalis-G720對(duì)比Immortalis-G715針對(duì)幾款流行游戲進(jìn)行測(cè)試的數(shù)據(jù),可以看到在使用更少內(nèi)存帶寬的情況下,可以減少DRAM的功率并且同時(shí)還能提高性能。此外Immortalis-G720在寫入WRITE BW帶寬方面提高了31%,幫助用戶總體帶來20%性能的提升。

Arm還將為開發(fā)者在Arm Mobile Studio中提供開發(fā)GPU的工具,與去年不同的是現(xiàn)在所有的功能都是免費(fèi)的,相信這些功能可以幫助開發(fā)者針對(duì)Arm GPU進(jìn)行優(yōu)化,從而實(shí)現(xiàn)開箱即用的出色性能。除了Immortalis-G720以外,Arm今年還帶來了Mali-G720和Mali-G620,其中Mali-G720支持6-9個(gè)內(nèi)核,Mali-G620提供多達(dá)五個(gè)內(nèi)核,能為開發(fā)者帶來顯著的效率性能的提升以及其他的益處。

攜手合作伙伴解讀安全技術(shù)

Arm終端事業(yè)部軟件戰(zhàn)略總監(jiān)盧旻盛針對(duì)安全主題分享了Armv9的技術(shù)原理和對(duì)整個(gè)形態(tài)和計(jì)算的影響,其中重點(diǎn)強(qiáng)調(diào)了內(nèi)存標(biāo)記擴(kuò)展(Memory Tagging Extension, MTE)特性。據(jù)了解,MTE可以幫助開發(fā)者在部署之前和之后檢測(cè)到內(nèi)存安全問題,保證App內(nèi)存穩(wěn)定性提升用戶體驗(yàn),并減少安全漏洞降低受到攻擊的可能性。

“所以MTE是Armv9的基礎(chǔ)性能,它也是64位架構(gòu)和應(yīng)用未來的趨勢(shì),Arm實(shí)現(xiàn)的MTE為兩階段系統(tǒng),即‘鎖’和‘密鑰’。如果密鑰匹配,則允許訪問鎖內(nèi)存;否則,訪問可能會(huì)被記錄下來或出錯(cuò)。這樣就可以更輕松地檢測(cè)到難以捕獲的內(nèi)存安全錯(cuò)誤,也有助于進(jìn)行常規(guī)調(diào)試?!?/p>

盧旻盛表示,在鎖和密鑰兩階段系統(tǒng)中,存在兩種類型的標(biāo)記:一是地址標(biāo)記,用作密鑰。這將在進(jìn)程中每個(gè)指針的最高位增加四位。地址標(biāo)記僅適用于64位應(yīng)用,因?yàn)樗褂昧恕案咦止?jié)忽略”功能,這是 Arm 64位的一個(gè)功能;二是內(nèi)存標(biāo)記,用作鎖。內(nèi)存標(biāo)記也由四位組成,與應(yīng)用內(nèi)存空間中每個(gè)對(duì)齊的16字節(jié)區(qū)域相連接。Arm將這些16字節(jié)區(qū)域稱為標(biāo)記顆粒。這四位并不用于應(yīng)用數(shù)據(jù),而且是分開存儲(chǔ)。

Arm的生態(tài)圈合作伙伴也分享了對(duì)于MTE技術(shù)的看法。MediaTek無線通信事業(yè)部資深總監(jiān)章立表示,芯片級(jí)的安全是整個(gè)移動(dòng)生態(tài)的基礎(chǔ)設(shè)施,沒有芯片級(jí)的安全就沒有今天移動(dòng)生態(tài)的繁榮。MediaTek作為最早一批擁抱MTE的合作伙伴,在去年發(fā)布天璣9200時(shí)就已經(jīng)支持MTE,未來還會(huì)繼續(xù)深入合作。

vivo芯片規(guī)劃和架構(gòu)高級(jí)總監(jiān)夏曉菲則表示,Armv9處理器也帶來了非常重要的安全特性MTE,在內(nèi)存泄露以及保護(hù)上能減少設(shè)備的運(yùn)行風(fēng)險(xiǎn),同時(shí)這個(gè)技術(shù)通過硬件級(jí)的技術(shù)避免了內(nèi)存的功耗。vivo作為一個(gè)重要的整機(jī)廠家,也通過和Arm與MediaTek的合作,給開發(fā)者提供了從X90和X80版本上提供了開發(fā)者的版本,這樣能讓軟件開發(fā)者有效把MTE利用起來。

榮耀公司MagicOS DFS架構(gòu)師余亮指出了為什么要使用MTE,首先是在遇到“踩內(nèi)存”問題時(shí)MTE能第一時(shí)間捕獲故障現(xiàn)場(chǎng)日志,提供更準(zhǔn)確的定位信息,最后更低的內(nèi)存開銷和更好的指令性能,相比ASan、HWASan 更接近用戶真實(shí)的性能環(huán)境。榮耀天網(wǎng)開放了基于MTE/ HWAsan踩內(nèi)存檢測(cè),和內(nèi)存泄漏的檢測(cè)功能,無論對(duì)于有源代碼和無源代碼,應(yīng)用或者服務(wù)無需重新編譯,安裝即可支持踩內(nèi)存故障的檢測(cè),同時(shí)天網(wǎng)也集成了類似泄露的檢測(cè),提供了泄露站的聚合能力。

快手Android架構(gòu)師李銳介紹,通過與Arm、Google、vivo、榮耀等公司合作,快手在大型Android工程項(xiàng)目中使用Arm MTE提高內(nèi)存安全,90%的內(nèi)存安全問題可以在App正式發(fā)布之前就在線下被檢測(cè)攔截,全面保障線上用戶的基礎(chǔ)體驗(yàn)。

面向軟件及生態(tài)系統(tǒng)方面的工作

在軟件生態(tài)方面,Arm終端事業(yè)部生態(tài)系統(tǒng)及工程高級(jí)總監(jiān)Geraint North分別以四個(gè)主題來介紹了Arm在軟件以及生態(tài)系統(tǒng)合作方面的工作。

第一個(gè)主題是將64位部署到移動(dòng)領(lǐng)域,以及下一步的發(fā)展方向。眾所周知,多年以來64位應(yīng)用比32位的應(yīng)用都提供了更高的性能和安全性,但是安卓移動(dòng)生態(tài)系統(tǒng)向64位的遷移卻是一個(gè)非常漫長(zhǎng)的歷程,早在10多年前就已經(jīng)推出第一款64位功能的Arm CPU,僅面世兩年安卓的生態(tài)系統(tǒng)就已經(jīng)能很好地利用它的能力。隨著去年P(guān)ixel手機(jī)推出僅支持的64位的安卓配置,相信將64位部署到移動(dòng)領(lǐng)域的這段旅程也快走完了。64位有哪些優(yōu)勢(shì)?一個(gè)是提供了更高的安全性,其次是相較于32位IP帶來更高的性能提升,并且這個(gè)性能差別隨著時(shí)間的推移在不斷拉大。

但將64位部署到移動(dòng)領(lǐng)域也有著不小的挑戰(zhàn),一方面是安卓生態(tài)系統(tǒng)的多樣性造就了眾多不同的芯片合作伙伴、手機(jī)廠商和應(yīng)用程序商店,所以遷移到64位需要產(chǎn)業(yè)鏈不同角色之間非常細(xì)致的協(xié)調(diào)。其次是在過去采用32位開發(fā)的應(yīng)用無法輕易遷移到64位上,不管是驗(yàn)證成本、芯片面積、操作系統(tǒng)庫(kù)以及持續(xù)維護(hù)的成本承擔(dān)等方面都存在著很多問題。因此其實(shí)整個(gè)正待系統(tǒng)完全對(duì)64位的應(yīng)用支持并不是最快捷的應(yīng)用路徑,所以Arm希望通過比較細(xì)心的協(xié)調(diào)在這兩方面做一些工作,比如幾年之前就開始從CPU和操作系統(tǒng)中去逐漸地剔除32位的歷史遺留問題,從而向應(yīng)用開發(fā)者證明這種向64位的過渡是在真實(shí)發(fā)生的,并且為他們開始支持64位的平臺(tái)提供一些額外的助力。

在提及安全技術(shù)主題時(shí),Geraint North表示,當(dāng)前的軟件數(shù)量是有史以來最多的,而且世界上也有越來越多的數(shù)據(jù)會(huì)在它的生命周期某一個(gè)點(diǎn)上推動(dòng)Arm這個(gè) IP。隨著更多的軟件出現(xiàn),以及更多的個(gè)人生活以數(shù)字方式進(jìn)行,軟件的安全性和它的穩(wěn)定性是至關(guān)重要的。這也是為什么Arm為什么要花時(shí)間和精力來去推動(dòng)安全技術(shù)的研發(fā)。

Geraint North為大家介紹了Armv9架構(gòu)上CPU引入安全技術(shù)的一些早期成功案例。除了前面演講提到的MTE技術(shù)以外,PAC和BTI也是Armv9內(nèi)核中首次推出的功能?!癙AC和BTI的聯(lián)合使用,令攻擊者很難將現(xiàn)有的代碼的片斷用于不法的手段,他們對(duì)于哪些代碼可以跳轉(zhuǎn)到哪里進(jìn)行更嚴(yán)格的控制,攻擊者如果找到了覆蓋一個(gè)指針的方法,但是難以用它真正覆蓋任何的代碼,在執(zhí)行完一個(gè)函數(shù)以后不會(huì)返回到錯(cuò)誤的地方,每一個(gè)函數(shù)被調(diào)用的時(shí)候連接寄存器就會(huì)被清零,所以我們使用它從函數(shù)反饋之前會(huì)檢查簽名是否有效,如果有人以某種方式修改了地址,這個(gè)認(rèn)證是通不過的?!?/p>

第三個(gè)分享的主題是如何推動(dòng)性能進(jìn)步,不僅僅要用到Arm最新的IP ,還要進(jìn)行大量投資,比如在Armv8和Armv9系統(tǒng)之上進(jìn)行進(jìn)一步的架構(gòu)優(yōu)化?;仡櫼酝?,Armv8本身有很成熟的性能,但Arm仍然在尋找方法來提高LLVM編譯器的性能,安卓生態(tài)系統(tǒng)正是在此基礎(chǔ)之上來運(yùn)轉(zhuǎn)的。

同時(shí)Arm也在關(guān)注一些新的東西,比如在LLVM的工作都是聚焦在SVE2的性能之上,它也是Armv9引入的全新的矢量架構(gòu)?!拔覀冏龀龅呢暙I(xiàn)主要表現(xiàn)在兩個(gè)方面,第一我們要確保SVE2的代碼生成盡可能做好,這就意味著我們要保證LLVM能做矢量化的工作,同時(shí)又能確保LLVM能夠矢量化目前它不能做到的事情。SVE2本身是包括沒有預(yù)定的指令和散點(diǎn)結(jié)構(gòu)操作的功能。第二我們意識(shí)到SVE2不會(huì)在一夜之間實(shí)現(xiàn)百分之百的市場(chǎng)普及,所以在LLVM 16中我們引入了函數(shù)多版本,讓開發(fā)者能夠更加容易確保其函數(shù)的利用和SVE2版本都能夠生成,并且在運(yùn)行的時(shí)候自動(dòng)選擇正確的版本,”Geraint North表示,“作為一個(gè)開發(fā)者你不必同時(shí)做兩個(gè)二進(jìn)位文件,或者每一次都進(jìn)行CPU的檢測(cè),你只需要幾行代碼就可以讓編譯器的兩個(gè)指令集自動(dòng)出代碼的矢量化,或者在自定義的匯編中掌握到你的應(yīng)用程序確實(shí)能夠被指定給最合適最好的CPU,不管是被部署在哪個(gè)位置?!?/p>

最后,Geraint North介紹了Arm與Unity和Google在安卓動(dòng)態(tài)性能框架之上的合作。根據(jù)過去幾年不少開發(fā)者的反饋,他們一直在努力開發(fā)適應(yīng)性工具還有庫(kù),以便于更好的了解和應(yīng)對(duì)實(shí)時(shí)變化的性能、散熱以及用戶的需求。

這些適應(yīng)性套件的關(guān)鍵組成部分有以下四個(gè)部分:(1)ADPF提示API,能夠幫助系統(tǒng)根據(jù)游戲中的情況提高或降低CPU的頻率;(2)ADPF散熱API ,它為開發(fā)者提供了數(shù)字信號(hào),告訴他們離所謂的熱閥值還有多遠(yuǎn);(3)游戲模式API ,這是向開發(fā)者提供關(guān)于用戶性能或電池偏好的一些建議;(4)游戲狀態(tài)的API ,可以允許游戲告訴系統(tǒng)他們?cè)谧鍪裁?,以便可以調(diào)整以滿足游戲的性能需求。

關(guān)鍵詞:

推薦內(nèi)容