老司机91精品网站在线观看_久久69精品久久久久久hb_成人欧美在线观看_免费一级日本c片完整版

首頁(yè)>焦點(diǎn) > 正文

每日頭條!從A76到A78——在變化中學(xué)習(xí)ARM微架構(gòu)

2023-05-26 16:15:40    出處:面包芯語(yǔ)

一、引言

伴隨智能手機(jī)的高速發(fā)展,移動(dòng)處理器架構(gòu)設(shè)計(jì)廠商ARM公司幾乎每年都更新CPU的核心架構(gòu)。從2018至2020年,ARM公司基于ARMv8架構(gòu)推出了三代Cortex-A76、Cortex-A77、Cortex-A78經(jīng)典CPU核心架構(gòu)。基于這幾代CPU架構(gòu),芯片設(shè)計(jì)廠商也設(shè)計(jì)了多款性能優(yōu)秀的處理器產(chǎn)品。本文從A76微架構(gòu)開(kāi)始學(xué)習(xí),通過(guò)對(duì)比每一代的變化,讓讀者了解處理器微架構(gòu)關(guān)鍵知識(shí)。下表給出了一些基于這三代ARM處理器架構(gòu)的典型處理器產(chǎn)品。


(資料圖)

二、從A76開(kāi)始了解ARM微架構(gòu)

從ARM的A76開(kāi)始,網(wǎng)絡(luò)上可以查詢到較多資料,例如我們可以從wikichip網(wǎng)站(en.wikichip.org)獲取到A76的完整微架構(gòu)框圖。

1. DSU(DynamIQ Shared Unit)

從A75開(kāi)始,ARM提出了一個(gè)新的多核心管理系統(tǒng)單元,叫做DSU。通過(guò)DSU模塊,CPU設(shè)計(jì)者可以隨意擺放不同架構(gòu)的核心并共享L3緩存,減少不同架構(gòu)核心直接傳遞數(shù)據(jù)損耗。在DSU架構(gòu)之前,每個(gè)Cluster需要擺放同架構(gòu)CPU,如將4個(gè)A73處理器放在一個(gè)Cluster中,將4個(gè)A53放在另外一個(gè)Cluster中,這兩個(gè)Cluster的數(shù)據(jù)相互訪問(wèn)會(huì)有一定的連接損耗。

利用DSU模塊,開(kāi)發(fā)者可以隨意設(shè)計(jì)CPU的組合,例如圖中1大+7小,2大+6小,4大+4小,1大+2小,1大+3小,1大+4小等等組合。

2.性能功耗優(yōu)化

架構(gòu)和工藝具有一定的關(guān)聯(lián)性,如A76架構(gòu)設(shè)計(jì)可采用7nm工藝,根據(jù)ARM數(shù)據(jù),基于7nm的A76比基于10nm工藝的A75,性能可提升40%,或同性能下能耗降低50%。可見(jiàn)A76相比上一代的A75的提升較大,后面我們會(huì)詳細(xì)了解架構(gòu)上差異點(diǎn)。

3. 三級(jí)緩存設(shè)計(jì)

A76采用三級(jí)緩存機(jī)制,其中:

L1是核心獨(dú)有緩存,具有獨(dú)立的64KB指令Cache(ICache)和64KB數(shù)據(jù)Cache(DCache);

L2是核心獨(dú)有緩存,可以配置成256KB或者512KB(加錢);

L3是核間共享緩存,在DSU內(nèi)部,可以配置成2MB或者4MB。

多級(jí)流水線系統(tǒng)中,在執(zhí)行分支判斷指令時(shí),系統(tǒng)如果不知道下面走哪一條分支,需要等到分支執(zhí)行出結(jié)果才可以再獲取正確的指令。為了提升流水線性能,現(xiàn)代處理器中提供了一個(gè)分支預(yù)測(cè)單元(BPU),用來(lái)預(yù)測(cè)常用路徑,并提前進(jìn)行指令預(yù)取,確保流水線被填充完整。

A76的BPU和指令Fetch單元獨(dú)立,BPU可以同時(shí)和Fetch單元工作,提前推測(cè)并獲取分支后指令,降低分支預(yù)測(cè)的延遲。

5. 前端設(shè)計(jì)(Front-end)

指令預(yù)取后進(jìn)入一個(gè)解碼隊(duì)列,A76提供了4路decoder,相比A75增加了一路decoder單元,這是性能提升的一個(gè)要素。

6. ROB模塊設(shè)計(jì)

經(jīng)過(guò)譯碼的指令叫做MOP(Macro-Operation),MOP不是實(shí)際執(zhí)行的指令,最終送到執(zhí)行單元的指令叫做uOP(Micro-Operation)。MOP比uOP稍微復(fù)雜一些,可能是多條uOP的組合指令,通過(guò)后端單元的拆解,可以把MOP分解成處理器可以執(zhí)行的最基礎(chǔ)指令uOP,uOP的指令數(shù)量約比MOP多20%。

ROB(ReOrder-Buffer)模塊提供了128個(gè)entry,用來(lái)將指令進(jìn)行重新排序,盡可能填充流水線,這里可以看到A76設(shè)計(jì)的輸入是4路MOP,輸出是8路uOP。

7. 執(zhí)行單元 (Execution Engine)

Dispatch單元將uOP指令發(fā)射到執(zhí)行單元(Issue),執(zhí)行單元提供了120個(gè)entry,分成三類:整型、浮點(diǎn)和讀寫,整型部分包括了1個(gè)分支單元,2個(gè)基礎(chǔ)ALU單元,1個(gè)復(fù)合ALU單元;浮點(diǎn)部分提供了2個(gè)128bit的高級(jí)SIMD指令單元;讀寫部分則提供了2個(gè)AGU(Adress Generation Unit)地址單元。

8. LSU(Load Store Unit)設(shè)計(jì)

LSU模塊和執(zhí)行單元的2個(gè)AGU相連接,同時(shí)連接64KB的L1數(shù)據(jù)緩存(DCache),并提供2個(gè)16B/cycle的load端口和1個(gè)32B/cycle的store端口。

9. 小結(jié)

至此,我們從取指、譯碼、指令分派、指令發(fā)射、指令執(zhí)行到數(shù)據(jù)讀寫,簡(jiǎn)略了解了A76處理器的微架構(gòu),下一節(jié)我們通過(guò)對(duì)比A77和A76架構(gòu)的差異,進(jìn)一步了解ARM微架構(gòu)設(shè)計(jì)的步伐。

三、A77微架構(gòu)和A76對(duì)比

A77微架構(gòu)圖,大家且看且珍惜,因?yàn)樽訟77之后的產(chǎn)品在網(wǎng)絡(luò)上很難找到完整的微架構(gòu)圖了。

1. 性能提升

2. L0緩存(MOP Cache)

A77新引入了MOP Cache模塊,這個(gè)模塊并不是ARM的創(chuàng)新設(shè)計(jì),在PC處理器上已經(jīng)有了,例如Intel在早期的酷睿Sandy Bridge處理器中就加入了uOP Cache模塊。

此外AMD的Zen架構(gòu)也有MOP緩存模塊。

MOP Cache主要用做L0級(jí)別緩存,存儲(chǔ)譯碼過(guò)的MOP指令。MOP Cache的好處是如果在里面找到需要的指令,前面的電路模塊都可以暫時(shí)由MOP Cache來(lái)替代,可以節(jié)省功耗提升性能。ARM數(shù)據(jù)顯示這個(gè)MOP Cache的命中率有85%,可見(jiàn)是A77的一個(gè)非常大的改進(jìn)。

繼續(xù)看下MOP Cache的尺寸,ARM給的尺寸數(shù)據(jù)是1.5K而不是1.5KB,單位不是Byte而是條,考慮到ARM常規(guī)decoded出的機(jī)器碼是32位寬(Aarch64也是32位寬,當(dāng)然也有個(gè)別64位寬指令),推測(cè)這個(gè)L0 Cache的大小應(yīng)該是6KB左右(和Intel的sandy bridge時(shí)一樣)。

移動(dòng)處理器領(lǐng)域引入L0,ARM并不是首家,早在高通的Snapdragon S4時(shí)代就在Krait核心中引入了L0 cache。根據(jù)數(shù)據(jù)顯示1.5K的Cache就可以達(dá)到80-85%的命中率,再增加Cache,提升命中率的邊際效應(yīng)會(huì)越來(lái)越明顯。

3. 前端設(shè)計(jì)(Front-End)

A77相對(duì)于A76的另一個(gè)重要變化是產(chǎn)生MOP指令的能力從原來(lái)的每周期4個(gè)提升到最多6個(gè),但是decode的能力還是保持4個(gè)沒(méi)有變化。可以對(duì)比下整體上fetch和decode的基本架構(gòu)和A76沒(méi)有太大變化,MOP提升的主要原因是新加入的MOP Cache提供的。如果MOP Cache命中,可以繞過(guò)decode模塊最多一次取6條MOP指令,如果不命中回到decode模塊還是一次4條,L0 Cache和Decode進(jìn)行了很好的補(bǔ)充,讓一周期可以提供更多的MOP指令。

4. ROB模塊設(shè)計(jì)

A77相對(duì)A76在執(zhí)行單元上提升了重排序緩沖的大小(ReOrder-Buffer),還記得A76是128-entry,A77提升了25%到160-entry。

另外可以看到輸入是6條MOP,輸出提升到了10條uOP,對(duì)比A76則是8條。據(jù)說(shuō)其他廠商基于ARM定制內(nèi)核時(shí)會(huì)修改這個(gè)部分,隨著ARM內(nèi)核逐步吸收這些優(yōu)秀的設(shè)計(jì),定制ARM內(nèi)核的空間和收益會(huì)越來(lái)越小 。

5. 執(zhí)行單元

A77相比A76在執(zhí)行單元也有比較大的改變:新增加了一路分支單元,將分支預(yù)測(cè)的帶寬提升了一倍;新增了第四個(gè)基礎(chǔ)整型ALU單元,這個(gè)單元可以用一個(gè)周期執(zhí)行簡(jiǎn)單的算術(shù)運(yùn)算或二個(gè)周期執(zhí)行更復(fù)雜運(yùn)算。A77一共4個(gè)整型ALU,其中3個(gè)是基礎(chǔ)整型ALU單元,還有一個(gè)是復(fù)雜整型ALU單元,可以執(zhí)行更復(fù)雜的計(jì)算(例如MAC乘加,DIV除法),A76也有這個(gè)復(fù)雜ALU單元。在整型執(zhí)行單元上,A77相對(duì)A76提升是比較大的,從4個(gè)提升到6個(gè),有50%的提升。

此外,還A76的每個(gè)執(zhí)行單元都有獨(dú)立的發(fā)射列隊(duì),A77則進(jìn)行了一定程度的優(yōu)化,將發(fā)射列隊(duì)(issue queue)統(tǒng)一成三個(gè),整型、浮點(diǎn)和讀寫發(fā)射列隊(duì),由于A77的執(zhí)行單元多,將發(fā)射列隊(duì)統(tǒng)一進(jìn)行管理和分配,可以進(jìn)一步提升執(zhí)行效率。

6. LSU設(shè)計(jì)

A77在Load\Store單元上有兩個(gè)獨(dú)立的地址生成單元AGU,這和A76是一樣的。不同的地方是A77額外增加了兩路Store端口,等于將Store的帶寬增加了一倍。同時(shí)這四路LSU單元也共享一個(gè)發(fā)射隊(duì)列,ARM宣稱這樣可以提升25%的內(nèi)存并發(fā)讀寫性能。

再來(lái)看一下LSU單元,更寬的執(zhí)行單元需要有更寬的LSU支持,A77增大了LSU的load和store buffer,同時(shí)可以支持85級(jí)深度load 操作和90級(jí)深度store操作,總共支持同時(shí)175個(gè)內(nèi)存操作,稍高于指令操作的寬度160,相比A76的LSU深度140,提升了25%。

7. 小結(jié)

最后整理了一個(gè)更詳細(xì)的表格來(lái)對(duì)比A77和A76,A77是ARMv8系列中非常成功的一代,基于A77,產(chǎn)生了如麒麟9000、驍龍865這樣經(jīng)典的產(chǎn)品。

四、A78微架構(gòu)和A77對(duì)比

1. 性能功耗優(yōu)化

2020年,ARM更新了代號(hào)Hercules的A78新架構(gòu),也是ARMv8體系中最后一代中核架構(gòu)。ARM宣傳這一代是“持續(xù)的性能功耗領(lǐng)先”,圖中看到性能提升了20%,工藝從7nm提升到5nm,注意性能提升包含了頻率的15%提升,架構(gòu)的性能提升ARM估計(jì)在7%左右。得益于工藝進(jìn)化到5nm,同樣性能,功耗可以比A77降低50%(2.1GHz相當(dāng)于A77的2.3GHz)。從第二張圖可以看出,A78這一代的主要設(shè)計(jì)目標(biāo)是小幅度提升性能,提升能效并減少芯片面積。

2. A78微架構(gòu)的一些特點(diǎn)

1、L1緩存:ARM提供了32KB緩存的選擇,讓一些注重成本和芯片面積的廠商可以選擇更低的數(shù)據(jù)和指令緩存,默認(rèn)是64KB。

2、分支預(yù)測(cè):分支預(yù)測(cè)的帶寬相對(duì)A77提升了1倍。

3、執(zhí)行單元:增加了一個(gè)MUL單元,允許一個(gè)周期進(jìn)行2個(gè)整型的乘法運(yùn)算(A77是一周期1個(gè))。增加了一個(gè)用于Store的AGU單元,Store的能力從16B/cycle提升到32B/cycle。

A78是ARMv8架構(gòu)最后一代產(chǎn)品,主要是對(duì)前面幾代微架構(gòu)的優(yōu)化,可謂ARMv8架構(gòu)的守門員了。

五、總結(jié)

A78是ARMv8架構(gòu)的最后一代產(chǎn)品,智能手機(jī)依然在高速發(fā)展并快速更新產(chǎn)品,ARM處理器的架構(gòu)也在持續(xù)迭代和更新。2020年,ARM公司提出了對(duì)廠商定制高性能核心的計(jì)劃,并推出了面積更大性能更強(qiáng)的Cortex-X系列核心。2021年,ARM公司推出了全新的ARMv9架構(gòu),目前已經(jīng)有A710、A715等產(chǎn)品接替A78的路線。限于篇幅限制,后續(xù)我會(huì)和大家一起繼續(xù)學(xué)習(xí)X系列和ARMv9架構(gòu)的相關(guān)內(nèi)容。

摘要

1、DSU介紹 https://www.androidauthority.com/arm-dynamiq-need-to-know-770349/

2、A76 wikichip https://en.wikichip.org/wiki/arm_holdings/microarchitectures/cortex-a76

3、A77 wikichip https://en.wikichip.org/wiki/arm_holdings/microarchitectures/cortex-a77

4、A77介紹 https://www.anandtech.com/show/14384/arm-announces-cortexa77-cpu-ip

5、Intel"s Sandy Bridge Architecture Exposed https://www.anandtech.com/show/3922/intels-sandy-bridge-architecture-exposed/2

6、AMD Zen Microarchitecture https://www.anandtech.com/show/10578/amd-zen-microarchitecture-dual-schedulers-micro-op-cache-memory-hierarchy-revealed

7、A78介紹 https://www.anandtech.com/show/15813/arm-cortex-a78-cortex-x1-cpu-ip-diverging

8、A78 wikichip https://en.wikichip.org/wiki/arm_holdings/microarchitectures/cortex-a78

9、A78介紹 https://fuse.wikichip.org/news/3536/arm-unveils-the-cortex-a78-when-less-is-more/

10、ARMv9介紹 https://www.anandtech.com/show/16584/arm-announces-armv9-architecture

關(guān)鍵詞:

相關(guān)內(nèi)容

消費(fèi)
產(chǎn)業(yè)
直擊商品交易痛點(diǎn),中京商品交易市場(chǎng)助力行業(yè)客戶交易無(wú)憂 在當(dāng)前經(jīng)濟(jì)形勢(shì)下,大宗商品交易成為投資者和企業(yè)家們的重要選擇之一。但是,由于大宗
【羽翼豐滿,夢(mèng)想綻放】熱烈慶祝艾珀耐爾天津波音工業(yè)天窗項(xiàng)目順利竣工 捷報(bào):近日,艾珀耐爾科技位于天津?yàn)I海高新區(qū)的波音天窗施工項(xiàng)目圓滿竣工!!這是一次
喬雅登【V-smile】攜深圳陽(yáng)光共探口周能量美學(xué)新思路 5月20日,艾爾建美學(xué)聯(lián)合深圳陽(yáng)光醫(yī)療美容醫(yī)院共同舉辦了喬雅登V-Smile[靈動(dòng)V笑]口周
更適合“中國(guó)寶寶”體質(zhì)的代步小車,全新一代瑞虎3x“真香”! 對(duì)于現(xiàn)代消費(fèi)者來(lái)說(shuō),汽車已經(jīng)是再普遍不過(guò)的存在。畢業(yè)、上班、買車,已經(jīng)成為大部分
基金
老司机91精品网站在线观看_久久69精品久久久久久hb_成人欧美在线观看_免费一级日本c片完整版

      亚洲综合成人网| 国产精品99久久久久久久vr | 国产精品1区2区3区在线观看| 久久久久久久久岛国免费| 亚洲狠狠爱一区二区三区| 欧美电影免费观看高清完整版在| 一区二区三区在线视频免费观看| 国产高清无密码一区二区三区| 国产精品你懂的在线欣赏| 精品视频全国免费看| 国产精品看片你懂得| 国内精品嫩模私拍在线| 国产精品久久久久久久久果冻传媒 | 欧美一区二区视频网站| 亚洲另类中文字| 成熟亚洲日本毛茸茸凸凹| 亚洲精品久久久蜜桃| 欧美电影免费观看高清完整版在线 | 视频一区在线播放| 久久日一线二线三线suv| 亚洲成人av一区二区三区| 久久久精品一品道一区| 久久成人免费日本黄色| 中文字幕色av一区二区三区| 欧美一区二区精美| 亚洲妇熟xx妇色黄| 久久久久久久久久久99999| 欧美羞羞免费网站| 亚洲美女免费视频| 97久久人人超碰| 欧美在线免费播放| 一区二区三区自拍| 久久蜜桃av一区二区天堂| 欧美日韩免费高清一区色橹橹| 亚洲黄色尤物视频| 91麻豆福利精品推荐| 欧美日韩美少妇| 亚洲国产精品久久不卡毛片| 久久久综合精品| 欧美日韩国产中文| 亚洲香蕉伊在人在线观| 日本一区二区三区免费乱视频| 欧美一区二区人人喊爽| 日韩电影一区二区三区四区| 1区2区3区欧美| 国产亚洲一二三区| 国产成人综合亚洲网站| 天天影视色香欲综合网老头| 亚洲日韩欧美一区二区在线| 91香蕉视频污| 欧美妇女性影城| 日韩黄色片在线观看| 亚洲欧美日韩在线| 欧美激情一区二区三区四区 | 日本视频在线一区| 亚洲免费观看高清完整版在线观看| 国产亚洲一区二区在线观看| 风流少妇一区二区| 欧美色综合天天久久综合精品| 亚州成人在线电影| 亚洲美女屁股眼交3| 国产精品污污网站在线观看| 99久久精品免费看国产免费软件| 欧美美女网站色| 美腿丝袜亚洲一区| 亚洲高清免费观看| 亚洲最色的网站| 日韩一区欧美一区| 国产精品国产三级国产普通话蜜臀| 99v久久综合狠狠综合久久| 制服丝袜日韩国产| 韩国一区二区视频| 色狠狠综合天天综合综合| 亚洲成人自拍一区| 亚洲男人电影天堂| 成人免费一区二区三区视频| 国产女主播一区| 欧美国产综合色视频| 91婷婷韩国欧美一区二区| 日韩欧美成人一区| 国产91对白在线观看九色| 欧美日产在线观看| 国产一区在线视频| 欧美日韩三级视频| 精品中文字幕一区二区| 在线观看成人小视频| 日本美女一区二区三区| 午夜精品aaa| 日韩专区一卡二卡| 一本色道久久综合精品竹菊| 五月天激情综合网| 午夜av一区二区| 日韩成人一区二区三区在线观看| 亚洲成人动漫精品| 日本美女一区二区| 欧美性生活大片视频| 久久精品72免费观看| 欧美色大人视频| 国产精选一区二区三区| 91.麻豆视频| 国产69精品久久777的优势| 日韩欧美第一区| 99国产精品久久久久久久久久| 久久免费视频色| 国产欧美在线观看一区| 国产精品久线观看视频| 1024成人网| 亚洲成人手机在线| 五月婷婷久久丁香| 久久se精品一区二区| 91精品国产手机| gogogo免费视频观看亚洲一| 久久久99精品久久| 中文字幕成人网| 亚洲精品中文字幕在线观看| 亚洲一区二区在线播放相泽| 日本强好片久久久久久aaa| 欧美三级乱人伦电影| 国产91丝袜在线18| 久久久91精品国产一区二区精品| 欧美国产欧美综合| 亚洲夂夂婷婷色拍ww47| 色哟哟一区二区| 国产大片一区二区| 久久久亚洲精华液精华液精华液 | 欧美日韩高清一区| 99综合影院在线| 国产精品人成在线观看免费| 亚洲免费观看高清完整版在线观看 | 国产精品视频一二| 亚洲九九爱视频| 免费精品视频在线| 日韩美一区二区三区| 国产日韩欧美制服另类| 亚洲综合色噜噜狠狠| 欧美探花视频资源| 97se亚洲国产综合自在线| 国产精品久久久久久久久果冻传媒| 一区二区三区四区国产精品| 久久精工是国产品牌吗| 亚洲精品在线三区| 中文字幕日本不卡| 蜜桃传媒麻豆第一区在线观看| 精品免费视频.| 亚洲欧洲美洲综合色网| 蜜桃91丨九色丨蝌蚪91桃色| 精品国产免费人成在线观看| 亚洲视频中文字幕| 久久99深爱久久99精品| 久久影院午夜片一区| 1000精品久久久久久久久| 久久精品国产99国产| 久久人人97超碰com| 亚洲乱码中文字幕综合| 国产麻豆精品久久一二三| 国产欧美日韩亚州综合 | 26uuu久久天堂性欧美| 自拍偷拍国产精品| 久久99国产精品尤物| 国产亚洲欧美中文| 亚洲高清一区二区三区| 成人爱爱电影网址| 亚洲精品欧美激情| 欧美美女喷水视频| 国产精品久久久一区麻豆最新章节| 免费视频最近日韩| 国产亲近乱来精品视频| 色婷婷激情久久| 91女神在线视频| 日日夜夜免费精品视频| 久久久久久久久久看片| 亚洲第一福利一区| 99久久精品99国产精品| 夜夜嗨av一区二区三区| 日韩免费成人网| 亚洲综合在线五月| 成人18精品视频| 五月天精品一区二区三区| 久久新电视剧免费观看| 亚洲成人777| 久久亚洲精精品中文字幕早川悠里| 肉色丝袜一区二区| 国产日韩三级在线| 在线亚洲欧美专区二区| 中文一区二区在线观看| 国产中文一区二区三区| 亚洲精品日韩综合观看成人91| 欧美丰满美乳xxx高潮www| 亚洲图片你懂的| 成人福利电影精品一区二区在线观看| 有码一区二区三区| 精品剧情v国产在线观看在线| 亚洲国产视频在线| 久久久久久久久久久久久久久99 | 在线观看视频欧美| 国产精品无人区| 国产99久久久国产精品潘金| 亚洲国产日日夜夜| 国产三级一区二区| 欧美精品日韩一本|