-> https://m.ruliweb.com/news/board/1004/read/2167405?page=2
올해 3분기 삼성은 Exynos 990을 발표했습니다.
이 칩은 훨씬 빠른 NPU, 최신 Mali-G77MP11 GPU 및 LPDDR5를 특징으로 합니다.
컴퓨팅 측면에서 이 칩은
쿼드코어 Cortex-A55, 듀얼코어 Cortex-A76,
삼성의 최신 맞춤형 코어 디자인인 듀얼코어 Exynos-M5의 로 구성된 8코어를 특징으로 합니다.
어제 늦은 오후 패치 에서 삼성은 새로운 컴파일러 스케줄러 모델에서 새로운 코어에 대한 세부 정보가 담긴 패치를 커밋했습니다.
M5
M5는 Samsung Austin R&D Center(SARC)가 개발 한 삼성의 5세대 ARM 커스텀 코어입니다.
또한 최근의 정리 해고와 내부 재구성을 고려하여 마지막으로 개발 된 사용자용 코어라 할 수 있습니다.
삼성 몽구스 마이크로 아키텍처
![](http://ac.namu.la/33/33cca1bc2dc8d350a18397b48fe774a0417c3e2b0e413ee0edcfb9be1f347b1d.png?expires=1718026788&key=F3Q9okLgt87rYe2LW28B1A)
삼성은 Exynos-M5 코어가 “최대 20% 향상된 성능”을 제공한다라고 했으며 평균 성능은 더 낮아질 것으로도 예상 할 수 있습니다.
LLVM 스케줄러 모델이 너무 작아서 모든 작은 수정이 발생한 것을 알 수는 없지만 일부 더 큰 변경을 볼 수 있습니다.
LLVM 패치에서는 크게 개선 된 프리 페처, 분기 예측기 또는 기타 유사한 숨겨진 구성 요소가 아니라면 IPC개선에서 오는 M5 성능의 많은 부분을 보기가 어렵습니다.
명령어 세트 측면에서 M5는 M4–Armv8.2-A와 동일한 ISA 레벨을 제공합니다. 하이레벨 수준에서 M5는 M4 와도 매우 유사합니다.
파이프 라인은 6 개의 전체 디코드로 유지되고 백엔드는 동일한 228 개의 입력 딥 재정렬 버퍼를 유지합니다.
삼성은 명령 대기열을 48개 항목에서 60개로 약간 늘렸습니다.
더 큰 변화는 한 사이클 씩 15사이클로 개선 된 오해예측 페널티에 있습니다.
삼성 M4 vs M5 비교
![](http://ac.namu.la/f0/f0fe78882da0c254efaaf310105860a1047f8aebf47d3bec7230694d78843cd0.png?expires=1718026788&key=GBld7ORCgwaeOM_HUibJjQ)
![](http://ac.namu.la/5f/5f27d8d565fa4ab56202b00b41da83c070cf84b22bb329c282f52a4d072237e0.png?expires=1718026788&key=Lq9N2ztota1Db3FkrvVaEA)
백엔드
백엔드에 삼성은 두 개의 간단한 32 비트 정수 ALU 파이프를 추가했습니다. 이것은 정수 파이프(분기 포함)의 총 수를 7개로 만듭니다.
두 개의 32비트 ALU 파이프를 추가하면 일반적인 단순 ALU 워크로드의 처리량을 향상시키지 않으므로 흥미롭습니다.
![](http://ac.namu.la/d4/d46e5ad969457ef5a5486219fcb148cee6095f5e29a7ac3102456f15de1caebb.png?expires=1718026788&key=GpL8IIDoh-x_ci6Tncw3bw)
부동 소수점 클러스터 측에서 삼성은 실행 파이프의 균형을 다시 조정했습니다. 가장 주목할만한 변화는 3개의 FP파이프 각각에 네온 도트 제품 실행 장치를 추가 한 것입니다.
3개의 부동 소수점 파이프 각각에 전용 네온 도트 제품을 추가하면 32b 정수 ALU도 설명 할 수 있습니다.
![](http://ac.namu.la/86/8646403a9a04e8c92c5ad18c79cb2a74c89288378c84528db52686fd47ddeba7.png?expires=1718026788&key=pZyXiG2dOS9tsJIzr2Oiuw)
위에 표시된 Nxxx는 NED (고급 SIMD) 단위를 나타내며
HAD = 수평 벡터 산술, MSC = 기타, SHT = 이동, SHF = 셔플 및 CRY = 암호화입니다.
<요약>
- 삼성의 마지막 ARM 커스텀 코어인 Exynos-M5가 LLVM 컴파일러 패치에 내역이 공개됨
- Exynos-M5 코어 디자인은 전반적으로 전작인 Exynos-M4와 비슷한 구조를 유지하고 성능을 개선함
- Exynos-M4 대비 백엔드 개선(두 개의 간단한 32bit 정수 ALU유닛 추가)
- Exynos-M4 대비 명령대기열 48->60 개선
- Exynos-M4 대비 오해예측 16사이클->15사이클 개선
- Exynos-M4 대비 최대 20% 성능 향상
https://fuse.wikichip.org/news/3055/samsung-m5-core-details-show-up/