벤치리뷰·뉴스·정보/고전 스페셜 정보

[고전 2002.09.11] 이것이 Banias 플랫폼이다 CPU 마이크로 아키텍처 편

tware 2005. 10. 9. 05:00

 

 

Banias의 엔지니어링 샘플. 오른쪽 칩셋 Odem

 

기간 : 9월 9일 ~ 12일 (현지 시간)
장소 : San Jose Convention Center

 Intel이 마침내 차세대 모바일 CPU "Banias (코드네임 베니어스)"마이크로 아키텍처의 세부 사항을 공개했다. 9일부터 개최중인 Intel Developer Forum Conference 기조 연설 및 기술 트랙 회장에서 Banias 마이크로 아키텍처, 심지어 Banias 플랫폼의 세부 사항 등이 설명되었다. 본 보고서에서는 IDF에서 밝혀진 내용이나 소식통 등에 의해 밝혀진 정보를 바탕으로 지금까지 발견된 Banias의 모습에 대해 전해간다.

마이크로 Ops를 최대한 줄이는 것으로 저소비 전력을 실현

 Banias의 특징은 Intel의 CPU로는 처음으로 0 에서 모바일 용으로 설계된 CPU 인 것이다. 지금까지 Intel의 모바일 CPU는 좋든 나쁘든 데스크톱 PC 용 CPU의 저전압 화에 의해 소비 전력을 낮춘 CPU 였다. 따라서 소비 전력은 어떻게든 노트북 PC에 들어가는 수준에 들어가며 왔지만, 원래가 데스크톱 PC 용이기 때문에 성능 당 소비 전력이라는 관점에서는 충분하다고는 말할 수 없는 것이었다. 그래서 Banias는 여러 가지 방법으로 성능을 저하시키지 않고 소비 전력을 억제하는 설계가 이루어지고 있다. 이로 인해 열 한계를 Pentium III의 시대로 되돌리고, 성능은 Pentium 4에 필적하는 것이다.

 이를 실현하기 위해, Banias의 실행 유닛은 어떻게든 (어떤 외부 명령(x86명령)을 똑같이 처리하더라도) 마이크로 Ops (마이크로 명령. x86명령이 분해 된 내부에서 처리되는 CPU 내부 명령.)의 수를 줄이고, 가능한 CPU가 동작하는 것을 줄임으로써 불필요한 전력의 발생을 막는다고 하는 아키텍처가 채용되고 있다 . 예를 들어, 분기 예측이 강화되고 있다. 분기 예측은 분기 명령이 있을 때 분기전의 결과가 나와 있지 않은 경우에도 먼저 실행, 분기 전 결과와 모순이 생기는 때에는 결과를 파기, 일치한 경우에는 결과를 채용하는 것으로, 실행 속도를 높인다는 방법으로 최근 CPU에는 반드시 채용되고 있다. 당연하지만 분기 예측이 빗나가 결과를 파기하게 되면, 분기 예측을 기반한 연산은 낭비된다. 즉, CPU적으로는 쓸데없는 전력 소모가 발생하는 것이다.

 그래서 Banias는 "Advanced Branch Prediction"라는 구조가 채용되고 있다. 구체적으로는 표준적인 프로그램의 동작을 기록하고, 새로운 프로그래밍 방식으로도 대응할 수 있도록 하고 있다. 또한 Banias 에서는 2모드의 분기 예측을 갖추고 있어 루프 감지나 부차적인 분기 예측 엔진을 갖추고 있다. 이러한 개량에 의해 분기 예측의 실패는 20%나 줄일 수 있다고 말한다.

 Banias는 스택 메니저도 개선되고 있다. 일반적 IA-32 명령어 세트는 SW 스택 관리를 명시 적으로 행하고 있다. 하지만 이 스택 관리라는 것은 오버 헤드가 커, 쓸데없는 마이크로 Ops의 발생의 원인이 되고 있다. 그래서 Banias는 "Dedicated Stack Manager"라 부르는 방식을 채용해, 스택 포인트를 관리해 오버 헤드가 발생하지 않고, 내부 어카운팅의 관리가 되도록 되어 있다. 이로 인해 마이크로 Ops의 발생을 5% 정도 억제가 가능하다고 한다.

 마지막으로, 작년의 IDF Fall 에서도 공개된 "Micro Ops Fusion"이다. 프로그램이 발생시키는 IA-32 명령어 세트는 디코더에 의해 MPU 내부의 기계어인 마이크로 Ops로 변환된다. 보통이면 마이크로 명령은 각각 개별적으로 실행 유닛에 보내지지만, Banias는 2개의 마이크로 Ops와 메모리 오퍼랜드를 1개로 정리해 실행 유닛에 보낼 수 있다. 그리고 실행 때에는 다시 각각의 마이크로 Ops로 분리되어 실행된다. 분리 후에는 Out-of-Order 실행 (실행하는 순서를 바꿔넣어 실행하는 수법)과 슈퍼 스칼라 (여러 명령을 병렬로 실행) 등의 실행 방식도 허가 된다. 이로 인해 10% 가량 마이크로 Ops을 절감 할 수 있다고 한다. 이처럼 Banias는 어떻게든 마이크로 Ops의 수를 줄여, 효율이 좋은 명령 실행을 하는 것이다.

 또 Banias는 대용량 L2 캐시를 탑재하고 있다. "L2 캐시는 소비 전력이 적고, 성능 향상이라는 의미에서도 이점이 있다"(Intel 모바일 플랫폼 그룹 CPU 아키텍처 이사 웨세스라 씨)라는 평가, L2 캐시는 소비 전력이 적고, 여기에 전력 밀도를 낮추는 의미에서도 큰 의미를 갖는다. 덧붙여 용량에 관해서는 밝혀지지 않았는데, 이것에 관해서는 이미 소스에 의해 1MB인 것이 확인되고 있으며, 2003년 4분기에 예정되어 있는 0.09μm (90nm) 버전인 Dothan (도선)은 2MB로 증가 된다.

 또한 Banias의 L2 캐시는 프리 페치 기능을 갖춰, 필요한 데이터를 예측하고 미리 캐시에 저장해 둔다. Banias에 같이 대용량의 캐시를 탑재하는 경우에는 매우 유용한 기능이라고 생각되어, 성능 향상에 큰 영향이 있을 것이다.

 

 

Banias CPU 코어. 다이의 1/3 정도는 L2 캐시에 의해 점유된다.

 

 

 

Banias 마이크로 아키텍처 설명

 


차세대 Speed​​Step 기술을 지원

 "Banias 절전에 가장 기여하는 것이 클럭 게이팅 이다"(Intel 모바일 플랫폼 그룹 이스라엘 디자인 센터 제너럴 매니저 물리 에덴 씨)라는 말대로, Banias의 저소비 전력을 실현하는 열쇠가 이 "Aggressive Clock Gating"라고 명명된 최신 클럭 게이팅 기술이다.

 클럭 게이팅은 MPU의 사용하지 않는 부분의 전력을 부지런히 잘라, 전력 소비를 줄인다. 클럭 게이팅 자체는 다른 MPU 및 비디오 칩 등에도 채용되고 있는 기술이지만, Banias는 이를 더 높은 행한다. 예를 들어 사용하지 않는 파이프 라인이 발견되면 즉시 이를 셧다운 한다. 다만 파이프 라인이 셧다운 되어 있으면, 명령이 실행될 수 없으므로 실행할 필요가 있을 때에는 즉시 일반 상태로 되돌릴 필요가 있다. 그래서 Banias는 복귀 레이턴시 (즉 복귀에 걸리는 시간)를 지금까지의 실리콘보다 극적으로 줄임으로써 더 고도의 클럭 게이팅이 가능하게 되었다.

 

차세대 Speed​​Step 기술을 설명하는 슬라이드

 


 또 Banias는 새로운 Speed​​Step 기술이 지원된다.

 현재 모바일 Pentium 4-M 모바일 Pentium III-M에서는 코드 네임 Geyserville II인 인핸스드 Speed​​Step 기술이 채용되고 있다. 인핸스드 Speed​​Step은 기존의 Speed​​Step에서 지원되던 성능 모드와 배터리 모드 라는 두 가지 모드 외에도 어댑티브 모드 라는 CPU 부하에 따라 두 모드를 동적으로 스위칭 하는 모드가 더해졌다. Banias에서 지원되는 것은 Geyserville III의 코드 네임으로 불리는 새로운 Speed​​Step 기술이다.

 Geyserville III에서는 적응형 모드에 관해서는 기존과 같이 2단계가 아니라 여러 단계가 추가 될 가능성이 높다. 어던 단계의 준비가 되어 있는가 라는 질문에 대해 "사용자가 만족하는 단계가 준비되어 있다"(Intel 모바일 플랫폼 그룹 CPU 아키텍처 이사 웨세스라 씨)라고 대답, 여러 단계가 준비되어 있는 것을 시사했다.


시스템 버스에 관해서도 저전력 구조를 실현

 시스템 버스에 관해서도 절전이 실현되고 있다. Banias 시스템 버스는 "Pentium 4의 시스템 버스와는 다르지만 비슷한 기술이 채용되고 있다 "(모바일 제품 그룹 총괄 매니저 겸 부사장 아난드 찬드라 세커 씨)라고, 기본적으로는 Pentium 4 시스템 버스의 개량 판이다. 실제 클럭은 100MHz로, QDR (Quad Data Rate)을 채용하고 있기 때문에, 400MHz 해당해서 버스 대역폭은 3.2GB / Sec에 이른다. 버스 프로토콜 등은 Pentium 4와 큰 차이는 없지만, 구동 전압은 Pentium 4에 비해 크게 낮아진다. 이 밖에도 몇 가지 차이점이있는 것 같고, 예를 들어 버퍼 컨트롤이나 온 다이 터미네이션은 동적으로 이루어진다.

 또한 Banias는 IA-32의 확장 명령으로서, MMX, SSE, SSE2에 대응하고 있다.

 


저소비 전력을 실현하며 높은 성능을 실현하는 Banias

 이번 IDF는 기술 발표라서 마케팅적인 요소를 포함하는 클럭 주파수는 발표되지 않았다. 다만 OEM 메이커 관계자의 정보는 이미 출시때의 클럭도 결정되어 있다. 구체적으로는 표 1과 같다고 한다.

 

  TDP
배터리 모드
평균 소비 전력
출시 예정
(2003년)
1.8GHz
21W
미정
미정
4분기
1.7GHz
24.5W / 1.35V
600MHz / 0.85V
1W 이하
2분기
1.6GHz
24.5W / 1.35V
600MHz / 0.85V
1W 이하
1분기
1.2GHz-LV
12W / 1.1V
600MHz / 0.85V
1W 이하
4분기
1.1GHz-LV
12W / 1.1V
600MHz / 0.85V
1W 이하
4분기
1GHz-ULV
7W / 1V
600MHz / 0.85V
1W 이하
4분기
900MH-ULV
7W / 1V
600MHz / 0.85V
1W 이하
2분기

 

 이것을 보고 알 수 있듯이, Banias는 25W가 한계인 한계인 씬 & 라이트, 12W가 한계인 저전압 (Low Voltage : LV)의 서브 노트북 전용, 7W가 한계인 초 저전압 (Ultra Low Voltage : ULV)의 미니 노트북 PC용에 해당하는 3종류의 라인업이 준비되어 있다.

Banias를 이용해 MPEG-4 인코딩 했을 때의 소비 전력.

인코딩시에만 전력이 치솟지만, 끝나면 1W 이하로 떨어진다.


 이것은 Pentium III 시대 25W (씬 & 라이트), 11W (서브 노트), 7W (미니 노트북)이라는 라인과 거의 같으며 열 한계적으로는 Banias에서 Pentium III의 시절로 돌아가게 된다. 실제 동작의 소비 지표인 평균 소비 전력은 Banias는 1W 이하가 실현된다. (모바일 Pentium 4-M은 2W 이하). 찬드라 세커 씨의 기조 강연에서도. MEPG-4 인코딩 때에는 7W까지 올랐지만 인코딩이 완료되면 1W 이하로 내려 가는 데모가 행해지고 있었다 (풀 파워에서 7W라는 것으로 ULV 버전이 사용되었을 가능성이 높다). 그런 의미에서도 배터리 사용 시간에 미치는 영향은 적지 않을 것이다.

 또한 성능에 관해서지만, "현재 구체적인 성능을 밝힐 수는 없지만 분명 놀라움을 주는 성능이다"(웨세스라 씨)라고 말하는 정도로, 이번 IDF에는 공식적으로는 공개되지 않았다. 다만 소식통에 따르면 OEM 업체에 대해서는 Banias는 같은시기에 출시될 예정인 모바일 Pentium 4를 상회하는 데이터가 공개되어 있다고 한다. 1분기에 출시될 예정인 Banias 1.60GHz는 같은시기에 출시될 예정인 모바일 Pentium 4 2.40GHz-M에 비해 MobileMark2002에서 17%, WebMark2001에서 14% 정도 상회하고 있다고 한다 (그래프). 실제 클럭 800MHz도 상회 모바일 Pentium 4를 능가할 정도의 성능이라면 충분히 놀랄만한 성능이라고 말할 수 있다.

 

Banias 1.60GHz와 모바일 Pentium 4-M과의 성능 비교 (필자 예상)


 그런데 놀라운 것은 이러한 Banias의 트랜지스터 수가 Pentium 4 (Northwood 코어)의 5,500만 트랜지스터보다 많은, 7,700만 트랜지스터인 것이다 (그러나 L2 캐시가 배가 되었기 때문에 직접 비교할 수 없지만 ). 트랜지스터 수가 증가했는데, Pentium 4보다 소비 전력이 낮고 성능에 관해서도 Pentium 4에 필적한다, 이것이 Banias의 대단함인 것이다.

 

 

[고전 2003.02.20] Pentium M 1.60GHz의 처리 능력

 

 

[고전 2002.09.12] 7700만 트랜지스터를 전력효율 향상에 쓴 Banias

 

 

[고전 2001.08.10] Banias의 샘플은 내년 여름, 발표는 2003 봄?

 

 

[고전 2001.08.29] 베니어스 2003년 상반기 출시 발표, 3.5Ghz 펜티엄4 데모

 

 

[분석정보] 더 밝혀진 Yonah의 모습 확장된 C4스테이트

 

 

[고전 2004.07.21] 인텔 90nm 펜티엄 M 755 Dothan