벤치리뷰·뉴스·정보/아키텍처·정보분석

[분석정보] 모바일 절전 기능을 강화한 펜린 (Penryn)

tware 2007. 4. 23. 21:00

 

이스라엘과 산타 클라라의 공동 개발

 

 

Penryn의 웨이퍼 (데스크탑은 울프데일)


 Intel은 45nm 공정 세대의 CPU "Penryn (펜린)"에서는, 마이크로 아키텍쳐의 대폭적인 개량은 피해 파이프 라인에 영향이 적은 부분만 확장에 머물렀다. 또한 Intel의 Shmuel (Mooly) Eden (무리 에덴) 씨 (Vice President, General Manager, Mobile Platforms Group, Intel)은 "Penryn에서의 개선은 멋지지만, 그것은 어디까지나 제한된"성형 수술 " 같은 것이다. 모두를 재 아키텍쳐하는 "심장 수술"과 같은 큰 것은 아니다. 큰 변경은 Nehalem에서 열린다 "고 시사했다. 따라서 Nehalem에서는 Core Microarchitecture (Core MA = 콘로 = 메롬)의 약점인 명령어 페치와 디코딩 부분이 향상되어 보다 성능의 향상을 보일 가능성이 높은 것으로 보였다.

 실제로 Intel의 CPU 아키텍처 로드맵에서는 Penryn과 그 다음의 새로운 마이크로 아키텍처 CPU "Nehalem (네할렘)"의 시간 차이는 매우 적다. 흐름을 보면 Penryn은 중계자로 Nehalem이 다음의 유력주자가 되는 것을 잘 알 수 있다.

 덧붙여서, Core Microarchitecture (Core MA)의 첫 번째 CPU "Core 2 Duo (Merom : 메롬 = 데스크탑은 콘로) "는 Pentium M을 개발한 Intel 이스라엘에서 설계되었다. IDF에서 공개 된 Penryn은 이스라엘과 미국 산타 클라라 개발 팀의 공동 개발이라고 한다. 산타 클라라는 Pentium 및 Itanium의 개발을 행한 팀이다. 그리고 다음의 Nehalem은 Pentium Pro / Pentium 4를 개발한 미국 오리건의 힐스보로가 담당하고 있다. 이스라엘 팀은 효율이 높고 저전력 CPU를 개발하는 모바일 전문가이다.

 

CPU 및 아키텍처 로드맵

 

 

확장되는 Core Microarchitecture

 

 

Penryn 패밀리와 향후의 전개


LPIA에서의 응용이 기대되는 C6 스테이트

 모바일 CPU 개발을 주축으로 하는 Intel 이스라엘은 Penryn에서도 모바일의 개량에 힘을 쏟았다. 모바일 이용시에 위력을 발휘하는 아이들 때의 절전 기능과 낮은 TDP (Thermal Design Power : 열 설계 전력) 때의 고클럭화이다.

 눈에 띄지 않지만, Penryn에서의 전력 제어기구의 개량은 크다. Penryn에서는 새로운 절전 모드 "Deep Power Down C6"이 더해졌다. C6는 기존의 절전 모드에 비해 크게 코어 전압을 낮춘다. 따라서 CPU 전체 아이들 때의 전력 소비를 크게 낮출 가능이 생겼다. C6은 아이들 상태의 많은 애플리케이션의 사용시 등에 배터리 구동 시간을 연장 효과가 있다.

 Penryn에서의 전력 절약 스테이트로 전환은 지금까지의 CPU와 약간 다르다.

(1) 우선, CPU 코어가 아이들에 들어가면 코어 클럭의 공급이 정지되어 "C1" "C2"스테이트에 들어간다. 이 동작은 Core Duo (Yonah : 요나 = 펜티엄M = 코어듀오, 코어2 아님) 때부터 CPU 코어마다 행할 수 있게 되었다. 한쪽의 CPU 코어가 먼저 보다 깊은 C 스테이트에 들어가 있고 다른 한 CPU 코어가 늦어 C1 / C2에 들어가는 경우도 있다. 이 경우 더 높은 쪽의 CPU 코어에 맞춰 CPU 전체의 스테이트가 옮겨진다.

(2) 다음 CPU 코어의 L1 데이터 캐시가 플러시 된 L2 캐시에 기록된다. 이것은 Yonah에서도 구현되어 있었지만, 그 위에 Penryn에서는 두 CPU 코어의 스테이트도 같이 세이브  한다. 이 단계에서 CPU 코어는 모두 "CC6"스테이트에 들어가 PLL도 스톱된다. CC는 CPU 코어 단위의 C 스테이트로 Yonah 이후의 Intel CPU에서 사용되고 있다. 이전에는 이​​ 상태에서 CPU 코어는 CC4 였지만, Penryn에서는 CPU 스테이트가 세이브 된 것으로 CPU 코어는 CC6에 들어간다. 다만 Penryn에서도 CPU 코어 단위의 전압 제어는 할 수 없기에 이 상태에서는 CPU 코어의 전압은 CPU 전체 코어 전압과 같다.

(3) 그 위에 두 개의 CPU 코어가 아이들 상태가 계속되면 Penryn은 "Deeper Sleep C4"스테이트에 들어가 코어 전압 Vcc는 캐시의 데이터 내용을 유지할 수 있는 한계 수준 (Cache sustain)으로 떨어진다.

(4) 다음의 Yonah 이후의 CPU는 "Dynamic Smart Cache Sizing"으로 L2 캐시 라인별로 오프 한다. L2 캐시 영역은 메인 메모리에 재기록 차례로 플러시 된다. 마지막에는 L2가 완전히 비워지고 전체 L2 캐시가 파워 OFF 된다.

Merom까지의 경우는 여기서 CPU 전체가 "Enhanced Deeper Sleep DC4"스테이트에 들어가 전압이 떨어졌다. 이 DC4 때의 코어 전압이, CPU 코어의 스테이트를 유지할 수 있는 수준이다. 그러나 Penryn에서는 CPU 코어의 스테이트가 세이브 되어 있기 때문에 더욱 1단계 전압을 낮추는 것이 가능해 진다.

(5) 이것이 Penryn의 "Deep Power Down C6"스테이트다. CPU 코어가 CC6 스테이트로 모여, L2 캐시가 완전히 플러시 된 단계에서 CPU 전체가 C6 스테이트에 들어가는 것이 가능하게 된다. C6 스테이트에서는 전압은 DC4보다 더 내려가, L1 캐시도 OFF되고 CPU 전체의 소비 전력이 최소가 된다. 다만 그만큼 액티브 스테이트로의 복귀 지연 시간은 길어진다. CPU 코어의 스테이트를 복귀시켜야하기 때문이다. 그러나 이 작업은 기본적으로 CPU 측에서 행하기 때문에, BIOS에 의한 보조는 필요가 없다고 한다.

 이 C6 스테이트는 PC 용 CPU에서도 유효하지만 아마 UMPC 전용의 "LPIA (Low Power Intel Architecture) = ATOM "프로세서에서 보다 유효성이 높다. LPIA 쪽이 애플리케이션 유형에서 C6 스테이트가 유효한 경우가 많다고 추측되기 때문이다. 따라서 차기 LPIA 인 "Silverthorne (실버손)"에서는, C6을 구현하는 것으로 추측된다.

 

Deep Power Down Technology

 

 

Penryn의 TDP가 35W로 오른 이유

 모바일 플랫폼에서의 통상 전압판 Penryn은 2006년 전반까지는 TDP가 29W가 된다고되어 있었다. 그러나 현재 Penryn의 TDP는 현재는 35W가 예정되어 있는 것 같다. 외관상은 Penryn의 전력이 예정 보다 6W 올랐다. 즉 클럭 당 소비 전력이 예정보다 올라 버린 것처럼 보이지만, 실은 그렇지 않다. 오히려 그 반대로, 같은 열 설계 머신상에서, Penryn의 클럭 향상의 헤드 룸이 상승했다는 것을 의미하고 있다.

 TDP의 제약은 CPU의 다이 (반도체 본체)의 온도의 지표인 접합 온도와 시스템의 열 설계 관련한다.

 2006년 Intel이 고객에게 행한 설명에서는 Penryn의 29W는 열설계적으로는 Merom의 35W에 동등하게 되어 있었다고 한다. 그것은 Penryn의 전력 밀도가(열밀도) Merom 보다 훨씬 높을 것으로 추정되고 있었기 때문이다.

 다이가 작아지면(공정으로 축소되면) 그만큼 전력 밀도가 높아진다. 전력 밀도가 높으면 일정한 배열 효율의 경우면, Merom보다 낮은 TDP에서 Penryn의 핫스팟 부분 (명령 디코더와 부동 소수점 연산 유닛인 것이 많다)의 접합 온도 (Tj)가 100도에 도달한다.

 따라서 Intel은 Penryn의 TDP를 Merom 보다 낮게 설정 할수 밖에 없었다. 즉, Penryn이 29W 였던 것은 낮은 TDP 였다기 보다는 Merom 보다 열 설계의 제약이 힘들기 때문에 Penryn에서는 TDP를 낮게 설정할 필요가 있었다는 것이다.

 그런데 Penryn의 전력 밀도는 1년 전에 선행 실리콘 때의 경우 보다 약간 낮아지게 되었다. Penryn의 다이 사이즈 (반도체 본체의 면적)는 선행 실리콘 때의 경우 보다 몇 % 커지고 있어 (103 제곱 mm → 107 제곱 mm), 그것도 영향을 주고 있는 것으로 보인다.

 Penryn의 전력 밀도는 다이가 더 커서 CPU 코어의 회로 밀도가 낮은 Merom 보다는 반드시 높아진다. 그러나 당초 예정에서는 Merom의 1.4 배의 전력 밀도였던 것에 비해 현재는 1.28 배 정도로 떨어지고 있다고 한다. 그만큼 핫스팟의 온도가 규정치를 초과 한계가 높아졌다. 즉, 더 높은 TDP로도 허용 할 수 있게 되었다.

 그 위에 Intel은 Penryn의 접합 온도 (Tj)의 스펙도 변경했다고 말한다. Intel의 모바일 CPU의 접합 온도는 보통 100 도로 설정되어 있다. 그러나 Penryn의 통상 전압 판에서는 105 도로 높은 접합 온도로 설정된 것 같다. 105도에서도 문제가 없다고 검증된 것으로 추측된다.

 따라서 같은 배열기구라면 (케이스 내부 쿨링 시스템) Penryn는 접합 온도가 높은 만큼, Merom 보다 더 높은 TDP로 설정 되었다. 접합 온도와 본체 내부 온도의 차이가 시스템의 열 예산이기 때문이다. 다만 LV (저전압) 판과 ULV (초 저전압) 판의 접합 온도는 100도인 채라고 한다. (냉각은 온도차이로 열을 식히는 것이죠.)

 그러면 이러한 변경의 결과로 무엇이 예측 되는가? 대답은 간단하다. 그것은 모바일 버전 Penryn의 클럭이 당초 예정보다 높게 된다는 것이다. 즉, 같은 열 설계 시스템에 더 높은 TDP의 CPU를 밀어 넣을 수있다. 6W 분의 클럭을 높일 여유가 생긴 것이다. 45nm 공정 자체가 낮은 누설 전류 (Leakage)에서 클럭 향상폭이 있는 것을 생각하면, 모바일 버전 Penryn의 클럭을 더욱 끌어 올릴 수 있을 것이다.

 이렇게 보면 Penryn은 모바일 CPU로서는 매력임을 알 수있다. Intel은 현재는 Nehalem이 모바일에도 투입 된다고 말하고 있다. 하지만 Nehalem의 소비 전력이 예상보다 높고, 모바일에 적합하지 않은 경우에는 다시 궤도 수정이 이뤄지고 데스크탑이 Nehalem, 모바일이 Penryn 같은 평행 상태가 될 가능성도 있을지도 모른다.

 

CPU 다이 크기 및 아키텍처 이행도

 

 

45nm 공정 세대의 Penryn 패밀리

2007년 4월 23일 기사 입니다.

[분석정보] 더 밝혀진 Yonah의 모습 확장된 C4스테이트

 

[분석정보] 이스라엘에서 발신되는 인텔의 차세대 CPU 기술

 

 

[아키텍처] 환경 조건을 이용하여 성능을 끌어 올리는 터보 모드

 

 

[분석정보] 평균 소비전력을 크게 줄일 Penryn의 C6 스테이트

 

 

[정보분석] 인텔 45nm 공정 차세대 CPU Penryn(펜린) High-k 메탈게이트 성공

 

 

[분석정보] 인텔(Intel)의 스마트폰 시장 공략 비장의 카드 Medfield (메드필드)

 

 

[제품정보] Intel, GPU클럭을 약 16% 높인 Atom 3775/3745

 

 

[분석정보] Atom의 절전 기술도 탑재한 Nehalem

 

 

[분석정보] 5W 이하의 저전력 프로세서의 개발로 향하는 Intel

 

 

[고전 2001.01.17] 10GHz CPU를 실현하는 Intel 0.03μm 트랜지스터 기술

 

 

[벤치리뷰] 저렴한 울프데일 E7200 리뷰

 

 

[분석정보] 고속화를 가져오는 Radix-16 Divider와 shuffle Engine

 

 

[분석정보] 전면 개량이 아닌 부분 개량에 머문 Penryn