Penryn의 다이 사진
3월 29일 공개
미국 Intel 은 29일 45nm 공정으로 제조된 차기 CPU "Penryn (펜린)" 패밀리의 세부 사항을 공개했다. 도내에서 열린 회의에서는 Stephen L Smith 씨 (인텔 Vice President, Director, Digital Enterprise Group Operations)가 이 CPU에 대한 자세한 내용을 소개했다.
Penryn은 현재의 Core 2 시리즈의 후속 CPU. 현행의 Core 2 마찬가지로 Core 마이크로 아키텍처를 기반으로 캐시 용량 6MB (듀얼 코어시, 이하 같음)으로 늘리고 새로운 명령어 세트 "SSE4"를 장착한다.
제조 공정은 x86 CPU 최초로 45nm 공정을 채용. 트랜지스터 수는 4억 1,000 만개로, 다이 크기는 107 제곱 mm. 65nm 공정의 Merom에 비해 면적이 25% 감소되고, 제조 수율의 향상을 도모했다.
또 게이트 절연막에 High-k + 메탈 게이트를 채용하여 트랜지스터의 스위칭 속도를 약 20% 향상시켜 스위칭에 걸리는 전력을 30% 줄일 수 있다고 한다. 이 결과, 3GHz 이상의 동작 클럭을 실현했다고 한다.
공정방식과 Penryn의 포지션
Penryn의 주요 특징
Penryn 패밀리는 Core 마이크로 아키텍처의 일부 확장도 행한다.
첫 번째는 "Wide Dynamic Execution"의 확장으로 "Radix 16 " 이라는 기술을 구현함으로써 디바이더(나눗셈) 속도를 약 2배로 높이고 명령 디코딩 및 실행에 걸리는 클럭을 절감하고 부동 소수점 및 정수 연산 속도의 향상을 도모한다. 또한 하드웨어의 개량에 의한 가상 머신의 성능이 25% ~ 75% 성능이 향상된다고 한다.
두 번째는 "Advanced Smart Cache" 증강으로 용량이 기존의 4MB에서 6MB로 되어, 50% 증량 되었다. 데이터를 효율적으로 캐시로 모으는 것으로 성능의 향상을 도모한다.
세 번째는 "Smart Memory Access "로 메모리에서 L2 캐시와 L1 캐시에 로드 절차를 최적화함으로써 대기 시간 감소를 도모하는 것과 동시에, FSB의 향상에 의해 전송 속도를 향상시킨다.
네 번째는 "SSE4"명령의 장착으로 디지털 미디어 및 3D 그래픽 처리 속도의 향상을 도모한다. 또한 "Super Shuffle Engine"을 새롭게 장착하고 SSE 데이터 포맷 조작을 최적화하여 실행하는데 걸리는 지연시간을 삭감. 또한 128bit 길이의 명령을 1 클럭으로 실행 가능. 이로 인해 SSE2 / 3 / 4 명령을 기존의 약 2배의 속도로 실행할 수있다.
또한, SSE4에 대해서는 현재 소프트웨어 벤더와 긴밀히 협력하고 있으며, 컴파일러 최적화로 대응해 간다고 한다.
마지막이 되는 다섯 번째 특징은 모바일의 "Deep Power Down"과 "Enhanced Dynamic Acceleration"의 장착. 전자는 코어 클럭, 내부 PLL, L1 캐시, L2 캐시를 모두 OFF 하여 아이들시의 소비 전력을 최소화 하는 기능으로 배터리 수명 연장을 도모한다.
후자는 단일 쓰레드 응용 프로그램 실행시에 한쪽의 코어를 OFF하고 다른 한쪽 코어를 TDP 범위 내에서 오버 클럭하는 것으로, 단일 쓰레드의 실행 성능을 향상시키는 기능으로 모바일 PC에서 게임 실행 속도 등을 향상 시킨다.
Penryn의 주요 개선 사항은 5가지
"Radix 16"에 의해 디바이더의 속도를 높이고 명령의 실행 속도를 향상
(AMD의 경우는 스팀롤러에 이르러 Radix 8 디바이더 도입. 한참 후인데도 더 낮은 수준이죠.)
"Super Shuffle Engine"의 탑재에 의해 SSE2 / 3 / 4 명령의 실행 속도를 향상
Deep Power Down 으로 아이들시의 소비 전력을 C4 스테이트 때보다 더 감소
Enhanced Dynamic Acceleration 에서는 한쪽의 코어가 절전 모드로
다른 한쪽의 코어를 오버 클럭 (터보 모드)
Penryn 제품군은 모바일, 데스크톱, 서버의 3개 분야에서 전개된다. 각 플랫폼의 핵심 포인트를 정리하면 아래와 같다.
Penryn 제품군은 모바일, 데스크톱, 서버의 3 개 분야에서 전개
모바일
6MB의 L2 캐시
Deep Power Down
Enhanced Dynamic Acceleration
데스크톱
3GHz 이상의 클럭
쿼드코어에 12MB의 L2 캐시
TDP는 듀얼코어에서 65W, 쿼드코어 95 / 130W
서버
소켓 호환성
FSB는 최고 1.6GHz
TDP는 듀얼코어 40 / 65 / 80W, 쿼드코어 50 / 80 / 120W
Penryn 패밀리는 2007년 2분기부터 출시될 전망이다. 브랜드 이름은 계속 Core 2를 이용한다.
"Nehalem (네할렘)" 에서는 SMT를 다시 활성화
Intel은 최근 2년마다 공정을 업데이트하고 있으며, 45nm 공정 세대에 Penryn 외에 Nehalem 이라는 프로세서는 2008년으로 예정되어 있다.
Nehalem에서는 새로운 마이크로 아키텍처를 채용하고 32nm 공정을 사용하는 CPU 아키텍처의 기반이기도 하다.
Nehalem은 인텔에서는 처음으로, 용도에 맞게 구성을 변경 가능한 (컨피규러블) 아키텍처를 채택한다. AMD의 "빌딩 블록"과 비슷한 방식으로 다른 시장의 요구에 맞게 구성을 바꿀 수 있다. 예를 들어, 모바일에서는 전원 관리에 중시한 구성, 데스크톱은 성능에 중시한 구성, 서버에서는 워크로드를 중시한 구성으로 변경할 수 있다.
Nehalem은 최초의 컨피규러블 아키텍처를 채용
코어는 SMT를 탑재,
메모리 컨트롤러나 그래픽 컨트롤러를 연결하는 시리얼 인터커넥트 장비 등이 포인트
또 Hyper-Threading 의 멀티쓰레딩 기능을 지원한다. 이는 1코어에서 2쓰레드를 동시에 실행할 수 있게 된다. Nehalem에서는 최대 8코어까지 탑재 가능하기 때문에, 16 쓰레드를 실행할 수 있게 된다.
시스템 레벨에서 공유 L2 캐시를 더욱 강화하고 실행 유닛 근처에 배치하여 성능 최적화를 도모한다. 또한 성능과 전력 관리 강화도 도모하고 있다.
또 CPU 내부에 새로운 초고속 시리얼 인터커넥트를 (CSI = QPI) 추가한다. 시장 세그먼트마다 시리얼 인터커넥트의 수는 변화하지만, 1 ~ 4 개 정도 된다고 한다.
시리얼 인터커넥트는 메모리 컨트롤러를 연결하며, 버스를 단축시킴으로써 K8과 같이 메모리 액세스 성능 향상을 도모한다. 또 접속하는 메모리 컨트롤러는 가변이기 때문에, 시장 세그먼트마다 다른 메모리에도 대응 가능하다고 한다.
추가로,이 시리얼 인터커넥트에 연결하는 그래픽 기능도 옵션으로 준비된다. 이를 통해 서버 및 모바일 용도로 그래픽 기능의 실현이 용이하게 된다고 한다.
2007년 3월 29일 기사
[분석정보] AMD가 확장판 K10 코어 기반의 APU Llano 를 첫 공개
[분석정보] 모바일 절전 기능을 강화한 펜린 (Penryn)
[분석정보] 인텔 45nm 공정 차세대 CPU Penryn(펜린) High-k 메탈게이트 성공
[고전 2002.09.19] Intel, 3 차원 구조의 "트라이 게이트 트랜지스터 ' 발표
[분석정보] SSE4 명령어와 가속기에서 보이는 Intel CPU의 방향성
[분석정보] 고기능 고성능 + 에너지 절약 저비용을 양립시키는 Intel의 대처
[분석정보] 임베디드 시장에 IA 침투를 목표로 하는 Intel
[분석정보] 이스라엘에서 발신되는 인텔의 차세대 CPU 기술
[분석정보] 평균 소비전력을 크게 줄일 Penryn의 C6 스테이트
[아키텍처] 환경 조건을 이용하여 성능을 끌어 올리는 터보 모드
[분석정보] 연내에 투입되어 45nm에서 보급을 노리는 Inte의 쿼드코어
[고전 2001.08.10] Banias의 샘플은 내년 여름, 발표는 2003 봄?
[분석정보] IDF 2007 Penryn 벤치마킹 세션 리포트
[분석정보] 고속화를 가져오는 Radix-16 Divider와 shuffle Engine
[분석정보] 전면 개량이 아닌 부분 개량에 머문 Penryn
'벤치리뷰·뉴스·정보 > 아키텍처·정보분석' 카테고리의 다른 글
[분석정보] 전면 개량이 아닌 부분 개량에 머문 Penryn (0) | 2007.04.20 |
---|---|
[분석정보] IDF 2007 Penryn 벤치마킹 세션 리포트 (0) | 2007.04.19 |
[분석정보] 상변화 메모리 PRAM의 제품화, 2TFLOPS달성을 데모 (0) | 2007.04.18 |
[분석정보] 고기능 고성능 + 에너지 절약 저비용을 양립시키는 Intel의 대처 (0) | 2007.04.18 |
[분석정보] CeBIT에서 보는 UMPC의 현재와 미래 (0) | 2007.03.20 |
[분석정보] Intel TDP 3W x86 CPU 출하 Intel Turbo Memory도 시현 (0) | 2007.03.16 |
[분석정보] Intel CPU의 미래가 보이는 80코어 TFLOPS 칩 (0) | 2007.02.15 |
[분석정보] 메모리가 큰 벽이 되는 AMD의 퓨전 (FUSION) 프로세서 (0) | 2007.01.31 |