벤치리뷰·뉴스·정보/아키텍처·정보분석

[정보분석] Hasell(하스웰) 최강의 무기 통합 전압 조절기

tware 2013. 1. 4. 22:00

 

Haswell 이후의 초 저소비 전력의 열쇠 전압 레귤레이터의 통합

Intel의 다음 마이크로 아키텍처 세대 "Haswell (하스웰)", "Broadwell (브로드웰)"은 큰 변혁이다. 파이프 라인으로도 명령 발행 포트를 2 개 늘렸고, SIMD 유닛이 (FMAD = 곱셈 덧셈 함동 연산)되는 등 큰 변화가 참여하지만, 그 이상으로 큰 전력 제어기구의 변경이다. 전압 레귤레이터의 "통합"이 이루어지기 때문이다. Intel은 Haswell에 어떤 형태로 전압 레귤레이터가 통합되는지는 아직 밝혀져 있지 않지만, 세밀한 전압 제어가 가능하게 될 것이 분명하고있다. Intel은 통합 전압 레귤레이터는 연구를 이어오고 있다.

 

 

 

Hasell 과 Sandy Bridge / Ivy Bridge (실행엔진부의 포트가 2개 더 늘어나 있음)

 

 

 

통합 전압 레귤레이터

 

 

Haswell의 전압 레귤레이터 통합​​의 장점은 눈부시며 이기술이 Haswell의 저전력 열쇠가 되고 있다. 일반적으로 온다이 또는 온 패키지에 통합 된 CMOS 전압 레귤레이터를 사용하여 전압 제어 공간과 시간의 입도를 작게 할 수있다. 즉, 칩을 더 섬세한 부분으로 나누어 개별적으로 전압을 제어하는​​ 것이 용이하게 되어, 또 단시간에 전압을 전환하는 것도 가능하게 된다.

현재 Intel CPU는 CPU 코어 단위로 동작 전압을 바꿀 수는 없지만, 통합 전압 레귤레이터라면 개별 제어가 가능하게 된다. CPU 코어와 내부 버스의 전압을 개별적으로 제어하는​​ 것도 가능하다. 전압 전환 주파수는 오프 칩 전압 레귤레이터는 고속 제품도 수백 KHz에서 1MHz 정도로 매우 느린 동작인 반면, 통합 레귤레이터는 수백 MHz의 고속 동작이 가능하게된다. 따라서 CPU 코어군과 GPU 코어, 기타 장치에 대해 신속하게 개별적으로 최적의 전압을 공급하고, 불필요한 전력 소비가 발생하지 않도록 할 수 있다.

 

 

 

통합 전압 레귤레이터의 구조. (외부형태의 경우  CPU쪽, GPU쪽, 시스템에이전트쪽(예전 노스브릿지)단위로 전압 조절을 하지만, 통합형의 경우  각 개별 코어별로, 내부 버스까지 추가로 조절이 가능)

 

 

 

학회에서 발표 했던 통합 전압 레귤레이터 기술


Haswell에서는 FinFET의 22nm Tri-Gete 프로세스의 저전압시 높은 특성도있어, 저전압 구동 버전의 TDP(Thermal Design Power : 열 설계 소비 전력)를 10W 이하로 인하. 또한 응용 프로그램의 사용 시나리오에 입각한 SDP (Scenario Design Power)도 내려간다. 이러한 전력 절감을 지원하는 기술이 통합 전압 레귤레이터이다.

 

 

 

32나노 평면형과 22나노 트라이 게이트의 동작 전압과 트렌지스터 게이트 지연 관계

[2002년09월19일] Intel, 3 차원 구조의 "트라이 게이트 트랜지스터 ' 발표

 

 

Intel은 Haswell의 전압 레귤레이터 기술을 고객에게 "FIVR (Fully Integrated Voltage Regulator)"라고 설명하고 있다. 이 "Fully"무슨 뜻인지는 아직 명확하게되어 있지 않다. 그러나, Intel의 목표는 로직 칩에 전압 레귤레이터의 진정한 통합, 기술적인 방향은 그쪽으로 향하고 있다.

그걸 아는 것은 Intel이 지금까지 학회 발표해온 통합 전압 레귤레이터 기술은 표준CMOS 로직에 올리는 것을 목표로하고 있었기 때문이다. 스위칭에 필요한 인덕터를 CMOS 프로세스에 만들어 넣는 기술과 재료개발을 하고 있다. 자성 재료를 사용하여 와이어를 래핑하는 기술을 개발하고 인덕터를 실현하고, 몇 차례의 학회 발표를 하고있다. 또한, 몇 가지 특허 (US7202648)도 출원했다.

 

 

박막 온다이 자기 기술

 

 

자성체 와이어 모델

 

 

130나노 6층 금속 CMOS 프로세서의 언덕터 단면

 

 

 

인턱터 단면

 

(하스웰에 들어간 방식은 아닙니다. 하스웰의 방식은 인덕터가 온다이가 아니라, 패키지 통합입니다. 별도의 칩이 튀어 나와있는건 아니고.. CPU 패키지 기판속에 묻혀 있습니다.)

 

전압 레귤레이터 통합​​의 Intel의 강점은 기술 개발에 크게 리드하고 있는 것과 결합 강력한 기술을 보유하고 있다는 점. Intel이 가지는 FinFET 프로세스 기술과 통합 전압 레귤레이터 기술의 조합은 강력한 두 기술의 조합으로, 칩의 소비 전력을 낮출 수있다. 따라서 Intel이 조합을 Haswell 이외의 Atom 계 등의 제품도 넓혀 갈수록 대항하는 업체에게는 큰 위협이 된다.

또한 미래에는 이 두기술뿐만 아니라 가까운 임계 전압 (Near-Threshold Voltage : NTV) 회로 기술이 실제 제품에 적용 할 수있다. NTV는 임계 전압 근처까지 작동 전압을 낮춰도 안정 동작 할 수 있도록 하는 기술이기 때문에 작은 입도로 다른 전압에 전력을 공급할 수있는 통합 전압 레귤레이터와 함께 사용하면 효과가 크다.

 

 

 

인텔의 NTV 기술

 

 

이렇게 보면, 통합 전압 레귤레이터가 나타내는 것은, Intel의 강력한 R & D 자금력과 반도체 기술과 칩 설계가 결합 된 IDM (Integrated Device Manufacturer : 자체 공장 가진 업체)의 장점 인 것을 알 수 있다.다만 타사도 연구하고 있으며, 그 중 일부는 다른 솔루션 (2.5D 의한 전압 레귤레이터 통합​​) 등의 접근도 있어 Intel이 완전히 독주하고 있는 것은 아니다.

 

 


CPU 코어를 개별적으로 전압 전환 할 가능

 

현재 Intel CPU에도 각 CPU 코어는 부하에 따라 전압과 동작 주파수를 전환 "DVFS (Dynamic Voltage and Frequency Scaling)"를 행하고 있다. 그러나, 현재는 CPU 코어가 몇개가 있어도 CPU 코어 블록 전체에 공급되는 전압은 1 계통이다. CPU 코어와 GPU 코어 그것에 노스 브릿지 부분의 전압은 별도로 되어 있다. 하지만 CPU 코어끼리나 CPU 코어와 내부 버스의 전압은 개별적으로 제어되지 않는다.

 

 

 

전력관리

 

따라서 단일 스레드 부하가 높은 상태에서 1 개의 CPU 코어만 고클럭으로 동작해도 다른 CPU 코어에 대한 공급전력의 전압도 높게 된다. 부하가 적은 CPU 코어가 동작 주파수를 낮춰도 전압을 낮출수 없기 때문에, 고전압에 의한 불필요한 전력 소비가 생겨 버린다. 또한 내부의 링 버스 전압을 동기화 하기 때문에, CPU 코어와 버스의 전압을 낮추면 버스의 성능이 저하 해 버린다.

해결책은 코어 각각 다른 전압을 공급하는 것이지만, 지금까지의 전압 레귤레이터는 어려웠다. CPU 패키지 에 공급되는 전압을 제어하는​​ 오프 칩 전압 레귤레이터 모듈 (Voltage Regulator Module :VRM)에 여러가지 전압을 스위치하면서 공급하는 것이 어렵기 때문이다. 전압 레귤레이터 측의 모듈수를 늘리는 등 부작용이 필요할 뿐만 아니라, 전원 레인도 복잡해져 칩 전원 핀도 증가 해 버린다.


그러나 전압 레귤레이터 칩에 통합하면 이문제는 기본적으로 해결 가능하다. 어느 정도의 수의 전력레인을 개별적으로 제어 할 수 있으므로, 칩을 섬세한 구획으로 나누어 개별적으로 전압을 공급할 수 있게 되기 때문이다. 여러 VRM을 오프 칩에 대비 한 경우와 같이, CPU 코어 나 코어 클러스터 각각 별도의 전압 및 주파수 의 조합으로 동작 할 수 있게 된다.

 

 

 

멀티코어의 전력관리

 

 

Haswell는 링 버스 전압을 분리하여 병목 현상을 해소


CPU 코어뿐만 아니라 다른 장치도 마찬가지이다. 이전의 Intel CPU는 CPU 코어가 절전하면 링버스 전압도 하강 해 버리기 때문에, 내부 버스 대역폭이 떨어진다. 따라서 링 버스의 가장 안쪽에 있는 GPU 코어가 메모리에 액세스하려고하는 경우, CPU가 아이들이면​​ 버스가 병목이되어 버리는 경우가 있다. 그러나 Haswell는 세밀한 전압 제어에 의해 이문제가 해결되었다고 한다.


"Sandy Bridge와 Ivy Bridge에서 버스 문제는 메모리 컨트롤러와 링 사이에있는 것이 아니라, 코어가 최저 주파수에 떨어져 전압이 떨어을때 링 버스의 주파수와 전압을 내려 최소 대역폭이 된다는 점에 있었다. 그래서 Haswell에서는 코어와 링 버스를 완전히 분리했다. CPU가 낮은 전압에서 낮은 주파수에서 달리고 있어도, GPU는 링 버스의 주파수와 전압을 올려 필요한 만큼의 데이터 전송을 한다. 이때 CPU의 전압과 주파수는 올릴 필요가 없다 "고 Intel은 설명한다.

아래의 그림과 같이, Haswell은 Sandy / Ivy Bridge와 마찬가지로 GPU 코어가 링 버스로 메모리 컨트롤러 에서 가장 먼 곳에 연결되어있다. 따라서 링 버스가 CPU와 동기화 늦어지면 GPU 코어의 성능에 큰 영향이 생긴다. Haswell는 링 버스는 CPU 코어와는 분리 된 전압 및 주파수에서 작동하기 때문에 그 문제에서 해방되는 것이다.

 

 

Hasell 블록 다이어그램

 

 

 

매니 코어와 모바일에 통합 전압 레귤레이터의 응용


CPU를 비교적 작은 블록으로 나누어 전압 제어 할 수있는 통합 전압 레귤레이터는 CPU 코어 수가 증가할 수록 중요하다. 코어 수가 많을수록, 단일 레인의 전압 제어는 낭비가 증가되기 때문이다.


실제, I​​ntel은 48 코어의 시작 칩 "싱글 칩 클라우드 컴퓨터 (Single-chip Cloud Computer = SCC)"에서 전압 레귤레이터의 부분적인 결합으로 CPU 클러스터 단위의 전압 제어를 실시했다. 이 칩은 8 개의 CPU 코어를 1 전압 아일랜드로 정리했다. 48 코어를 6 전압 아일랜드로 분할하여 Voltage-Regulator Controller(VRC)에 의해 개별 전압 제어를 행하고 있었다. 칩 전체에는 총 8 개의 전압 아일랜드와 28의 주파수 아일랜드로 나뉘어 있었다.

 

 

 

 

따라서 이기술은 매니 코어의 "MIC (Many Integrated Core : 제온 파이)"아키텍처에 적용되는 것은 확실 하다고 볼 수 있다. 매니 코어는 과연 CPU 코어 단위의 전압 제어는 다소 까다롭기 때문에 SCC 시작 칩 처럼 클러스터 단위가 될 것으로 추측된다.

물론, 통합 전압 레귤레이터 기술은 모바일에서도 아주 효과적이다. Atom 계의 SoC에 투입되는 것은 확실해 보인다. SoC의 경우 비디오 나 오디오 등의 유닛이 큰 비중을 차지하기 때문에 그 장치를 포함하여 최적의 전압에서 동작시킬 수 활성화 될 것으로 보인다. 타사가 두려워하고있는 것은 이러한 Intel의 통합 전압 레귤레이터 기술의 전개다.

pc watch

 

[정보분석] Intel 4세대 Core 하스웰 프로세서의 내장 GPU 브랜드 Iris 와 성능을 공개

 

 

[정보분석] 배터리로 20일간 아이들 상태로 가능한 차세대 하스웰 Ultrabook

 

 

예전에 전압 레귤레이터에 대해서 말했던 [정보분석] 환경 조건을 이용하여 성능을 끌어 올리는 터보 모드(전압 레귤레이터 전압 조절기)

 

IDF 2005 저스틴 래트너 미래의 기술

 

[아키텍처] IDF 2012 인텔 차세대 주력 CPU Haswell(하스웰) 공개.

 

[정보분석] IDF 2011 인텔 하스웰(Haswell)의 다이와 절전 기술

 

[정보분석] Hasell(하스웰) 최강의 무기 통합 전압 조절기

 

 

[정보분석] Intel의 "Ozette"칩에서 Haswell(하스웰)까지의 전압 레귤레이터 통합​​의 길