벤치리뷰·뉴스·정보/아키텍처·정보분석

[분석정보] TSX 대응으로 약 6배로 성능 향상된 Xeon E7 v3

tware 2015. 5. 6. 23:46

 

 

Xeon E7 v3 웨이퍼 및 패키지

 


 Intel은 5월 5일 (현지 시간) 미션 크리티컬 / 대규모 서버용 CPU의 최신 제품 "Xeon E7 v3"를 발표했다. Haswell-EX의 개발 코드 네임으로 개발된 이 제품은 최대 18코어의 CPU 코어를 내장하고 있으며, DDR4 메모리를 지원하고 타사 칩셋과 결합해 최대 8Way 구성으로 이용 가능하다.

 Xeon E7 v3의 가장 큰 특징은 Haswell 세대에 도입된 새로운 명령어 세트 Intel TSX (Transactional Synchronization Extensions)에 대응하는 점. 멀티 쓰레드 명령을 실행할 때 발생하는 메모리 락을 행하지 않고 복수의 쓰레드를 투기적으로 처리하고 메모리의 변경이 일어났을 때만 그 쓰레드를 파기하고 처리를 다시하는 구조가 도입된다.

 TSX는 Haswell 세대에 도입하는 것으로 발표되어 있었지만, 클라이언트 용 제품 (Core 프로세서)과 기존 서버용 제품 (Xeon E5-2600 v3 등)에서는 활성화 되지 않았다. Xeon E7 v3에서 처음 활성화 된다. (클라이언트용 에서는 버그가 있어서 비활성화 라고 합니다. 이런 이유 때문에 XEON은 더 데탑보다 아키텍처 세대가 약간 더 늦습니다. 물론 데스크탑용도 갖은 테스트 등을 통해서 버그를 발견하고 수정하지만, 그래도 발견하지 못하는 것도 있기 때문에.. 한세대 늦으면 완전히 수정할 수 있겠죠. 그래서 XEON은 완전한 제품을 내놓 을 수 있구요. 또 공정 상으로도 더욱 성숙상 공정이 되기 때문에 거대 다이를 갖는 칩 생상에도 더 유리할테구요.)

 이 TSX 명령을 활성화 시킨 Xeon E7 v3는 예전 버전의 소프트웨어와의 조합으로 전 세대에 비해 최대 6배의 처리 능력을 실현하고 있으며, 대규모 서버 환경에서 TSX를 잘 활용 하는 것으로 큰 성능 향상을 얻을 것이 가능하다.


대규모 데이터베이스와 미션 크리티컬에 이용되는 Xeon E7


Xeon은 코드 네임의 끝에 붙여져있는 2 레터 코드에 의해 다음의 3 종류로 분류된다.

 

코드네임의 끝 문자
현재 제품
프로세서 수
목표 시장
-EX
Xeon E7 v3
(Haswell-EX)
4 ~ 8
미션 크리티컬,
대규모 서버
-EP
Xeon E5-2600 v3
(Haswell-EP)
2 ~ 4
메인 스트림 서버
-EN
Xeon E3 v3
(Haswell-EN)
1
엔트리 서버


 엔트리 클래스용으로 Xeon E3 패밀리로 CPU 소켓이 1개인 서버용으로 자리 잡는다. CPU 소켓과 CPU 다이는 클라이언트 PC에서 이용되는 LGA1150이 그대로 사용된다. 현재의 최​​신 제품은 Haswell-EN 개발 코드 네임이 붙은 Xeon E3 v3 제품군이다.

 메인 서버에서 CPU 소켓이 2개 ~ 4개의 서버를 타겟으로 하는 제품이 -EP 제품 라인이다. EP의 CPU 소켓은 LGA2011으로 QPI (Quick Path Interconnect) 버스로 CPU를 상호 연결한다. 현재의 최신 제품은 작년 (2014년) 9월에 발표된 Xeon E5-2600 v3 다.

 그리고 최상위가 표준 4Way (CPU가 4개 탑재 가능한 것) 타사 칩셋에서 최대 8Way 구성에 대응 가능한 -EX가 붙은 제품이다. -EX의 CPU 소켓은 EP와 같은 LGA2011로 역시 QPI로 여러 CPU 소켓 사이를 연결한다. -EX는 미션 크리티컬 애플리케이션 (기존에는 범용기로 커버 되던 기간 업무를 위한 용도) 및 대규모 데이터베이스 등의 대규모 서버용인 제품으로 EX의 최신 제품이 이번 Intel 에서 발표 된 코드명 Haswell-EX 인 Xeon E7 v3 다.

 

 

 

 

Xeon E7 v3 패키지 기존과 동일한 Socket R (LGA2011)

 


Xeon E7 v3는 Haswell-EP의 HCC와 동일한 다이


 Xeon E7 v3의 마이크로 아키텍처는 클라이언트 PC용 CPU인 제 4세대 Core 프로세서 (개발 코드 명 : Haswell)과 공통이다. 따라서, Ivy Bridge 세대에 비해 10%의 IPC 개선, L1 / L2 캐시 대역폭 개선, 통합 전압 변환기 (IVR) 등의 특징은 마찬가지다.

 

 

Xeon E7 v3의 개요, 플랫폼 v2와 같은 Brickland에서 크게 바뀐 것은

메모리, RAS 기능, QPI의 전송 속도 등


 게다가 다이 자체도 지난해 9월에 발표된 Haswell-EP Xeon E5-2600 v3의 HCC (가장 CPU 코어 구성이 큰)와 같다 (그러나 일부 EP에서는 사용되지 않았던 기능이 활성화 되어 RAS 기능 및 TSX 메모리 버퍼가 그것으로 뒤에 설명한다.). 따라서 CPU의 코어 수는 최대 18코어 (HT 기술을 지원해 36 스레드), LLC (L3 캐시)도 CPU 코어당 2.5MB로 최대 45MB 같은 사양은 마찬가지다. 이전 세대인 Ivy Bridge-EX와 Ivy Bridge-EP는 최대 코어 수가 달랐던 것과 비교하면 이 점이 큰 차이점이다.

 


Westmere
Sandy Bridge
Ivy Bridge
Haswell
EX 다이
10코어
-
15코어
18코어
EP 다이
6코어
8코어
12/10/6 코어
18/12/8 코어
클라이언트
4코어
4코어
4코어
4코어

 

 

 

Xeon E7 v3의 다이 사진, 지난해 9월에 발표된

Xeon E7-2600 v3와 동일한 다이다


 Ivy Bridge 세대는 EX가 15 코어, EP가 12 코어와 명확하게 차별화되어 있었다. 그러나 이번 Haswell 세대에서는 EX도 EP도 18 코어로 최대 코어 수가 같다. 2세대 전의 Sandy Bridge 세대는 EX 제품은 생략 되었지만, 3세대 이전 Westmere 세대로 비교해도 EX가 10코어, EP가 6코어 이었기 때문에 이번의 코어 수에 위화감을 느끼는 사람도 적지 않을 것이다.

 Westmere 세대까지 EP와 EX의 다이는 다른 계통의 다이로 설계되어 있었다. 그러나 사실 Sandy Bridge 이후는 공통의 기본 설계를 이용하고 있다 (그러나 Sandy Bridge-EX 취소). 즉 기본 구조 (링 버스 나 LLC 캐시, 언 코어)를 공유하고 CPU 코어 수를 증감하는 것만 변형 작성하는 것이다.

 Ivy Bridge 세대는 15/12/10/6 코어는 4개의 다이가 만들어져 15 코어 EX 용 12 코어 이하를 EP 용으로 할당 있었지만, Haswell 세대에서는 18/12/8 코어 3개의  다이로 줄어 18 코어를 EX와 EP에 모두 할당하고 있기 때문에, 이러한 변형이 된다.

 

EX 서버의 세대

 

 

메모리 버퍼, RAS가 유효한 것을 제외하면 Xeon E5 2600 v3의 HCC와 동일한 기능

 

 

Xeon E7 v3의 다이 구조, 2개의 홈 에이전트가 있는 링 버스가 두개(양방향)라는 구조도 동일

 


DDR3 / 4 양쪽 대응이 되고, 8소켓 시스템에서 최대 12TB까지 장착 가능


 이처럼 이번 Xeon E7 v3 (Haswell-EX)는 Xeon E5-2600 v3 (Haswell-EP)의 HCC와 같은 18 코어의 다이가 채용되고 있지만, 코어 이외로 차별화 된 있는 포인트가 3 개있다. 그것은 메모리 부분, RAS 기능, 그리고 Intel TSX에 대한 대응이다.

 Xeon E5-2600 v3는 (일부 특별 SKU를 제외) DDR4 메모리만 지원이 되고 있었다. 이에 비해 Xeon E7 v3에서는 DDR3 및 DDR4를 모두 지원한다.

 Xeon E5-2600 v3는 CPU에 내장된 메모리 컨트롤러에 메모리가 직접 연결되기 때문에 DDR4만 지원되었던 것이지만, Xeon E7 v3에서는 메모리 버퍼 (개발 코드명 : Jordon Creek2)를 통해 밖으로 연결하고 그 버퍼가 라이저 카드에 구현되어 있는 형태로 되어 있기 때문에 두 대응할 수 있는 것이다. 서버 제조업체는 공장에서 DDR3 용 라이저 카드를 꽂으면 DDR3 대응으로 출하 할 수 있고, DDR4 용 라이저 카드를 꽂으면 DDR4 대응으로 출하 할 수 있다. 또한, Jordon Creek2에는 C112 / C114이라는 두 가지 제품이 준비되어 있으며, C112이 채널당 2DIMM, C114이 채널당 3DIMM 대응된다.

 

Xeon E7 v3 메모리 구성. 각 버퍼에 2개의 메모리 채널이 있고 채널당 3DIMM까지 구현 가능

 

 

랙 서버의 앞쪽에 준비되어 있는 메모리 라이저 카드


 이 메모리 버퍼와 CPU 사이의 버스인 Intel SMI (Scalable Memory Interconnect)의 전송 속도도 향상되어 이전 세대인 Xeon E7 v2 (Ivy Bridge-EX)는 2,667MT / s였던 것이, 3200 MT / s로 끌어 올려졌다. 또한, 기본적으로 Xeon E7 v3는 Xeon E7 v2와 플랫폼 (개발 코드 네임 Brickland)을 공유하고 있으며, 메인 보드 측이 대응하고 있으면 (구체적으로는 대응 BIOS이 필요) CPU를 바꿔끼워 사용 할 수 있다. 전술한 바와 같이 메모리 소켓도 라이저 카드 형식으로 제공되는 것이 많기 때문에, DDR3에서 DDR4로 라이저 카드를 교환해 이용하는 것도 "기술적으로" 가능하다 (OEM이 그러한 옵션을 제공하는지 여부는 또 다른 문제).

 메모리는 퍼포먼스 모드 락 스텝 모드의 두 가지 모드가 준비되어있다. 성능 모드에서는 SMI (CPU- 메모리 버퍼 간 버스)와 DDR 메모리의 클럭 주파수의 비율이 2 : 1이되는 반면, 록 스텝 모드는 1 : 1이 된다는 차이가 있다. 성능 모드는 성능 중심 때에 설정하고, 록 스텝 모드는 신뢰성 중시 때 선택하는 모드이다. 각각의 모드에서의 DRAM 측의 동작 주파수가 다르며, 구체적으로는 다음과 같다.

 

DRAM 클럭 주파수 DDR4
DIMM

유형
DIMM

등급
x 데이터 폭
최대 DIMM 용량
최대 속도 (성능 모드)




2슬롯 / 채널
3슬롯 / 채널




1DIMM/채널
2DIMM/채널
1DIMM / 채널
2DIMM/채널
3DIMM/채널


4Gb
8Gb
1.2V
1.2V
1.2V
1.2V
1.2V
RDIMM
SR x 4
8GB
-
1600
1600
1600
1600
1600
RDIMM
DR x 4
16GB
32GB
1600
1600
1600
1600
1333
LRDIMM
QR x 4
32GB
64GB
1600
1600
1600
1600
1600

 

 

DRAM 클럭 주파수 DDR4
DIMM

유형
DIMM

등급
x 데이터 폭
최대 DIMM 용량
최대 속도 (락 스텝 모드)




2슬롯 / 채널
3슬롯 / 채널




1DIMM/채널
2DIMM/채널
1DIMM / 채널
2DIMM/채널
3DIMM/채널


4Gb
8Gb
1.2V
1.2V
1.2V
1.2V
1.2V
RDIMM
SR x 4
8GB
-
1866
1866
1600
1866
1600
RDIMM
DR x 4
16GB
32GB
1866
1866
1600
1866
1333
LRDIMM
QR x 4
32GB
64GB
1866
1866
1600
1866
1600

 

 

DRAM 클럭 주파수 DDR3
DIMM
유형
DIMM

등급
x 데이터 폭
최대 DIMM
용량
최대 속도 (성능 모드)




2슬롯 / 채널 3슬롯 / 채널




1DIMM

/채널
2DIMM
/채널
1DIMM
/채널
2DIMM
/채널
3DIMM
/채널


2Gb
4Gb
1.5V
1.35V
1.5V
1.35V
1.5V
1.35V
1.5V
1.35V
1.5V
1.35V
RDIMM
SRx4
4GB
8GB
1600
1333
1600
1333
1333
1333
1333
1066
1066
-
RDIMM
DRx4
8GB
16GB
1600
1333
1600
1333
1333
1333
1333
1066
1066
-
RDIMM
QRx4
16GB
32GB
1066
1066
1066
1066
1066
1066
-
-
-
-
LRDIMM
QRx4
16GB
32GB
1600
1333
1600
1333
1600
1333
1600
1333
1333
-
DRAM 클럭 주파수 DDR3
DIMM
유형
DIMM

등급
x 데이터 폭
최대 DIMM
용량
최대 속도 (락 스텝 모드)




2슬롯 / 채널 3슬롯 / 채널




1DIMM

/채널
2DIMM
/채널
1DIMM
/채널
2DIMM
/채널
3DIMM
/채널


2Gb
4Gb
1.5V
1.35V
1.5V
1.35V
1.5V
1.35V
1.5V
1.35V
1.5V
1.35V
RDIMM
SRx4
4GB
8GB
1600
1333
1600
1333
1333
1333
1333
1066
1066
-
RDIMM
DRx4
8GB
16GB
1600
1333
1600
1333
1333
1333
1333
1066
1066
-
RDIMM
QRx4
16GB
32GB
1066
1066
1066
1066
1066
1066
-
-
-
-
LRDIMM
QRx4
16GB
32GB
1600
1333
1600
1333
1600
1333
1600
1333
1333
-

 DDR4로 LRDIMM을 사용하면 DIMM의 최대 용량이 64GB가 된다. 하나의 메모리 버퍼 당 3DIMM × 2 채널 구성으로 하나의 CPU 소켓에 메모리 버퍼를 4개 연결할 수 있기 때문에 총 24개의 DIMM을 연결가능으로 계산되기 때문에 64GB의 LRDIMM을 사용한 경우 1개의 CPU에 1,536GB의 메모리를 구현할 수 있는 것이다. 이로 인해 4소켓 시스템에서 최대 6TB, 8소켓 시스템은 최대 12TB의 메모리를 구현 가능하다.

 


Itanium의 기능을 계승한 RAS 기능을 탑재


 두 번째 차이는 "Intel Run Sure Technology"라 부르는 RAS (Reliability Availability Serviceability, 신뢰성 / 가용성 / 보수성) 기능이 탑재되어 있는 것이다. RAS 기능이란 그 이름과 같이 기업 내 서버의 신뢰성, 가용성, 보수성을 높이는 기능으로, 한마디로 말하면 서버가 하드웨어 트러블로 다운되지 않는 용도의 다중화 하는 기능을 가르킨다. 이전 세대인 Xeon E7 v2 (Ivy Bridge-EX)에서도 지원되는 기능으로, 이번 Xeon E7 v3에서는 그것에 더해 인핸스드 MCA Gen.2, 어드레스 레인지 메모리 미러링, 복수의 랭크 스페어 링, DDR4 커맨드 / 주소 패리티 에러 리커버리 등의 기능이 추가됐다.

 

 

RAS 기능인 Intel Run Sure Technology가 확장


 인핸스드 MCA Gen.2는 이전 세대 Xeon E7 v2에 탑재된 인핸스드 MCA 펌웨어 기반의 오류 처리를 확장하고, 모든 에러에서 펌웨어에 의한 처리를 할 수 있도록 확장되어 있다. 구체적으로 정정 가능한 에러, 정정 불가능한 에러의 양쪽을 펌웨어에서 인터셉터 하고, 그후 OS에 오류가 통지되게 한다. 이것에 의해 펌웨어가 감지하는 하드웨어 구성 정보에 의해 더 지능적으로 OS에 정보를 올리는 것이 가능, 결과적으로 리커버리 가​​능한 이벤트 수가 늘어나게 된다. Intel에 따르면 이 기능은 원래 Itanium 프로세서의 펌웨어에 채용되고 있던 기능으로, 그것이 Xeon E7에 구현된 것이다.

 

인핸스드 MCA Gen.2는 펌웨어가 관여하는 범위를 넓혀 더 효율적인 오류 통지가 가능


 어드레스 레인지 메모리 미러링은 메모리의 일부만을 미러링 하는 방식이다. Xeon E7에서는 메모리 미러링 기능이 있고, 일부 메모리 모듈이 문제를 일으켜도 미러링 되는 다른 메모리 모듈을 이용해 시스템 가동을 계속한다. 그러나 항상 모든 영역을 미러링 한다면 메모리의 절반 밖에 쓸수 없는 것으로, 성능에 미치는 영향이 크다. 그래서 Xeon E7 v3에서는 메모리의 어떤 어드레스 부분, 구체적으로는 OS 커널 등 시스템을 계속 실행하는데 필요한 부분만 미러링하고 응용 프로그램은 하지 않는 설정이 가능하게 된다.

 

어드레스 레인지 메모리 미러링은 메모리의 일부만을 미러링 가능


 복수의 랭크 스페어 링은 메모리 컨트롤러에 있는 다른 DIMM에 있는 스페어 랭크에 동적으로 전환 구조를 제공하는 기능이다. DIMM의 랭크는 메모리 컨트롤러가 DIMM상의 DRAM 에서 데이터를 입출력 하는 단위로, 어떤 랭크에 장애가 발생했을 때 다른 랭크로로 전환하는 스페어 기능이 제공되어 있는데, 기존에는 같은 메모리 버퍼의 스페어 랭크만 스페어 되던 것이 같은 메모리 컨트롤러에 연결되어 있는 다른 메모리 버퍼의 스페어 랭크에 스페어 할 수 있게 했다. 이로 인해 장애가 발생한 DIMM을 바로 교체하지 않아도 계속 쓰게 된다.

 

 

복수 랭크 스페어 링은 랭크 스페어 링 대상을

같은 메모리 컨트롤러의 다른 메모리 버퍼 DIMM 랭크로 확장

 


 DDR4 커맨드 / 어드레스 패리티 에러 리커버리는 DDR4 메모리를 쓰는 때에 커맨드 / 어드레스 송신 때 패리티 오류가 발생한 경우 복구하는 기능이다. 지금까지의 DDR3에 있어서는 패리티 에러가 발생한 경우에는 리커버리 할 수 없었지만, DDR4에서는 그것이 가능하게 된다. 이로 인해 시스템 크래쉬를 일으킬 수 있는 메모리 에러의 발생 빈도를 감소시킬 수 있다.

 

DDR4 커맨드 / 어드레스 패리티 에러 리커버리는 DDR4에서 패리티 오류까지 복구 가능

 


SAP HANA SP9 + TSX를 이용해 이전 세대에 비해 최대 6배의 처리 능력 향상 실현


 그리고 Xeon E7 v3의 가장 큰 특징은 Intel TSX에 대응하는 것이다. TSX (Transactional Synchronization Extensions)는 CPU가 여러 쓰레드를 병렬 처리하는 경우에 빈번한 락  처리를 보다 유연하게 처리하는 구조이다.

 CPU가 여러 쓰레드를 병렬 처리하는 경우 문제가 되는 것은 동시에 처리하는 스레드의 데이터가 상관 관계에 있는 경우이다. 예를 들어, 첫 번째 쓰레드와 두 번째 쓰레드에서 같은 데이터를 처리하는 경우가 있다. 이 경우 첫 번째 쓰레드의 실행이 끝날 때까지 두 번째 스레드를 실행해도 의미가 없기 때문에, IA 에서는 락이라는 데이터를 보호하는 처리가 이뤄진다. 잠긴 데이터를 처리하는 다른 쓰레드가 잠긴 쓰레드의 처리가 끝날때 까지 실행을 기다리게 된다. 그러나 어떤 쓰레드의 데이터가 다른 쓰레드에 영향을 주는지는 실행이 끝나지 않으면 모르기 때문에 불필요 하게 잠겨, 그 결과 쓰레드의 병렬 실행 효율이 저하 될 수 있다.

 그래서 TSX에서는 두 가지 방식으로 락 동작을 하지 않고 스레드를 병렬로 실행한다. 그리고 처리를 한 후 락 없이는 실행할 수 없었던 것을 아는 경우에는 실행 쓰레드를 파기하고 다시 처리를 한다. 이로 인해 쓰레드의 실행 효율을 향상시키고 전체 성능을 향상 시킨다.

 TSX는 HLE (Hardware Lock Elision)와 RTM (Restricted Transactional Memory)이라는 두 가지 방식이 준비되어 있으며, 전자는 레거시 명령 접두어 (XACQUIRE 및 XRELEASE)를 이용하고 후자는 TSX에 추가 된 새로운 명령 접두사 (XBEGIN, XEND, XABORT)를 이용한다.

 

Xeon E7 v3에서 처음 TSX 기능이 활성화

 


 이 TSX는 Haswell 세대의 다른 제품 (클라이언트 및 EN의 Haswell, Haswell-EP)는 마이크로 코드 레벨에서 비활성화 되어 있으며, Broadwell에서도 클라이언트 용 제품은 아직 활성화 되어 있지 않다. 따라서 현재 TSX를 이용할 수있는 것은 이번 Xeon E7 v3가 처음이다. 또한 Intel에 따르면 현재 TSX를 다른 Haswell 세대 CPU (예 Xeon E5-2600 v3 등)에서 활성화 할 계획은 현재 없다고 한다.

 이 TSX를 사용했을 경우의 효과는 매우 크다. Intel에 따르면 Xeon E7-4890 v2 (15 코어, 2.8GHz)에 SAP HANA SP8 이라는 인 메모리 프로세싱 소프트웨어를 사용하는 환경과 TSX 지원이 추가된 SAP HANA SP9와 Xeon E7-8890 v3 (18 코어, 2.5GHz)와의 비교에서는 최대 6배의 트랜잭션 처리가 실현 가능하다고 한다. 다만 이 안에는 CPU의 성능 향상 (전 세대에 비해 1.5 배), HANA SP9 자체의 성능 향상 (1.8 배)가 포함되어 있으며, TSX 만의 성능 향상을 보면 2.2 배라는 설명이었다. 그들을 종합하면 전체 6배의 성능 향상이 실현 된다고 한다.

 HLE을 사용 쪽이든, RTM을 사용하든, 소프트웨어 측의 대응이 필수가된다. 이미 Intel은 ISV들을 위한 지원을 시작하고, SAP의 HANA SP9는 그 한 예이다. Intel에 따르면 SAP는 HANA에 TSX의 구현을 3개월 정도로 하는 것이 가능했다고 한다. HANA의 구현은 프로그래머에 의한 수동으로 한것 이지만, Intel이 제공하는 다양한 개발 도구 (Vtune 등)를 이용함으로써 개발 기간은 더 단축 하는 것도 할 수 있는 것이다.

 

SAP의 HANA SP9로하면 1.8 배의 트랜잭션 처리가 가능해, Xeon E7-4890 v2에서 Xeon E7-8890 v3로 해서 2.7 배의 추가 트랜잭션이 실현된다. 또한 TSX를 이용해 최대 6배의 성능 향상이 실현된다

 

 

 

HANA SP9에서 TSX의 대응은 SAP의 프로그래머가 수동으로 코드를 작성했기 때문에 3 개월 걸렸지만 다른 소프트웨어에서 1개월 정도. Vtune 등의 도구를 이용하면 보다 쉽게​​ TSX 대응을 실현 가능

 


IBM의 POWER8에 비해 가격 대비 성능이 10배, TCO 85% 절감 강조


이번에 발표된 Xeon E7 v3 (Haswell-EX)와 기존 제품인 Xeon E7 v2 (Ivy Bridge-EX)의 주요 차이점을 정리한 것이 다음 표다.

 


Xeon E7 v2
Xeon E7 v3
소켓
소켓 R1
플랫폼 코드명
Brickland
공정 22나노
공정
최대 15코어
최대 18코어
TDP
155W
165W
AVX
AVX1

(8DP FLOPS / 클럭 /코어)
AVX2

(16DP FLOPS / 클럭 /코어)
VT-x 신기능

(VMCS 쉐도윙등)
미대응
지원
FMA
미대응
지원
TSX
미대응
지원
QPI
3 x QPI 1.1 (최대 8GT/s)
3 x QPI 1.1 (최대 9.6GT/s)
LLC
최대 37.5MB

(코어당 2.5MB)
최대 45MB (코어당 2.5MB)
메모리
DDR3
DDR3 / DDR4
SMI 속도
DDR3
DDR3 / DDR4
DIMM 수
2667 MT /s
3200MT /s
I/O
32 x PCI-e 3.0, 1 x DMI2 (x4)

 

 덧붙여 Xeon E7 v3 에서 TDP가 10W 정도 오르고 있지만, 이것은 전압 변환기 (Voltage Regulator)가 CPU 측에 통합되어 있기 때문이다. 그러나 그만큼 마더 보드 측의 전력이 줄어들고 있기 때문에 총 전력이 증가하고 있는 것은 아니다.


 CPU 소켓은 기존의 Xeon E7 v2와 같은 Socket R1 (LGA2011)이 되고, 핀 호환이 된다. 칩셋도 Xeon E7 v2와 동일한 칩셋을 사용 가능해 마더 보드 측이 지원하는 경우 (즉 BIOS가 Xeon E7 v3 대응되어 있으면), CPU 만 교체하여 업그레이드 하는 것도 가능하다 ( 그러나 가능한가 여부는 OEM 메이커 나름).

 한편, 이번 기사에서는 소개하지 않지만, COD (Cluster on Die)라는 새로운 캐시 스눕, VMCS 섀도윙과 EPT A / D 지원 등의 VT-x의 새로운 기능, 코어별 P 스테이트 기능 등의 Haswell 세대의 기능 향상은 기본적으로 Xeon E5-2600 v3와 동등하다. 이러한 자세한 내용은 Xeon E5-2600 v3의 기사를 참조 바란다.

 Xeon E7 v3에는 다음과 같은 SKU가 준비된다.

 

 

프로세서
종류
소켓수
코어/스레드
주파수
터보 부스트
LLC
QPI
메모리
TDP
가격
(달러)
E7-8890 v3
표준 SKU (어드밴스드)
8
18/36
2.5GHz
O
45M
9.6GT/s
DDR4-1866 / DDR3-1600
165W
7175
E7-8880 v3
표준 SKU (어드밴스드)
8
18/36
2.3GHz
O
45M 9.6GT/s
DDR4-1866 / DDR3-1600 150W
5896
E7-8880L v3
특정용도 (어드밴스드)
8
18/36
2GHz
O 45M 9.6GT/s
DDR4 / DDR3 115W
6062
E7-8870 V3
표준 SKU (어드밴스드)
8
18/36
2.1GHz
O 45M 9.6GT/s
DDR4-1866 / DDR3-1600 140W
4672
E7-8893 v3
특정용도 (어드밴스드)
8
4/8
3.2GHz
O 45M 9.6GT/s
DDR4 / DDR3
140W
6841
E7-8891 v3
특정 용도(어드밴스드)
8
10/20
2.8GHz O 45M 9.6GT/s
DDR4 /DDR3
165W
6841
E7-8867 v3
특정용도(HPC)
8
16/32
2.5GHz O 45M 9.6GT/s
DDR4 / DDR3
165W
4672
E7-8860 v3
표준 SKU (어드밴스드)
8
16/32
2.2GHz O 40M 9.6GT/s
DDR4-1866 / DDR3-1600 140W
4060
E7-4850 v3
표준 SKU (스탠다드)
4
14/28
2.2GHz O 35M 9.6GT/s
DDR4-1866 / DDR3-1600 115W
3004
E7-4830 v3
표준 SKU (스탠다드)
4
12/24
2.1GHz O 30M 8GT/s
DDR4-1866 / DDR3-1600 115W
2169
E7-4820 v3
표준 SKU (베이직)
4
10/20
1.9GHz
25M 6.4GT/s
DDR4-1866 / DDR3-1333 115W
1502
E7-4809 v3
표준 SKU (베이직)
4
8/16
2GHz
20M 6.4GT/s
DDR4-1866 / DDR3-1333 115W
1224

 SKU는 표준 SKU와 특정 용도 SKU가 준비되어 있으며, 어드밴스드 (고성능 용), 스탠다드 (표준 용), 베이직 (염가 판)의 3개의 세그먼트 제품이 준비되어 있다. 어드밴스드는 8 소켓까지 지원되며 스탠다드와 베이직은 4 소켓까지다. 이전 세대에서는 30에 가까운 SKU가 있었다는 것을 생각하면 간단하게 정리 된다. 그러나 Intel은 특정 고객을 위한 SKU를 제공하는 것을 이미 시작하고 있어 대규모 고객을 위한 맞춤 SKU를 제공 할 수 있다고 설명한다

 또한 어드밴스드 SKU와 스탠다드 SKU는 Turbo Boost 기능이 제공되는데, 각 SKU의 중간 주파수는 다음과 같다.

터보 부스트 주파수
프로세서
기본클럭
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
E7-8890 v3
2.5GHz
3.3
3.3
3.1
3
2.9
2.9
2.9
2.9
2.9
2.9
2.9
2.9
2.9
2.9
2.9
2.9
2.9
2.9
E7-8880 v3
2.3GHz
3.1
3.1
2.9
2.8
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
E7-8880L v3
2GHz
2.8
2.8
2.6
2.5
2.4
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
E7-8870 v3
2.1GHz
2.9
2.9
2.7
2.6
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
E7-8893 v3
3.2GHz
3.5
3.5
3.3
3.3
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
E7-8891 v3
2.8GHz
3.5
3.5
3.3
3.2
3.2
3.2
3.2
3.2
3.2
3.2
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
E7-8867 v3
2.5GHz
3.3
3.3
3.1
3
2.9
2.8
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
n/a
n/a
E7-8860 v3
2.2GHz
3.2
3.2
3
2.9
2.8
2.7
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
n/a
n/a
E7-4850 v3
2.2GHz
2.8
2.8
2.6
2.6
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
n/a
n/a
n/a
n/a
E7-4830 v3
2.1GHz
2.7
2.7
2.5
2.4
2.4
2.4
2.4
2.4
2.4
2.4
2.4
2.4
n/a
n/a
n/a
n/a
n/a
n/a

 

 

터보 부스트 주파수 (AVX)
프로세서
AVX

기본클럭
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
E7-8890 v3
2.1GHz
3.2
3.2
3.2
3
2.9
2.8
2.7
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
E7-8880 v3
1.9GHz
3.1
3.1
2.9
2.8
2.7
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
E7-8880L v3
1.6GHz
2.8
2.8
2.6
2.5
2.4
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
2.3
E7-8870 v3
1.8GHz
2.9
2.9
2.7
2.6
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
E7-8893 v3
2.8GHz
3.3
3.3
3.2
3.2
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
E7-8891 v3
2.4GHz
3.4
3.4
3.2
3.2
3.2
3.2
3.2
3.2
3.2
3.2
n/a
n/a
n/a
n/a
n/a
n/a
n/a
n/a
E7-8867 v3
2.2GHz
3.2
3.2
3
2.9
2.8
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
2.7
n/a
n/a
E7-8860 v3
1.9GHz
3.2
3.2
3
2.9
2.8
2.7
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
2.6
n/a
n/a
E7-4850 v3
1.9GHz
2.8
2.8
2.6
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
2.5
n/a
n/a
n/a
n/a
E7-4830 v3
2.1GHz
2.7
2.7
2.5
2.4
2.4
2.4
2.4
2.4
2.4
2.4
2.4
2.4
n/a
n/a
n/a
n/a
n/a
n/a


 Xeon E7 v3에도 Xeon E5-2600 v3에서 도입된 AVX 기반 주파수의 생각이 투입되고 있으며, AVX 명령 실행시에는 일시적으로 클럭 주파수를 낮춰 써멀 스로틀링이 일어나기 어렵게 하는 방식이 채용되고 있다.

 Intel은 발표와 동시에 각종 애플리케이션의 벤치 마크 결과를 공표하고 있다. Intel에 따르면 평균적인 성능 향상 비율은 1.4 배로 되어 있으며, 특히 SAP HANA SP9에서 TSX를 이용한 경우는 무려 6배라는 인상적인 처리 능력의 향상을 실현하고 있다.

 

SPECrate2006 점수 (추정치, SPEC의 공식적인 수치는 추후 발표 될 예정)는 이전 세대 (Xeon E7 v2)에 비해 16% 향상

 

 

SPECcpu2006 점수 (추정치, SPEC의 공식적인 수치는 추후 발표 될 예정)는 이전 세대 (Xeon E7 v2)에 비해 6 ~ 9% 향상

 

 

이전 세대 (Xeon E7-4890 v2)와 Xeon E7-8890 v3와의 비교 수치. SAP HANA SP9에서 6배가 가장 눈에 띄는데, 평균 1.4 배의 성능 향상을 실현

 


 IBM POWER8 기반 서버와 비교해 가격 당 성능 (가격 / 성능)이 10 배에 달하며 TCO는 85% 낮다고 설명하고 있다. 비용면에서의 메리트가 높다고 강조 대기업에서 업무용 서버 등에 사용되는 POWER 기반 서버에서 IA에 환승을 촉구해 나갈 생각이다.

 

POWER8과 성능은 거의 같고, 가격 대비 성능은 10배 (즉 가격은 10분의 1)에

TCO도 (하드,소프트 도입및 교육, 유지 관리비용) 85% 낮다고 Intel은 주장

 

 

[분석정보] Intel, 기간 서버용 CPU 신제품 Xeon E7 v3발표

 

 

[분석정보] 인텔 최대 18코어 Haswell-EP Xeon E5-2600 v3

 

 

[분석정보] 인텔 데스크탑 eDRAM 버전을 포함한 브로드웰 패밀리 설명

 

 

[분석정보] Xeon E5-2600 v3가 데이터 센터의 변화를 가속

 

 

[분석정보] 고밀도 서버 전용의 Atom을 대체하는 Broadwell 기반 Xeon D

 

 

[분석정보] 드디어 등장한 최상위 x86 서버 프로세서, 아이비브릿지 세대 제온 E7 v2 시리즈

 

[제품정보] NEC, 최신 Xeon과 독자 RAS기술의 기간 IA서버 NX7700x 발매

 

 

[분석정보] Intel, Ivy Bridge-EX Xeon E7 v2 패밀리.최대 15코어 CPU 메모리 용량은 최대 1.5TB

 

 

[제품정보] Supermicro 메모리 96개 탑재 가능한 Xeon E7-8800 v2 지원 시스템

 

 

[분석정보] 부드러운 데이터 센터를 만드는 Intel의 Software Defined Infrastructure

 

 

[분석정보] Intel이 ISSCC에서 15 코어 Ivytown과 Haswell의 FIVR 기술 등을 발표

 

 

[분석정보] 전환기를 맞이한 2014년 인텔의 서버 프로세서

 

 

[분석정보] 서버용으로 튠업 된 새로운 Atom C2000 시리즈

 

 

[분석정보] IDF13 San Francisco에서 보는 2014년의 서버용 프로세서

 

 

[분석정보] 가상화 시대의 네트워크? IDF 2009에서 해독

 

 

[분석정보] 이스라엘에서 발신되는 인텔의 차세대 CPU 기술

 

 

[분석정보] Many-Core CPU로 향하는 Intel. CTO Gelsinger 인터뷰 1/2부

 

 

[분석정보] IBM이 기술의 집대성 괴물 CPU "Power8"발표

 

 

[분석정보] IBM, Oracle, 후지쯔가 최첨단 프로세서를 선보이다

 

 

[분석정보] 아이테니엄(Itanium)을 둘러싼 불안과 기대

 

 

[분석정보] 인텔 테스크탑 CPU 터보 부스트 클럭 정보.

 

 

[분석정보] 2016년 프로세서와 운영체제 동향

 

 

[분석정보] 2010년 Intel 아키텍처가 보였다