벤치리뷰·뉴스·정보/아키텍처·정보분석

[분석정보] Intel 8소켓 대응 24코어 프로세서 Xeon E7 v4시리즈

tware 2016. 6. 6. 18:30

 

 

 

 미국 Intel은 6일 (현지 시간) "Broadwell-EX"의 코드 네임으로 개발을 계속해 온 데이터 센터 (서버)용 프로세서인 Xeon E7 v4 패밀리를 발표했다. Xeon E7 v4 패밀리는 인텔의 4소켓 초과 제품인 Xeon E7로는 처음으로 14nm 공정으로 제조되어, 이전 세대인 Xeon E7 v3 제품군 (코드 명 : Haswell-EX)가 18 코어였던 것에 비해 24코어로 강화 되었다.

 

 Intel에 의하면 Xeon E7 v4는 Xeon E7 v3에 비해 대체로 1.3배 정도의 성능을 제공하며, 5년 전 2011년에 출시 된 초대 Xeon E7의 4소켓 서버 100대분과 동일한 성능을 33대분으로 실현할 수 있어 운영 비용도 절감 가능하다고 한다.

 

 

E7은 8 소켓까지 지원

 

Intel의 데이터 센터용 프로세서는, 서브 브랜드로 분류하면 Xeon E7, Xeon E5, Xeon E3의 3 종류가 있으며, 아래와 같은 차이가 있다.

 

표1. 인텔의 데이터 센터용 프로세서의 세가지 서브 브랜드
현 제품
소켓 수
GPU
목표 시장
Xeon E7 V4 (브로드웰-EX)
4-8
-
미션 크리티컬 대규모 서버
Xeon E5 V4 (브로드웰-EP)
2-4
-
메인 스트림 서버
Xeon E3 V5 (스카이레이크)
1
있음 / 없음
엔트리 서버

 

 가장 저가형인 E3 시리즈는 싱글 소켓 서버용으로 위치한다. 클라이언트 PC와 동일한 다이가 채용되며, 내장 GPU가 비활성화 된 SKU와 그대로 사용되는 SKU가 있고, 후자는 GPU의 트랜스 코딩 하드웨어를 이용하여 동영상의 고속 변환도 가능하게 되어있다. 현재 클라이언트 PC용인 6세대 Core 프로세서와 공통의 다이인 Skylake (개발 코드 명)가 채용되고 있으며, 얼마전 대만에서 열린 COMPUTEX TAIPEI에서 자사의 최신 제품인 Xeon E3-1500 v5 (다른 기사 참조)가 발표 되었다.

 

 E5 시리즈는 메인 스트림 서버로 위치하는 2소켓 서버용 제품이다. 현재 일본에서 일반적으로 서버라고 부르는 것은 이 2소켓 E5 시리즈인 것을 의미하며, 엔터프라이즈 서버 나 데이터 센터의 클라우드 서버 등에는 이 E5 시리즈가 이용되는 것이 많다. 현재의 최신 제품은 3월 31일 (미국 시간)에 발표된 Xeon E5 v4 ( 다른 기사 참조) 이다.

 

 그리고 새로 발표된 것이 Xeon E7 v4. E7 시리즈는 Intel의 자사 칩셋으로는 4소켓까지, 서드파티 칩셋이면 8소켓까지 대규모 구성에 대응하고, 미션 크리티컬 서버나 인 메모리 데이터베이스 등의 대규모 데이터베이스 서버용으로 위치한다. 작년 (2015년) 발표된 Xeon E7 v3 (개발 코드 명 : Haswell-EX)를 바꿔 놓게 된다.

 

 

Xeon E5 v4와 동일한 다이를 이용하며, 최대 24코어로 확장기능도 구현

 

 Xeon E7 v4는 CPU의 다이 자체는 Xeon E5 v4에 사용되고 있는 Broadwell-EP와 같다. Broadwell-EP 다이의 특징 등에 관해서는 전의 다른 기사 에서 자세하게 해설하고 있으므로, 그 쪽을 참조 바란다.

 

 

Xeon E7 v4

 

 

CPU 소켓은 기존과 동일한 Socket R1 (LGA2011)

 

 다만 Xeon E7 v4에서는 Xeon E5 v4에서는 무효화 되었던 몇가지의 기능이 유효화 되어 있다. 구체적으로는 아래의 세 가지 포인트.

 

 

1. CPU 코어가 최대 24 코어까지 (Xeon E5 v4는 22 코어까지)
2. RAS 기능
3. SMI 의한 대용량 메모리 탑재가 가능

 

Xeon E5 v4, Xeon E7 v4 공통으로 사용되는 Broadwell의 LCC (Large Core Count)라 부르는 최대 구성의 다이에는 24 코어가 내장되어 있다. 그러나 Xeon E5 v4에서는 최대 구성에서도 2개의 코어가 비활성화 된 22 코어 구성으로 되어있다. 한편, Xeon E7 v4는 최대 24코어 구성의 SKU가 준비되어 있으며, HT (Hyper Threading) 기술을 사용하는 경우에는 최대 48논리 코어로 이용 가능하다. 최대 8소켓 구성이 가능하므로, 1대로 192 코어 / 384 스레드 라는 시스템을 구축 할 수 있다.

 

 

Xeon E5 v4의 LCC와 동일한 최대 24코어 구성. Xeon E5 v4는 22 코어까지지만, Xeon E7 v4는 24코어 풀의 SKU가 이용된다 (출처 : Intel Xeon Processor ​​E7 v4 Family Architecture Review 2016년 Intel Corporation)

 

또 Xeon E5 v4에서는 무효화 되었던, RAS (Reliability Availability Serviceability, 신뢰성 / 가용성 / 관리성) 기능이 유효화 되어 있다. RAS 에러 등을 점검하고 대처하는 기능으로, 미션 크리티컬 서버에 이용되는 Xeon E7 시리즈는 필수라고도 말할 수 있는 기능. Intel에서는 회사의 RAS 기능을 "Intel RunSure Technology"라 통칭하고 있다.

 

 이 RAS 기능은 매 세대 기능이 추가되어, 이전 세대에서는 향상된 MCA Gen.2, 어드레스 레인지 메모리 미러링, 복수의 랭크, 스페어 링, DDR4 명령 / 주소 패리티 에러 복구 등의 기능이 추가. Broadwell-EX 세대에서는 OS나 ISV가 기능을 소프트웨어로 도입하는 것이 가능하도록 확장된 외에는, 기본적으로는 이전 세대와 동일한 기능을 탑재된다.

 

 메모리 부분에도 차이가 있다. Xeon E7에서는 SMI라 부르는 버퍼를 외부에 붙여, 그 앞쪽에 DIMM 모듈을 장착하는 형태로 메모리를 탑재한다. Xeon E7 v4에도 같아, Intel SMI Gen.2라 부르는 제 2세대의 SMI 컨트롤러를 이용해서 버퍼 1개에 대해 6개의 DIMM을 장착 가능하다. 그 버퍼를 4개 장착 가능한 것으로, 1소켓 당 최대 24개의 DIMM을 장착 할 수 있다.

 

 Xeon E7 v4에서는 새로운 128GB의 3DS LR-DIMM이 지원된다. 이를 이용한 경우에는 4소켓 시스템에서는 24 (1소켓 당 24DIMM) × 4 × 128GB로 1​​2TB, 8소켓 시스템에서 24TB라는 방대한 양의 메인 메모리를 이용하는 것이 가능하게 된다. 또, 메모리 동작 클럭 등은 Xeon E7 v3와 같다.

 

 

메모리 부분은 Xeon E7 v3와 기본적으로 같지만, 새롭게 128GB의 3DS LR-DIMM이 지원된다. 8소켓의 경우는 24TB까지 메모리를 증설 가능하다 (출처 : Intel Xeon Processor ​​E7-8800 / 4800 v4 Product Family Performance UPDATE 2016 년 Intel Corporation)

 

  또 기존에는 2구성으로만 지원되었던 캐시 스눕 새로운 방식 COD (Cluster on Die)에 관해서 4소켓 구성에도 대응한다. COD는 프로세서 내부를 두개의 클러스터로 분할하여, 2개인 홈 에이전트에 있는 디렉토리 캐시라 부르는 14KB의 캐시 테이블을 우선 참조하여, 거기서 히트하지 않는 경우에만 홈 에이전트가 스눕을 하는 구조다. 그것에 의해 LLC (Last Level Cache)의 적중률을 높이고, 또한 메모리 지연 시간 감소, 메모리 대역폭의 효율적인 이용도 생긴다.

 

 

COD 기능이 4 소켓에서도 이용 가능하게 되었다 (출처 : Intel Xeon Processor ​​E7 v4 Family Architecture Review 2016 년 Intel Corporation)

 

 또한 Xeon E7 v4 (Broadwell-EX), Xeon E7 v3 (Haswell-EX), Xeon E7 v2 (Ivy Bridge-EX)의 3세대 기능 및 스펙은 아래 대로다. CPU 소켓은 기존과 같은 Socket R1 (LGA2011)가 된다.

 

표2. Xeon E7 v4, Xeon E7 v3, Xeon E7 v2 사양 비교
소켓
소켓 R1
플랫폼 코드 명
brickland
공정
22nm
14nm
CPU 코어
최대 15
최대 18
최대 24
최대 TDP
165W
AVX
AVX1 (8DP Flops/클럭/코어) 코어별 1클럭당 8 배정밀도.
8x클럭x코어수= CPU 64bit Flops. 단정밀도(32bit)는 x 2배.그래픽 카드가 그렇듯 피크 플롭
AVX2 (16DP Flops/클럭/코어)
AVX2 (16DP Flops/클럭/코어)
VT-x 신기능
미 대응
대응
대응
FMA
미 대응
대응
대응
TSX
미 대응
대응
대응
QPI
3xQPI 1.1 (최대 8GT/s)
3xQPI 1.1 (최대 9.6GT/s)
3xQPI 1.1 (최대 9.6GT/s)
LLC
최대 37.5MB
최대 45MB
최대 60MB
스눕 모드
Directory
Directory
Directry /COD
메모리
DDR3
DDR3 / DDR4
DDR3 / DDR4
SMI 속도
2,667MT/s
3,200MT/s
3,200MT/s
DIMM 수
24DIMM / 소켓
eMCA
v1
v2
v2
MCA Recovery-Execution Path
O
O
O
MCA Recovery-Execution I/O
O
O
O
PCIe LER
O
O
O
Address Based Memory Mirroring
-
O
O
Multiple Rank Sparing
-
O
O
DDR4 Recovery for Command / Parity Errors
-
O
O
OS / ISV 통합
-
-
-
I / O
32xPCIe 3.0, 1xDMI2 (x4)

 

 

전 세대와 비교해서 대체로 1.3배의 성능 향상을 실현

 

Xeon E7 v4에 준비되어 있는 SKU는 다음과 같다.

 

표3. 제온 E7 v4 SKU 구성
  최대 소켓 수
코어/스레드
주파수
터보 부스트
LLC
QPI
TDP
가격(달러)
E7-8890 v4
8
24/48
2.2GHz
O
60MB
9.6GT/s
165W
7,174
E7-8880 v4
8
22/44
2.2GHz
O
55MB
9.6GT/s
150W
5,895
E7-8870 v4
8
20/40
2.1GHz
O
50MB
9.6GT/s
140W
4,672
E7-8860 v4
8
18/36
2.2GHz
O
45MB
9.6GT/s
140W
4,061
E7-4850 v4
4
16/32
2.1GHz
O
40MB
8GT/s
115W
3,003
E7-4830 v4
4
14/28
2GHz
O
35MB
8GT/s
115W
2,170
E7-4820 v4
4
10/20
2GHz
-
25MB
6.4GT/s
115w
1,502
E7-4809 v4
4
8/16
2.1GHz
-
20MB
6.4GT/s
115w
1,223
E7-8891 v4
8
10/20
2.8GHz
O
60MB
9.6GT/s
165W
6,841
E7-8893 v4
8
4/8
3.2GHz
O
60MB
9.6GT/s
140W
6,841
E7-8867 v4
8
18/36
2.4GHz
O
45MB
9.6GT/s
165W
4,672

 

 Intel은 성능 데이터도 공개했다. 이전 세대의 최상위 SKU인 Xeon E7-8890 v3 (18코어, 2.5GHz, 165W)과 신제품의 최상위 SKU인 Xeon E7-8890 v4 (24코어, 2.2GHz, 165W)의 비교에서는 SPECfp_rate_base2006 에서 1.19 배, SPECint_rate_base2006 에서 1.28 배, SPECjbb2015 Multi-JVM Critical 에서 1.29 배, TPC-E SQL Server서 1.3배, SAP Sales and Distribution 2T LINUX 에서 1.33배, SAP Sales and Distribution 2T Windows 에서 1.33배, SPECvirt_sc 2013 에서 1.35배라는 결과라 한다. Intel에 의하면, 이러한 결과로 대체로 전 세대에 비해 약 1.3배 성능이 향상 되었다고 평가한다.

 

 

Xeon E7-8890 v4 와 Xeon E7-8890 v3 비교. Xeon E7-8890 v4가 평균 1.3배의 성능 향상 (출처 : Intel Xeon Processor ​​E7-8800 / 4800 v4 Product Family Performance UPDATE 2016년 Intel Corporation)

 

 5년 전에 발매된 Westmere-EX 세대의 Xeon E7-4870 (10 코어)와 Xeon E7-8890 v4의 비교에서는 33대의 4 소켓의 Xeon E7-8890 v4는 100대의 4 소켓의 Xeon E7-4870과 동등한 성능으로 네트워크/유지 관리 비용이 최대 92%, 전기 / 공기조절 비용이 최대 73%, 소프트웨어 라이센스 비용이 최대 67% 절감되는 장점이 있다고 한다.

 

 

Xeon E7-8890 v4와 5년 전 Xeon E7-4870의 4소켓 서버를 동일한 성능에서 대수로 비교하면, Xeon E7-4870 100대에 Xeon E7-8890 v4는 33대에서 끝난다. 네트워크 / 유지 관리 비용이 최대 92%, 전기 / 공조 비용이 최대 73%, 소프트웨어 라이센스 비용이 최대 67% 절감된다 (출처 : Intel Xeon Processor ​​E7-8800 / 4800 v4 Product Family Performance UPDATE 2016 년 Intel Corporation)

 

 2소켓의 Xeon E5-2699 v4 (22 코어)와 4소켓의 Xeon E7-8890 v4 (24코어) 비교의 경우에는 20대의 2소켓 Xeon E5-2699 v4 서버가 9대의 4소켓 Xeon E7-8890 v4 서버와 동등한 성능으로 TCO는 25% 낮아진다.

 

 

2소켓의 Xeon E5-2699 v4 (22 코어)와 Xeon E7-8890 v4 (24 코어)의 비교 (출처 : Intel Xeon Processor ​​E7-8800 / 4800 v4 Product Family Performance UPDATE 2016년 Intel Corporation)

 

 경합하는 타사와의 비교에서는, IBM POWER8 (E870)과 Xeon E7-8890 v4와의 비교 데이터도 공개되어 있으며, 성능에서는 Xeon E7-8890 v4가 IBM POWER8 (E870)를 40% 상회하면서 전력은 절반. 그것에 의해 비용당 성능은 IBM POWER8 (E870)에 비해 10배 높다고 Intel은 주장하고 있다.

 

 

IBM POWER8 (E870)과의 비교 (출처 : Intel Xeon Processor ​​E7-8800 / 4800 v4 Product Family Performance UPDATE 2016년 Intel Corporation)

 

 

2016년 6월 6일 기사

 

 

제온 E7 v4 96코어 192 스레드

 

[분석정보] Intel, 기간 서버용 CPU 신제품 Xeon E7 v3발표

 

 

[분석정보] TSX 대응으로 약 6배로 성능 향상된 Xeon E7 v3

 

 

[분석정보] 드디어 등장한 최상위 x86 서버 프로세서, 아이비브릿지 세대 제온 E7 v2 시리즈

 

 

[분석정보] Intel, Ivy Bridge-EX Xeon E7 v2 패밀리.최대 15코어 CPU 메모리 용량은 최대 1.5TB

 

 

[분석정보] 14나노 공정 세대의 서버 CPU 브로드웰-EP의 모듈러 설계

 

 

[분석정보] Intel 2 소켓용 Broadwell 프로세서 "Xeon E5 v4"

 

 

[분석정보] 2016년 (서버) 프로세서와 운영체제 동향

 

 

[분석정보] 인텔 4+4e 제온 E3-1500 v5 발표와 제 7세대 Core 프로세서 4분기 중 출하 발표