벤치리뷰·뉴스·정보/아키텍처·정보분석

[분석정보] 드디어 등장한 최상위 x86 서버 프로세서, 아이비브릿지 세대 제온 E7 v2 시리즈

tware 2014. 2. 19. 20:00

 

2013년 말 출시가 미끄러져 2014년 2월에 드디어 출시된 Xeon E7-8800/4800/2800 v2 시리즈 (이하 Xeon E7 v2 시리즈)는 Intel x86 계열 서버 프로세서 중 최상위에 위치 하는 제품이다.

 8 소켓 대응의 동 시리즈를 사용한 서버는 최대 120 코어 / 240 스레드, 12TB의 대용량 메모리를 탑재한 슈퍼급의 서버를 구성 할 수 있으며 x86 서버의 사용 영역을 넓힐 것으로 기대되고 있다.

 그래서 이번에는 발표 자료를 토대로 Xeon E7 v2 시리즈의 특징을 해설해 나간다.

 

Intel의 서버용 프로세서 포지셔닝. Xeon E7 v2 시리즈는 x86 계 프로세서로는 최상위 프로세서가 된다

 

 

 

 

Xeon E7 v2 시리즈는 이전 세대에 비해 성능이 2 배, 메모리 용량 3 배 I / O 성능 4 배 더 Intel Run Sure하여 99.999 %의 가용성을 가지고

 


대망의 Ivy Bridge 세대의 Xeon E7


 이번에 발표된 Xeon E7 v2 시리즈는 Intel의 서버용 프로세서로는 최상위 급 프로세서이다.

 이전 Xeon E7 시리즈는 Ivy Bridge 보다 2세대 전의 Westmere 세대 (제조 공정은 32nm )이었다. 그러나 22nm 제조 공정으로 코어 수도 이전 세대의 최대 10 코어에서 Xeon E7 v2 시리즈는 최대 15 코어 늘고 있다. Hyper-Threading (HT)을 이용하면 최대 30 스레드를 지원하는 것이다.

 또한 동작 클럭도 이전 세대에서는 2.4GHz가 가장 빠른 제품 이었지만, Xeon E7 v2 시리즈의 15 코어 제품은 2.8GHz로 업그레이드 하고 있다. 제조 공정이 진화했는데 그만큼 높은 클럭하지 않은게 생각되지만, 코어 수를 떨어 뜨려 동작 클럭을 중시한 제품으로, 3.2GHz (10 코어, TDP155W)도 준비되어 있다.

 

이전 세대의 E7과 Xeon E7 v2 시리즈의 차이. 코어 수, 메모리 용량, 라스트 레벨 캐시 (LLC) 용량 등 다양한 부분에서 기능이 올라가 있다

 

 

PCI Express 인터페이스를 내장하여 최대 15 코어 / 30 스레드를 실현한다.

 

 

 

Xeon E7 v2 시리즈는 이전 세대에 비해 2 배의 성능을 실현하고있다

 

 

8 소켓에서 최대 12TB의 메모리 용량을 실현. 이전 세대에 비해 3배의 메모리 용량이다


 또한 Xeon E7 v2 시리즈에는 8 소켓 서버가 구성 될수 있는 8800 v2 시리즈, 4 소켓 서버를 구성 할 수 있는 4800 v2 시리즈, 2 소켓 서버로 구성 할 수 있는 2800 v2 시리즈의 3 종류가 준비되어 있다.

 이 시리즈의 차이점은 프로세서 사이를 연결하는 QPI (Quick Path Interconnect)의 수이다. 2 소켓의 경우 QPI는 2 개에 여도 좋지만, 4 소켓의 경우는 3 개가 된다. 8 소켓의 경우, 소켓 당 QPI가 3 개가 되지만 중첩 구조로 연결하여 8 소켓을 지원하고 있다. 즉이 경우 모든 프로세서가 1 도약으로 연결은 되지 않고 일부 프로세서와의 통신 사이에 다른 프로세서를 끼우는 것이다 (2 도약). 따라서 성능으로 단점이 된다.

 단, 8 소켓 용 프로세서 모두 1 도약으로 구성 할 수 있도록 하려면 프로세서 당 QPI가 7 개 필요하게 된다. QPI의 갯수가 많아지면 프로세서의 핀이 너무 많아져 과연 현실적인 프로세서가 아니게 되므로 이러한 구성으로 한 것이다.

 또한 Xeon E7 v2 시리즈 8 소켓 이상의 서버를 구성하는 경우에는 타사에서 개발한 노드 컨트롤러를 이용하게 된다. 노드 컨트롤러를 이용하는 경우는 2 소켓을 1 노드로 관리하고 확장해 나가는 것이 되지만, 어디까지 늘릴 수 있을까는 노드 컨트롤러의 스펙에 따르는 것이다.

 

2 소켓, 4 소켓, 8 소켓 버전이 포함되어있다. 타사 노드 콘롤러를 사용하는 것으로, 2 소켓을 1 노드로 8 소켓 이상의 서버를 구성 가능

 

 

 

제품 라인 업. 4 소켓 Xeon E7-4800 v2 시리즈가 가장 파생제품이 준비되어 있다. 이 외에도 특정 목적에 최적화 된 프로세서도 준비된다

 


 또한 이전 세대의 Xeon E7은 PCI Express (PCIe) 등의 인터페이스는 I / O 허브칩을 통했기 때문에 더 QPI가 1개 필요했다. 그러나 Xeon E7 v2 시리즈는 동일한 Ivy Bridge 세대의 Xeon E5 (이하, Xeon E5 v2 시리즈) 와 같이 프로세서 내부에 PCIe 인터페이스를 내장했기 때문에 QPI의 개수를 1개 감소시킬 수 있었다. 또한 PCIe도 3.0에 대응 해, 1 소켓 당 32 레인까지 지원하고 있다. 덧붙여서 Xeon E7 v2 시리즈는 QPI도 버전 1.1로 성능도 8GT / s로 올라 있다.

 

 

 

PCIe는 Gen3를 32 레인 지원

 

 

I / O는 이전 세대에서 최대 4 배의 성능 향상을 달성

 

 

QPI는 버전 1.1가 되어, 최고 속도는 8GT / s로 향상되었다

 

 

CPU 코어는 Ivy Bridge 세대의 Xeon E5와 거의 동일


 Xeon E7 v2 시리즈의 CPU 코어의 기능에 관해서는 Xeon E5 v2 시리즈와 거의 다르지 않다. AVX의 Float 지원, IPC 성능을 향상시킬 튠업, Intel 보안 키 Intel OS 가드 기능 추가 등이 Xeon E5 v2 세대와 마찬가지로 이루어져 있다.

 코어 수는 Xeon E5 v2 시리즈가 최대 12 코어였던 반면, Xeon E7 v2 시리즈는 최대 15 코어가 된다. Xeon은 모듈식 설계를 채택하고 있기 때문에 비용을 무시 하면 더 코어를 많이 집어 수 있을 것이다. 그러나 프로세서의 다이 크기 등을 감안하면 그렇게 코어 수를 늘려 버리면, 다이 자체가 커지고 가격이 너무 높아. 이 부분은, 가격 및 다이 크기의 균형과 같은 것 일까? 향후 제조 공정이 미세화 해 가면 더 CPU 코어가 증가 할 가능성도 있는 것은 아닐까?

 또한 CPU 코어는 Xeon E5 v2 시리즈와 같이 3 중 루프에 의해 연결되어 있다. 그리하여 CPU 코어끼리의 액세스 지연이 줄어들고 있다.

 또, 이것도 Xeon E5 v2 시리즈와 마찬가지로 공유 LLC가 준비되어 있다. CPU 코어 당 2.5MB 탑재되고 있으므로, 15 코어에서 최대 37.5MB 공유 LLC를 탑재하게 된다.

 

Xeon E7 v2 시리즈는 Xeon E5 v2 시리즈와 같이 3 중 루프에 의해 CPU 코어가 연결되어 있다. 다른 것은 최대 코어수로 E5v2는 12 코어, E7v2는 15 코어

 

 

CPU 코어는 Xeon E5 v2 시리즈와 같은 코어가 된다. AVX 기능 강화, IPC의 성능 향상, Intel 보안 키, OS 가드 등의 기능도 탑재되어 있다

 

 

공유 LLC는 최대 37.5MB가 된다. 이것은 CPU 코어당 2.5MB의 LLC 슬라이스 × 15로되기 때문이다


 가상화 관련에서 APIC (Advanced Programmable Interrupt Controller) 가상화 APICv를 지원하고 있다. 이를 통해 가상 환경에서 가상 머신에서 인터럽트를 APICv 가상화 해 처리 할 수​​ 있도록 되었기 때문에, 실제로 VM Exit를 필요로 하는 인터럽트가 갈수록 하이퍼 바이저 전체의 성능이 올라간다.

 I / O 가상화 VTd도 대역폭을 향상함으로써 가상 환경에서 성능이 향상하고 있다.

 

APICv 지원, VTd의 성능 향상을 한다

 

 

메모리 관련 기능을 강화


 Xeon E7 v2 시리즈는 새로운 스케러블 메모리 인터커넥트 (SMI)이 채용되었다. 4 개의 SMI가 준비되어 1 개의 SMI에 전용 메모리 확장 버퍼가 연결된다. 1 개의 메모리 확장 버퍼에는 2 개의 메모리 채널이 준비되어 1 개의 메모리 채널당 최대 3 개의 DIMM을 전달한다. 이렇게 해서 1 프로세서에서 최대 24 개의 DIMM을 지원하고 있다.

 메모리는 최대 DDR3 1600MHz를 지원하고 있지만, 1 개의 메모리 채널에 3개 연결하면 1066MHz까지 빠진다 (LRDIMM = Load-reduced dual-inline memory module을 사용하여 1333MHz로 움직이게 할 수있다 ).

 동작 모드는 락 스텝, 퍼포먼스 두 가지 모드를 가지고 있다. 성능 모드는 SMI의 속도를 2667MHz (소수점 반올림이 있기 때문에 마지막 자릿수가 6보다는 7이있다)로 향상 심지어 DDR3 1333MHz 메모리를 듀얼 채널로 움직인다. 이는 대역이 넓은 메모리 액세스가 가능하게 된다.

 록 스텝 모드는 메모리를 싱글 채널로 작동시키는 것으로, 메모리 자체는 DDR3 1600MHz에서 동작하지만, 싱글 채널에 대한 SMI 속도는 1600MHz로 유지된다.

 Intel에서는 성능 모드를 1600MHz의 2 배 3200MHz에서 움직이려고 생각하고 있었지만, 실제로 칩의 검증을 해 보면, 안정적으로 동작하는 것이 1333MHz의 2 배 2667MHz되어 버린 것이다.

 메모리 성능을 취하는데 성능 모드를 선택이 권장된다. (BIOS 기본 성능 모드).

 실제로 Xeon E7 v2 시리즈는 채널당 3 개의 DIMM을 사용하는 것은 별로 없을 것이다. 퍼포먼스 모드, 락 스텝 모드를 모두 생각하면 채널당 2 개의 DIMM 하는 것이 일반적지도 모른다. 메모리 성능을 약간 희생해서 대용량화 하고 싶을 때 3개의 DIMM을 사용하게 된다.

 이 부분은 서버를 설계하는 서버 벤더의 개념에 의해 구성이 다르다는 것이다.

 

메모리는 메모리 확장 버퍼를 통해 연결된다. 메모리 확장 버퍼에는 2 개의 메모리 채널이 포함되어 있다

 

 

메모리는 록 스텝 모드와 성능 모드 두 가지를 지원

 

 

락 스텝, 퍼포먼스 두 모드가 있기 때문에 다양한 메모리 구현 바리에이션을 가진다

 

 

메모리 대역폭으로 성능 모드의 경우 이전 세대의 Xeon E7보다 30% 성능이 올라간다

 

 

RAS 기능을 향상시키는 Intel Run Sure 기술


 Intel Run Sure 테크놀러지는 이전 Xeon E7에 탑재된 RAS (Reliability, Availability, Serviceability : 신뢰성, 가용성, 서비스 성) 기능을 강화하고 더 높은 수준으로 한 것이다.

 이 기능은 하드웨어에 문제가 발생하는 경우 OS와 연계하는 등 시스템을 다운시키지 않는 구조 완성. 엔터프라이즈 용도로도 높은 신뢰성과 동작을 가진 시스템을 구성 할 수 있다.

 구체적으로는 첫째, 기존의 Xeon E7에 탑재된 MCA 기능이 강화되고 있다. 강화된 MCA Gen1에서 시스템 진단기능, 장애 예측 진단 기능이 개선돼 시스템 펌웨어와 OS에 자세한 오류 로그 데이터를 제공한다. 또한 MCA 리커버리 엑서큐션 버스에서 문제가 일어났을 때 복구하기 위한 시스템 업 시간을 개선하도록 했다.

 또한 MCA I / O는 I / O 오류 등에 대한 정보를 OS에 제공하여 적절한 처리를 할 수 있도록 하고 있다. 내장 된 PCIe 인터페이스에 대해서도 PCIe 라이브 오류 복구 기능이되었다.

 메모리 RAS 기능으로는 SDDC (Single Device Data Correction) +1과 DDDC (Double Device Data Correction) +1  2개의 모드가 준비되었다.

 SDDC +1은 오류가 발생한 DRAM 소자 하나만 맵 아웃 이후 1 비트 오류를​​ 정정 가능하게했다. 그러나 DRAM 소자 2 개에 장애가 발생했을 때 문제를 해결 할 수 없다.

 그래서 DDDC +1은 2 개의 DRAM 소자가 실패해도 맵 아웃 이후 1 비트 에러를​​ 정정 가능하게 한다. 이렇게 하면 가용성을 더 높일 수 있게된다.(DDDC +1은 메모리 락 스텝 모드에서만 대응).

 

새로운 RAS 기능의 IntelRun Sure 기술은 Xeon E7 v2 시리즈에 탑재된 각종의 RAS 기능을 총칭하는 것이다

 

메모리 RAS 기능. SDDC +1, DDDC +1 지원한다. DDDC +1의 가용성을 이용하기 위하여는 록 스텝 모드로 동작시킬 필요가 있다

 

 

어떤 시스템에서 사용되는가?


 Xeon E7 v2 시리즈는 가상 머신을 다수 움직이는 프라이빗 클라우드나 퍼블릭 클라우드 또는 ERP 시스템과 데이터웨어 하우스 (DWH) 등의 이용이 예상되고 있다. Intel은 기업의 핵심 시스템을 운영하기에 충분한 신뢰성, 가용성, 서비스 성을 가진 서버로 Xeon E7 v2 시리즈 탑재 제품을 추천하고 싶다고 생각하고 있는 것 같다.

 서버 벤더 중에서도 HP는 x86 기반 NonStop 서버 제공을 이미 발표하고 있으며, x86 기반 고 신뢰 서버를 제공하는 Project Odyssey를 계획하고 있기 때문에 이번에 발표된 Xeon E7 v2 시리즈를 전면적 채용한 서버가 머지 않아 출시 될 것이다. 그러나 Xeon E7 v2 시리즈를 사용한 서버를 제품화하는 서버 벤더는 아마 전 세계 10개 사도 안되는 것은 아닐까?

 그것은 역시 제품 가격이 고가이기 때문이다.

 Xeon E7 v2 시리즈는 2.8GHz 동작, 15 코어, 8 소켓 대응의 Xeon E7-8890 v2에서 6841 달러 (1 달러 100 엔 환산으로 68 만 4100 엔)로, (CPU) 단독으로도 비싼 프로세서라고 할 수 있다. 덧붙여서, 같은 기간 시스템에서 이용되는 IPF 프로세서 Itanium 9500 (개발 코드명 : Poulson)가 2.53GHz의 Itanium 9560에서 37 만 1780 엔 이었다는 것을 감안하면 2배 정도의 가격이다.

 4 소켓용 Xeon E7-4890 v2 (2.8GHz, 15 코어)에서도 6619 달러 (약 66 만 1900 엔)으로 고액 이것은 2 소켓의 경우에도 크게 다르지 않으며 최상위 프로세서는 대부분 유사한 가격대 이다. 가장 싼 것이라도, 6 코어, 1.9GHz, 4 소켓 지원 Xeon E7-4809 v2에서 1223 달러 (약 12 만 2300 엔)이다.

 이러한 프로세서의 가격에서 생각하면, 8 소켓 서버에 8 개의 프로세서를 탑재한 경우, 가격은 1000 만엔을 넘는 고가의 것이 된다고 생각된다.

 그럼에도 불구하고 전력 비용과 관리 비용을 감안할 때, Xeon E5 v2 시리즈를 사용한 2소켓 서버를 몇 대나 늘어놓기 보다는 TCO가 싸게 될지도 모르고 Intel Run Sure 기술을 통해 가용성이 강회되는 것을 (높게)평가 할 수도 있는 것이다.

 결국 서버 제품이 출시되지 않으면 모르는 면도 많기 때문에 이 단계에서는 뭐라고 말할 수 없고, 기업 시스템 담당자에게 선택 사항의 증가는 환영할 일 같은 것이 아닐까?

 


 향후 서버 벤더의 동향에 계속 주목해 나가고 싶다.

 

HPC 및 ERP, CRM, 데이터웨어 하우스 / 데이터 마트 등 기업의 핵심 시스템에서 이용되는 서버의 프로세서로 사용

 

 

Xeon E7 v2 시리즈의 가격표. 15 코어의 최상위 제품은 약 70 만엔으로 매우 고가이다

 

 

 

[제품정보] NEC, 최신 Xeon과 독자 RAS기술의 기간 IA서버 NX7700x 발매

 

 

[분석정보] Intel, Ivy Bridge-EX Xeon E7 v2 패밀리.최대 15코어 CPU 메모리 용량은 최대 1.5TB

 

 

[제품정보] Supermicro 메모리 96개 탑재 가능한 Xeon E7-8800 v2 지원 시스템

 

 

[분석정보] 부드러운 데이터 센터를 만드는 Intel의 Software Defined Infrastructure

 

 

[분석정보] Intel이 ISSCC에서 15 코어 Ivytown과 Haswell의 FIVR 기술 등을 발표

 

 

[분석정보] 전환기를 맞이한 2014년 인텔의 서버 프로세서

 

 

[분석정보] 서버용으로 튠업 된 새로운 Atom C2000 시리즈

 

 

[분석정보] IDF13 San Francisco에서 보는 2014년의 서버용 프로세서

 

 

[분석정보] 가상화 시대의 네트워크? IDF 2009에서 해독