벤치리뷰·뉴스·정보/아키텍처·정보분석

[분석정보] 4만 8000개의 제온파이로 중국 톈허2 세계에서 가장 빠른 슈퍼 컴퓨터

tware 2013. 6. 19. 00:00

 

 

2013년 6월 16일 (중앙 유럽 표준시), 독일의 작센 주 라이프 치히에서 슈퍼 컴퓨터에 관한 국제 회의 " International Supercomputing Conference 2013 "(이하 ISC13)가 개최되었다. 이 이벤트에 맞춰 세계적인 슈퍼 컴퓨터 성능 순위인 'TOP500 List'가 업데이트되어 Intel 아키텍처를 채용한 중국 방위 대학교의 슈퍼 컴퓨터 '톈허 2 "(Tianhe-2, 영명 Milky Way 2)가 세계에서 가장 빠른 슈퍼 컴퓨터의 영관을 획득했다.

자신의 제품을 채용한 슈퍼 컴퓨터가 세계 1위를 획득한 Intel은 조속히 보도 자료를 발표하여 HPC (High Performance Computing) 분야에서 Intel 아키텍처의 장점을 어필하고있다. 이번에 Intel이 공개한 천하2와 사용된 Intel 제 프로세서에 대해 정리해 보자.


Xeon × 3만 2000기와 Xeon Phi × 4만 8000기로
구성된 세계에서 가장 빠른 슈퍼 컴퓨터 톈허 2


Intel이 ISC13에 맞추어 발표한 내용은 크게 세가지 주제가 있었다. 첫 번째는 Intel 아키텍처를 채용한 천하 2가 TOP500 List에서 1위를 차지했다. 두 번째는 HPC 분야 전용 프로세서 'Xeon Phi "시리즈에 신제품이 등장했다. 그리고 세 번째는 후술하는 Xeon Phi 시리즈의 미래 제품이다. 순서대로 설명하겠다.

 

 

2011 년에 촬영된 선대 "천하 1"의 일부

 

천하 "2" 모두 아는 대로 동 기종은 선대에 해당하는 '천하 제1호 A "(Tianhe-1A. 다음, 천하 1)이라는 슈퍼 컴퓨터가 존재한다. 2010 년 TOP500 List에서 세계 최고 자리를 얻었던 시스템이다.
이 천하 1은 2011년에 현지 리포트를 게재한 적이 있지만, Intel의 Xeon 프로세서에 NVIDIA의 GPU "Tesla"탑재 보드를 결합한 이기종 구성 (이종 아키텍처 혼합 구성)의 슈퍼 컴퓨터였다

 

반면 천하 2는 NVIDIA의 Tesla는 사용하지 않고, "올 Intel 아키텍처"로 구성된 슈퍼 컴퓨터가 된 것이 큰 차이이다. TOP500 List 정보에 따르면, 천하 2가 채용한 것은 2013년 후반에 정식 발표 될 것으로 알려져있는 "Xeon E5-2600 v2"시리즈의 "Xeon E5-2692 '가 3만 2000개, 4만 8000개 "Xeon Phi 31S1P"이라고한다.

 

 

TOP500에서 넘버 1이 된 천하 2. Xeon E5-2600 v2 3만 2000개와 Xeon Phi를 4만 8000 개로 구성된 이라고 쓰여져 있다

 

 

Xeon Phi 시리즈는 이 문서에서 소개하고 있지만, x86 아키텍처 기반 CPU 코어를 수십개, "Xeon Phi 5110P"의 경우 60개나 집적한 수치 연산 가속기이다. 근원을 바로 잡으면 일단 "Larrabee"(라라비, 개발 코드 명)라고 개발이 진행되면서 결국 제품화를 포기했다. GPU 기술을 HPC 분야 전용 제품으로 전용한 것이다.
그러나 천하 2에 채용되고 있는 Xeon Phi 31S1P은 아직 출시되지 않은 제품으로, 그 상세한 사양은 공개되지 않았다.

한편, Xeon E5-2600 v2 시리즈는 3세대 Core 프로세서를 기반으로, 개발 코드 네임 "Ivy Bridge-EP '라는 서버용 CPU이다. 이것은 또한 현재 출시되지 않은 제품으로, 8 코어, 10 코어, 12 코어 제품이 라인업 되는 소문이 있었다. TOP500 List에 따르면, 천하 2에 채용된 Xeon E5-2692는 12의 CPU 코어를 내장하고 동작 클럭은 2.2GHz 인 것 같다.

TOP500 List에서 공개된 천하 2의 데이터에 따르면 전체 시스템에서 사용되는 CPU 코어의 수는 312 만개에 달한다. 그러면 Xeon 및 Xeon Phi 내역은 어떻게되어 있는 것일까. 쉽게 계산해 보자.

먼저 12코어 Xeon E5-2692이 3만 2000개 이니까, CPU 코어 수는 38만 4000 기가 된다. 이것은 숫자가 나와 있으므로 확실하다.
Xeon Phi 31S1P에 탑재되는 CPU 코어 수는 불명하지만, 57 기라고 하는 소문이 있는데다, 후술하는 새로운 "Xeon Phi 3100"시리즈 인 'Xeon Phi 3120A "와"Xeon Phi 3120P "가 모두 CPU 코어를 57 기 탑재하고 있다. 따라서 Xeon Phi 31S1P도 57 기라고 가정하여 계산하면 (제온파이가)4만 8000개로 (코어는) 273 만 6000 기가 되어, Xeon 측과 합산하면 312만 기인(코어) 셈이다.


Xeon Phi 31S1P의 코어 수가 57 개로 맞는지는 모르겠지만, 어쨌든 x86 코어가 300 만기 이상 사용되고 있는 무서운 슈퍼 컴퓨터가 천하 2라고 할 수 있다.

천하 2 이론 피크 성능은 54.9PFLOPS (페타 플롭 약 5만 4900TFLOPS)에 이른다고 한다. 그리고 TOP500 List의 공식 벤치 마크인 "LINPACK"(린팩)을 측정 한 결과, 33.86PFLOPS (약 3 만 3860TFLOPS)을 실현했다고 되어 있다. 이론 대비 성능은 현재 세계 4위의 일본제 슈퍼 컴퓨터 '케이'(11.28PFLOPS)의 실로 5배나 된다. 그러나 교토는 LINPACK에서 이론 성능의 93 %라는 경이적인 높은 실효 성능을 달성하고 있으므로, LINPACK 성능 비교에서 3 배 정도였다 라고도 한다.

또한 천하 2는 성능뿐만 아니라 전력 효율의 높이도 구가하고 있다. 전력 소모는 공칭 17.8MW 것. 참고로 경(K)은 공칭 약 15MW 이기 때문에, 분명히 전력 효율도 높다고 할 수 있겠다.

Intel은 이번 발표에서 "Top 500 List에 나와있는 80% 이상의 슈퍼 컴퓨터가 Intel 아키텍처를 채용하고 있다"고 말하는 등, Intel 아키텍처가 슈퍼 컴퓨터의 세계에서도 압도적 우위에 있다고 어필하고 있다.


특히 Xeon Phi와 직접 경쟁하는 GPU와 비교는 TOP500 List에 게재된 LINPACK 점수 "Rmax"값을 Xeon Phi와 GPU 각각 합계한 값이라는 의미가 있는지 없는지 모르겠지만  숫자를 들어, 모든 GPU의 총합계 (total Rmax)보다 Xeon Phi 총합계가 더 크다고 말하고 있을 정도다. 상당히 이번 TOP500 List에서 이긴 것이 기쁜 것이다. (이걸 다르게 말하면 엔비디아 GPU + AMD GPU 보다 제온 파이를 더 많이 팔았다는 그런식의 얘기, 실제 정확한 갯수야 알수 없지만.. 어쨌든 크게 뒤지지 않게 팔았거나, 더 많이 팔아야 가능한 얘기. 시스템 수로는 뒤지지만.. 한대한대에 더 많이 팔았다 그런식의 얘기.)

 

 

 

TOP500 List의 81%가 Intel 아키텍처, 새로 순위에 들어간 슈퍼 컴퓨터의 98 %가 Intel 아키텍처라는 슬라이드. 요점은 "우리의 아키텍처 쪽이 굉장해"라는 얘기다

 

(참고로 이번 슈퍼컴퓨터 순위 100위권 안의 Nvidia를 쓴 슈퍼컴퓨터는 15대, 인텔 Phi를 쓴 컴퓨터는 7대 입니다.대수는 절반이지만 나온지 얼마 안된 Phi의 점유 속도가 무서운 것이죠.)

 

차세대 Xeon Phi는 14nm 공정 등
최첨단 기술이 풍성에

첫머리에서 말한 두 번째 주제는 Xeon Phi 새롭게 3 시리즈 5 제품이 추가되는 정보다.

먼저 하이 엔드 "Xeon Phi 7100"시리즈로 PCI Express 확장 카드 타입의 "Xeon Phi 7120P"와 "Xeon Phi 7120X '가 발표 되었다. 모두 CPU 코어 61개를 집적하여 동작 클럭은 1.23GHz. 카드는 16GB의 메모리를 탑재한다. 기존의 "Xeon Phi 5100 '시리즈는 메모리가 8GB 이었으므로, 메모리는 두배있는 셈이다.

차기 Xeon Phi 3100 시리즈는 앞서 말한 Xeon Phi 3120P 및 Xeon Phi 3120A가 라인업된다. 모두 2012년 11월에 열린 'Supercomputing Conference 2012 "※ 에서 존재가 밝혀졌던 제품으로 간신히 정식으로 출시된 것 같다. 앞서 말한 CPU 코어 수는 57 개로 동작 클럭은 1.1GHz. 배정밀도 연산 성능은 1.1TFLOPS 된다고 한다.
※ International Supercomputing Conference과는 다른 이벤트.

흥미로운 것은 제 3의 "Xeon Phi 5100"시리즈이다. 고밀도 서버용 제품으로 하며 Xeon Phi 7100이나 3100와 같은 PCI Express 확장 카드가 아닌 소켓 탑재식이 된다고 한다. "Xeon Phi 5120D '라는 제품이 2013년 말에 출시된다고 하는데, 지금 스펙은 불분명 하다.

 

 

 

 

Xeon Phi에 Xeon Phi 7100 시리즈와 Xeon Phi 3100 시리즈, Xeon Phi 5100 시리즈 3 시리즈 5 제품이 더해졌다.

 

 

세 번째 항목이 차세대 Xeon Phi가 되는 개발 코드 네임 "Knights Landing"(나이츠 랜딩)에 대해 조금 뿐이지만 매우 흥미로운 정보가 공개된 것이다.

우선 중요한 것은 Knights Landing은 보조 프로세서뿐만 아니라 독립적인 CPU로 사용할 수 있는 제품으로 공급된다는 점이다.
Intel은 현재 Xeon Phi 같은 PCI Express 카드는 호스트 CPU와의 데이터 전송 대역이 제한되어 성능 향상이 저해되는 데다 프로그램을 복잡하게 하는 요인이 되고 있다고 말하고 있다. 그래서 독립적인 CPU로 사용할 Xeon Phi를 제공함으로써 현재 제품이 안고있는 이러한 문제를 해결 하자는 셈이다. 즉, Knights Landing에서는 "보조 프로세서 '가 아닌 Xeon Phi가 등장한다는 것이다.

 

또한 Knights Landing에서는 메모리 대역을 확대하기 위하여 "온 패키지의 메모리"가 탑재된다고 한다. 자세한 것은 불명이지만, 어쩌면 제 4세대 Core 프로세서 통합 그래픽 기능 "Intel Iris Pro Graphics 5200"(GT3e)에서 채용되고 있는 eDRAM과 같은 형태가 될지도 모른다.

그리고 Knights Landing에서는 14nm 공정이 사용된다고 한다. 이것은 Intel이 2014 년 이후의 CPU에 도입할 예정 공정 기술이기 때문에, 즉 Knights Landing가 등장하는 것은 2014년 이후가 된다.

이 문서에서 보고된 대로, NVIDIA는 ISC13에서 ARM 아키텍처의 대응을 향해 크게 내딛고 있다. 그에 대해 Intel은 Xeon Phi를 필두로 x86 아키텍처의 이점을 호소하는 구도가되었다. Intel은 천하 2라는 강력한 실적을 내건 어필만큼 설득력이 있다. HPC 세계에서 NVIDIA가 Intel에 어떻게 대응해 나갈지 향후에도 볼거리가 많은 것 같다.

 

 

차세대 Xeon Phi이되는 Knights Landing에 포함되는 세 가지 기술 요소. 최신 기술이 풍성, 같은 느낌이 될 것 같다

 

 

Intel_ISC13_keynote_by_Raj_Hazra.pdf

 

 

[제품정보] Intel 차세대 Xeon Phi Knights Landing

 

 

[분석정보] TOP500 슈퍼컴퓨터 순위 2013년 6월

 

 

[분석정보] TOP500 슈퍼컴퓨터 순위 2013년 11월

 

[제품뉴스] Intel Xeon Phi 새로운 폼 팩터 채용 포함 5모델 추가

 

 

[정보분석] 인텔 60코어 매니코어 "Xeon Phi" 정식발표

 

 

[분석정보] 인텔 슈퍼컴퓨터용 가속기 Xeon Phi 5110P 발표

 

 

[분석정보] Intel, HPC 전용 보조 프로세서 Xeon Phi 2013년 1월부터 일반용으로 출시

 

 

[분석정보] 메모리 기술 혁신이 컴퓨터 아키텍처의 변혁도 이끈다 Intel의 Rattner CTO가 보는 미

 

 

[분석정보] IDF 2012에서 주목한 한가지, 매니 코어 "Knights Corner"

 

 

[정보분석] 엔비디아 세계 최다 트렌지스터 칩 GK 110 공개

 

 

[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 1/2부

 

 

[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 2/2부

 

 

[정보분석] 같은 무렵에 시작된 Nehalem과 Larrabee와 Atom

 

 

[분석정보] Intel은 Larrabee 계획과 아키텍처를 어떻게 바꾸나?

 

 

[분석정보] 다시 처음부터 시작된 라라비 무엇이 문제였나?

 

 

[분석정보] 라라비 (Larrabee)의 비장의 카드 공유 가상 메모리

 

 

[분석정보] 인텔의 스칼라 CPU + 라라비의 이기종 CPU 비전

 

 

[분석정보] Larrabee는 SIMD와 MIMD의 균형 - Intel CTO가 말한다.

 

 

[정보분석](암달의 법칙) 2010년대 100 코어 CPU 시대를 향해서 달리는 CPU 제조사

 

 

[분석정보] 인텔 GDC에서 라라비 명령 세트의 개요를 공개

 

 

[분석정보] GDC 2009 드디어 소프트 개발자 정보도 나온 "Larrabee"

 

 

[분석정보] 그래픽 및 DirectX 로드맵을 정리

 

 

[정보분석] Intel 힐스보로가 개발하는 CPU 아키텍처의 방향성

 

 

[분석정보] SSE와는 근본적으로 다른 Larrabee의 벡터 프로세서

 

 

 

[정보분석] 팀스위니 미래의 게임 개발 기술. 소프트웨어 렌더링으로 회귀

 

 

[분석정보] 정식 발표된 라라비(Larrabee) 아키텍처

 

 

[아키텍처] 베일을 벗은 인텔 CPU & GPU 하이브리드 라라비(Larrabee)

 

 

[정보분석] 암달의 법칙(Amdahl's law)을 둘러싼 Intel과 AMD의 싸움

 

 

[정보분석] 모든 CPU는 멀티 스레드로, 명확하게 된 CPU의 방향

 

 

[분석정보] 인텔 HPC 시스템 Scalable System Framework 소개

 

 
Intel_ISC13_keynote_by_Raj_Hazra.pdf
1.93MB