벤치리뷰·뉴스·정보/아키텍처·정보분석

[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 1/2부

tware 2011. 9. 24. 12:30

 

 

[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 2/2부

 

 

 

 

Intel의 CPU의 미래 방향성을 확실히했다 Rattner 씨

 

"2 코어에서 4 코어가 태어나고, 4 코어에서 8 코어가 태어나 지금 우리는 매니 코어 시대의 시작에 있다. 더욱 더 많은 코어를 제공한다."

미국 샌프란시스코에서 개최 된 Intel 개발자 컨퍼런스 "Intel Developer Forum (IDF)"의 기조 연설에서 회사의 연구부서를 이끄는 Justin Rattner (져스틴 · 래트너) 씨 (VP, Director, Intel Labs,Intel)는 매니코어 시대의 도래를 선언했다.

래트너 씨는 연설 서두에서 2006 년부터 시작된 Intel의 멀티 코어 화의 흐름을 설명. 전력 효율을 높이기 위해 CPU가 급속히 코어 수를 늘려왔다고 지난 5 년간을 회상했다. 그리고, 처음처럼, 드디어 수십 개 코어를 원칩에 실은 매니 코어 시대로 돌입하는 것을 말했다.

 

 

 

5년 전은 듀얼 코어

 

 

10코어 시대의 도래(서버쪽 CPU 얘기라서 데스크탑하고는 관계가 없습니다)

 

 

Rattner 씨는 이번 기조 연설에서 Intel 프로세서의 큰 흐름을 알렸다. 소형 CPU 코어를 모은 매니코어로 향하는 고성능(연산)지향 전용 CPU와 CPU와 GPU의 통합으로 향하는 클라이언트(PC,노트북)용 CPU의 흐름을 설명. 각각 기존의 CPU 코어보다 효율적으로 높은 컴퓨팅 성능을 발휘할 수있는 것을 보여 주었다.

Rattner 씨는 고성능 컴퓨팅 (HPC)에서 높은 성능을 필요로하는 고객의 예로 "CERN (유럽 원자핵 연구기구)"세계 최대의 입자 가속기 'LHC (Large Hadron Collider) "를 소개. 또한, 매니 코어의 용도는 HPC에 한정되지 않는다고 설명보다 다양한 프로그램이 매니 코어를 취급 할 수 있도록 하기 위한 도구와 컴파일러도 언급했다.

한편, 클라이언트 CPU는 Sandy Bridge(샌디 브릿지)의 CPU 코어의 높은 연산 성능은 부하가 높아 일반적으로 전용 시스템을 필요로하는 4G LTE 무선 기지국의 실시간 처리를 CPU만으로 행할 수 있는 것을 소개 . 또한 얼굴 인식 보안 시스템을 Sandy Bridge의 GPU 코어를 사용하여 고속 처리하는 응용 프로그램도 제시했다.

또한 Rattner 씨는 2018 년 이후의 Exa (엑사) FLOPS 슈퍼 컴퓨터는 매우 높은 전력 효율이 필요한 것을 지적. 따라서 요소 기술로 CPU를 초 저전압 구동시키는 "아 임계 전압 (Near-Threshold Voltage)" 기술과 전력 소비를 늘리지 않고 초 광대역 메모리를 실현할 수 있는 "Hybrid Memory Cube"기술  데모를 섞어 소개했다. 정리하면, Rattner 씨는 향후 Intel의 매니 코어 화하는 CPU의 방향성을 제시, 필요한 기술 개발이 순조롭게 진행되고있는 것을 증명했다.

 

 

CERN에서 이용

 

 

LTE 무선 기지국에서 처리

 

 

다양한 기술의 방향성

 

 

 

 

매니 코어 프로그래밍 모델을 강조

 

 


Intel은 현재 고성능 컴퓨팅 (HPC) 시장에 소프트웨어 개발 플랫폼으로 "Knights Ferry (나이츠 페리 = 32나노 MIC)"라는 32 코어의 매니 코어 CPU를 일부 연구자에 제공하고있다. Rattner 씨가 보여준 위쪽의 슬라이드가 Knights Ferry로 칩 자체의 코드 네임은 "Aubrey Isle"이다. 아키텍처 자체를, Intel은 "MIC (Many Integrated Core : 제온 파이)"라고 부르고 있다. MIC는 XEON계 등 일반적인 Intel CPU와 함께 이기종 구성에서 사용하는 것을 전제로 한 코프로세서이다.

Rattner 씨는 연설에서, Knights Ferry의 경험을 살려, 다음 버전의 MIC 아키텍처 CPU를 정식 제품으로 출시한다고 밝혔다. 22nm 프로세스로 50 코어 이상을 집적하는 "Knights Corner (나이츠 코너)"가 첫 제품 버전 매니 코어가된다. 당연히 Knights Corner의 발표 자체는 이미 진행되고 있기 때문에 IDF에서 발표는 재확인에 지나지 않는다.

MIC 소개에서 Rattner 씨는 Intel의 이기종 (Heterogeneous : 이종 혼합) 컴퓨팅이 타사의 방식과는 본질적으로 다른 것을 강조했다. "업체 중에는 GPU와 같은 특정 애플리케이션 프로세서 작업의 일부를 수행한다"(Rattner 씨) 그러나 Intel의 "Knights 제품군과 MIC 아키텍처는 기본적으로 매우 일관된 프로그래밍 모델을 제공한다. 예를 들어, Xeon 등의 프로그래밍에 익숙하다면, 아주 쉽게 MIC 코어를 프로그램 할 수있을 것 "이라고 말한다.

MIC 아키텍처를 쉽게 프로그래밍 할 수있는 이유는 Larrabee (라라비) 명령어 세트 확장을 구현한 작은 IA (x86) CPU 코어를 집적 한 매니 코어이기 때문이다. Intel CPU의 프로그래밍에 익숙한 경우, 확장 명령만 대응하면 MIC를 프로그램 할 수있다. MIC는 성능 향상을 위해 각 코어가 512-bit 폭의 벡터 실행 파이프 라인을 갖추고있다 (Sandy Bridge의 AVX는 256-bit 폭). 아래는 Larrabee 때 벡터 파이프 라인이다. MIC에도 벡터 파이프의 기본 구조는 크게 다르지 않다고 볼 수있다.

 

 

 

초대 Larrabee는 긴 벡터 연산 유닛에 대해 일반적인 스칼라 연산 파이프는 2 명령어의 Pentium 파이프라인 이었다. Intel은 Larrabee의 후속 CPU는 스칼라 파이프를 Atom 계의 Silverthorne (실버손 : 아톰) 아키텍처로 대체 예정이었다. MIC도 기본 아이디어는 동일, 스칼라 파이프는 낮은 성능 구성이되고 있는 것으로 보인다. 이것은 Intel의 CPU 설계 경험의 토대인 "폴락의 법칙 (Pollack 's Rule)" 에서 CPU의 크기를 2배로 해도 정수계 연산 성능은 제곱근 정도 밖에 향상하지 않기 때문이다. 따라서 CPU 코어를 작게하는 것이 전력당 성능 효율이 향상된다. 매니 코어의 기본적인 발상은 코어를 작게하면서 벡터 연산 성능을 높이는 점에있어, 그 의미에서는 GPU 모두 공통점이있다.

 

 

폴락의 법칙 (Pollack 's Rule)

 

세계 최대의 입자 가속기의 데이터를 분석


MIC 아키텍처는 엄청난 연산을 필요로하는 응용 프로그램을 극적으로 가속화 할 수있다. Rattner 씨는 그러한 응용 프로그램의 예로 CERN의 (유럽원자핵 공동연구소) LHC 강 입자 가속기에서 실험 결과의 분석을 소개했다. IDF의 단상에 CERN의 openlab의 Andrezj Nowak 씨가 등장, LHC는 초당 4,000 만 번의 충돌이 발생, 그결과 매년 15 ~ 25PB (페타 바이트)의 데이터 분석을 할 필요가 있다고 설명했다 . 따라서 CERN에서는 25 만 Intel CPU 코어를 분산 된 노드에서 가동하고 있다고 한다.

컴퓨팅 집약적인 LHC의 분석에서 40 코어로 거의 40 배의 속도 향상을 얻을 수있다. 따라서 MIC 아키텍처 에서도 극적인 성능 향상이 기대된다. CERN의 Nowak 씨는 실제로 Knights Ferry에서 분석 응용 프로그램을 달리게 한 결과 Knights Ferry의 1 개의 MIC 코어 동작시와 32 개의 MIC 코어 동작시 성능이 극적으로 올라간다고 설명했다.

 

 

 

 

 

 

 

 

HPC에서 응용

 

당연히 HPC만 매니 코어의 대상이 아니다. Rattner 씨는 Intel이 Knights 제품군 전에도 다수의 매니코어 CPU의 시작해 왔다는 것을 회고했다. 그리고 매니 코어의 리서치를 통해 하드웨어 설계뿐만 아니라 소프트웨어 측면의 매니 코어의 성능 향상의 가능성을 찾았다 고. 그 위에, Rattner 씨는 "가장 중요한 것은, MIC 아키텍처 응용 프로그램 기술계와 HPC 애플리케이션에 한정 돼 있지 않은 것" 이라고 강조했다.

아래의 그래프는 응용 프로그램의 종류마다 CPU 코어 수에 따라 얼마나 성능이 향상되는지를 보여준다. Rattner 씨는 게임이나 비디오 말했다 일반 응용 프로그램을 포함하여 많은 소프트웨어가 64매니 코어에서 30 배 이상의 성능 향상을 얻을 수 있음을 보여 주었다.

 

 

 

 

CPU 코어 수에 따른 성능 향상

 

 

 

닌자 프로그래머가 필요없는 River Trail 기술


그렇다고는 해도, 매니 코어 프로그래밍의 장벽은 높아 폭 넓은 보급은 기대할 수 없다. 슈퍼 컴퓨터 수준의 방대한 병렬 코어의 프로그램은 매우 숙련 된 프로그래머만 가능하다는 이미지가 강하다.Rattner 씨는 그러한 프로그래머 '닌자 프로그래머 "라고 불렀다. 그 뒤에, 매니(MIC) 코어 프로그래밍은 닌자 프로그래머일 필요는 없다고 강조했다.

 

 

 

 

 

Rattner 씨가 쉽게 매니 코어 프로그래밍있는 예로 거론 한 것은 JavaScript에서 멀티 / 매니 코어 프로그래밍을 가능하게하는 프로젝트 "River Trail (리버 트레일)"이다. River Trail은 JavaScript를 병렬 프로그래밍 확장 오픈 소스 프로젝트이다. Rattner 씨의 키 노트 스피치에서 JavaScript를 낳은 부모 인 Brendan Eich 씨 (CTO Mozilla)가 등장. "JavaScript는 지금까지 순차 (프로그램)을 위한 유력한 언어 였지만, 우리는 이것을 멀티 코어 하드웨어의 기능을 최대한 살릴 것으로 하고 싶다고 생각하고 있다"고 말했다.


River Trail 자체는 JavaScript를 병렬 프로그래밍을위한 확장 된 사양으로, IDF 회장에서 연구원의 설명에 따르면, 일단 코드를 OpenCL의 중간 언어에 떨어 뜨린다. 따라서 하층의 하드웨어가 OpenCL 런타임을 지원하는 한, 스케일 업 할 수있다. IDF에서 시현에서는 Intel의 OpenCL SDK를 사용하여 CPU 코어의 SSE/AVX 명령어 세트를 사용했다.

Rattner 씨의 연설은 N 바디 물리 시뮬레이션을 River Trail 15 배 속도 데모를 공개했다. 표시도 Web 브라우저 기반의 3D 그래픽 확장 WebGL을 사용 고속화하고있다. 현재 River Trail을 스크립트 언어의 표준화를 행하는 ECMAscript에 제의하고 있다.

 

 

 

 

 

 

 

 

 

현재 구미에서는 Web 프로그래밍, 어플리케이션 프로그래머의 주류 스타일로 확산되고 있으며, Web 프로그래밍에서 입문 해 오는 새로운 프로그래머 계층도 늘고있다. 거기에 호응하여 HTML5와 WebGL 등 Web 브라우저 계층에서 프로그래밍을 풍부하게하는 사양이 점점 정비되고있다. Google이 발표하는 새로운 스크립트 언어로 소문이 있다 "Dart '도 이런 흐름에있는 것으로 보인다.


이 기류는 기본명령과 중간언어로의 변환 역할은 Web 브라우저로 집중되는 방향이다. 즉, Web 브라우저를 마치 범용 변환 레이어로 변신시켜 Web 브라우저가 하층의 하드웨어를 완전히 추상화 구조를 목표로 하고 있다. 이것이 완성되면 OS가 아닌 Web 브라우저 응용 프로그램 플랫폼이다.

따라서 Intel이 멀티 / 매니 코어 화를 추진하는 경우에는 Web 프로그래밍 세계에서 쉽게 다수의 CPU 코어를 사용할 수있게하는 방법이 필수적이다. Rattner 씨는 이번 그러한 흐름에 따른 연구에 Intel이 적극적으로 참여하고있는 것으로 나타났다. 그러나 이 프로젝트는 OpenCL로 처리되기 때문에 Intel 전용 만의 솔루션이 아닌 범용적인 솔루션이다.

 

 

채널인텔 제공 IDF 2011 Justin Rattner 기조연설 동영상

 

 

 

 

[분석정보] TOP500 슈퍼컴퓨터 순위 2013년 6월

 

 

[분석정보] 4만 8000개의 제온파이로 중국 톈허2 세계에서 가장 빠른 슈퍼 컴퓨터

 

 

[제품뉴스] Intel Xeon Phi 새로운 폼 팩터 채용 포함 5모델 추가

 

 

[정보분석] 인텔 60코어 매니코어 "Xeon Phi" 정식발표

 

 

[분석정보] 인텔 슈퍼컴퓨터용 가속기 Xeon Phi 5110P 발표

 

 

[분석정보] Intel, HPC 전용 보조 프로세서 Xeon Phi 2013년 1월부터 일반용으로 출시

 

 

[분석정보] 메모리 기술 혁신이 컴퓨터 아키텍처의 변혁도 이끈다 Intel의 Rattner CTO가 보는 미

 

 

[분석정보] IDF 2012에서 주목한 한가지, 매니 코어 "Knights Corner"

 

 

[정보분석] 엔비디아 세계 최다 트렌지스터 칩 GK 110 공개

 

 

[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 2/2부

 

[정보분석] 같은 무렵에 시작된 Nehalem과 Larrabee와 Atom

 

 

[분석정보] Intel은 Larrabee 계획과 아키텍처를 어떻게 바꾸나?

 

 

[분석정보] 다시 처음부터 시작된 라라비 무엇이 문제였나?

 

 

[분석정보] 라라비 (Larrabee)의 비장의 카드 공유 가상 메모리

 

 

[분석정보] 인텔의 스칼라 CPU + 라라비의 이기종 CPU 비전

 

 

[분석정보] Larrabee는 SIMD와 MIMD의 균형 - Intel CTO가 말한다.

 

 

[정보분석](암달의 법칙) 2010년대 100 코어 CPU 시대를 향해서 달리는 CPU 제조사

 

 

[분석정보] GDC 2009 드디어 소프트 개발자 정보도 나온 "Larrabee"

 

 

[분석정보] 그래픽 및 DirectX 로드맵을 정리

 

 

[정보분석] Intel 힐스보로가 개발하는 CPU 아키텍처의 방향성

 

 

[정보분석] 팀스위니 미래의 게임 개발 기술. 소프트웨어 렌더링으로 회귀

 

 

[분석정보] 정식 발표된 라라비(Larrabee) 아키텍처

 

 

[아키텍처] 베일을 벗은 인텔 CPU & GPU 하이브리드 라라비(Larrabee)

 

 

[정보분석] 암달의 법칙(Amdahl's law)을 둘러싼 Intel과 AMD의 싸움

 

 

[정보분석] 모든 CPU는 멀티 스레드로, 명확하게 된 CPU의 방향

 

[정보분석] IDF에서 보다. Google, Microsoft, Intel의 줄다리기

 

 

PC Watch