벤치리뷰·뉴스·정보/아키텍처·정보분석

[Research @ Intel 2011] 인텔 HD Graphics로 오픈CL 시현 및 저전력 회로 설계

tware 2011. 6. 9. 22:30

 

 

6월 7일 (현지 시간) 개최

 

미 Intel은 예년(매년) 6 ~ 7 월경에 연구 개발 부문인 Intel Labs가 연구하고 있는 내용을 보도 관계자나 OEM 제조 업체 관계자 등에 공개하는 이벤트 "Research @ Intel" 을 개최하고 있다. 올해도 6월 7일 (현지 시간) 캘리포니아 주 마운틴 뷰 시에있는 컴퓨터 역사 박물관 (Computer History Museum)에서 이 행사를 개최했다.

 이 자리에서 회사는 미국의 대학과의 공동 연구의 거점이 될 'Intel Science and Technology Center "(ISTC)를, 캘리포니아 주립 버클리 대학과 공동으로 개설한 것을 발표했으며, Intel Labs의 주요 연구 테마 등을 소개. 전시 회장에서는 미래의 프로세서를 위한 기술 등이 공개되었다.

 

 

 

 

회장인 캘리포니아 주 마운틴 뷰 소재 컴퓨터 역사 박물관


대학과 연구소를 설립하여 보안 향상을 목표로


 시작 부분에 강연을 한 Intel CTO (Chief Technology Officer, 최고 기술 책임자) 저스틴 래트너는 "Research @ Intel 은 이번 9회째인 이 행사에서 Intel이 어디로 가려고 하고 있는지를 느낄 수 있다고 생각한다 "라고 인사. 또한 "우리의 연구 개발 부서는 각각 세계 수준의 연구를 수행하고 있다.뿐만 아니라 외부 대학과 오픈 소스 커뮤니티 등과도 적극적으로 협력하여 연구의 질을 높이고 있다" 고 설명 했다.

 그러한 협력을 한층 더 추진을 위한 거점으로서 Intel Science and Technology Center를, 캘리포니아 주립 버클리 대학과 협력하여 설립한 대학 연​​구소 등과의 협력 체제를 한층 깊게 한다. 회사는 ISTC에 1,500만 달러의 초기 투자 외에도 향후 5년간 1억 달러를 들여 간다고 한다.

 Intel과 버클리 대학뿐만 아니라 다른 대학을 포함한 연구원을 한 팀으로 하여 다양한 연구를 한다. 특히 컴퓨터의 보안 문제는 소니의 고객 정보 유출이 기억에 생생하지만, 업계에 있어서도 큰 과제로 기술 혁신을 목표로 간다 한다.

 이 외에도 래트너 씨는 Intel Labs의 연구에서 실제 제품이 된 최근의 예로는 "Thunderbolt"(썬더볼트. 개발 코드명 : LightPeak)를 소개했다.

 

저스틴 래트너 씨

 

 

Intel Labs의 역할은 Intel 사내 연구뿐만 아니라 외부의 정부와 대학,

오픈 소스 커뮤니티 등과도 협력해 연구를 진행하고 있다

 

 

 

오픈 소스 커뮤니티와 협력의 예. 광선 추적(레이 트레이싱) 소프트웨어 등을

오픈 소스 커뮤니티와 협력하여 연구

 

 

Intel Labs는 미국뿐만 아니라 중국, 인도, 러시아, 유럽 등 여러 존재

 

 

Intel Science and Technology Center (ISTC)를 설립하고 대학과의

협력 관계를 더욱 깊게 한다.

 

 

ISTC의 주요 연구 분야는 보안 강화다

 


Sandy Bridge 내장 GPU 암호화 처리


 래트너 씨의 30분 정도의 강연 후, Computer History Museum 2층에 특설 된 장소에서 Intel Labs의 연구 성과가 공개되었다. 공개 된 것은 35개 연구 결과로 PC 나 디지털 장치 같은 소비자와 관련된 분야에서 클라우드 컴퓨팅 서버 관련 것들 엔터프라이즈 솔루션까지 다방면에 걸쳐있다. 본 보고서는 그 중에서 미래의 가능성을 포함하여 소비자에 관계있을 화제를 올려 보고 싶다.

 보안 영역에서 출시 된 것은 "Unleashing the Potential of Intel Processor ​​Graphics" 라 불려지는 전시로, 암호화랑 그 해독 작업을 제 2세대 Core 프로세서 (Sandy Bridge)의 x86 프로세서 코어에서만 아니라 내장 GPU를 이용하여 행하고 있었다.

 잘 알려진대로 Sandy Bridge는 프로세서 다이에 x86 프로세서 코어와 GPU가 통합되어있다. 현재 GPU는 내부에 많은 연산 엔진을 갖을 뿐만 아니라 벡터 연산 등 범용 연산에도 사용할 수 있다. 소위 GPU 컴퓨팅이라는 사용법으로, NVIDIA는 CUDA 라는 방식으로 타사에 앞서 이러한 구조를 도입했다. 한편, AMD와 Intel은 OpenCL 이라 하는 업계 표준 방식에 대한 대응을 표명하고, AMD는 이미 자사 제품에 대한 지원을 시작했다.

 현 시점에서는 Intel의 Sandy Bridge의 내장 GPU는 그러한 GPU 컴퓨팅에는 대응하지 않았고, CPU와 GPU를 모두 사용하여 연산 할 수 없다. 그러나, Intel은 Ivy Bridge 세대에서 OpenCL을 지원할 전망 (Intel이 이 점을 공식적으로 인정하는 것은 아니다)으로 이번 시현은 그것에 앞서 현행 제품으로 특별히 그 구조(즉 OpenCL)를 시현하고 있다.

 OpenCL에서 CPU와 GPU를 모두 사용하여 암호화 및 암호 해독을 행하는 것으로, 내장 GPU를 사용하지 않는 경우에 비해 RSA 1024에서 75%, AES-CGM-128 12배, TLS 1.2에서 8.5 배 성능 향상을 얻을 수 있는 것을 시현하고 있었다.

 어디 까지나 이번 연구중인 기술 시현이며, 곧 제품에 구현되는 것은 아니라는 것이었지만 이미 업계 관계자의 정보 OpenCL이 Ivy Bridge에서 구현되는 것으로 밝혀지고있다는 것을 감안할 때, 가까운 시기의 제품화에 기대가 걸린다.

 

전시 회장 입구. 현재 Intel의 슬로건인 Sponsors for Tomorrow을 모방하여

Welcome To Tomorrow 라는 슬로건이 입구에 걸려 있었다

 

 

 

 

    Unleashing the Potential of Intel Processor ​​Graphics 시현에 이용되고 있던 것은

보통 Sandy Bridge 탑재 데스크톱 PC

 

 

내장 GPU를 암호화 연산에 이용한 경우의 성능 향상 속도. 내장 GPU를 사용하지 않는

경우에 비해 RSA 1024에서 75% 업, AES-CGM-128 12배, TLS 1.2에서 8.5 배의 성능

 

 

프로세서뿐만 아니라 내장 GPU를 이용하여 연산함으로써 처리 능력을 높이고 있다

 


소비 전력 당 성능을 대폭 향상 전압 스케일링 기술


 또 신경이 쓰이는 데모로는 임계 값 근처까지 마이크로 프로세서의 전압을 낮춤으로써 전력을 절감하는 기술에 관한 전시 "A 550GOPS / W Near-Threshold Voltage Register File ' 이다.

 프로세서의 전력 소비를 결정하는 파라미터는 다수 있다. 크게 말해서, 다이 크기 (트랜지스터), 클럭 주파수, 그리고 프로세서의 코어 전압이다. 특히 전압은 제곱으로 소비 전력에 영향을 미치기 때문에 소비 전력을 줄이려면 전압을 줄이는 것이 큰 효과를 거두는지 잘 알려져 있다. 그러나 반도체의 특성으로 전압이 높을수록 클럭 주파수를 올릴 수 있기 때문에 맹목적으로 낮출 수는 없다.

 단지, 프로세서는 항상 풀 파워로 움직이는 것은 아니다. OS가 움직이고 있는 상태라도 CPU에 부하가 거의 걸리지 않은 시간은 적지 않다 (또는 오히려 이 상태가 더 많다). 그래서 그러한 상태 일 때 클럭 주파수를 떨어 뜨리면 전압을 낮출 수 있고, 총 소​​비 전력을 낮출 수 있다.

 이것이 이전 Intel이 Speed​​Step Technology 이라고 부르고 기술의 원리인데, 기존 CPU에서 전압의 하락폭에 한계가 있었다. 그 한계를 규정하고 있는 것은, 프로세서 내부에 포함되어 있는 레지스터 파일로 불리는 것. 레지스터 파일에 개량을 더하는 것으로,보다 낮은 전압에서 작동 할 수 있도록 한 것이 이번 공개된 데모이다.

 설명원에 의하면, 이번에 시험 제작된 32nm 공정 방식의 레지스터 파일은 전압을 임계 값 근처가 되는 340mV 까지 낮추는 것이 가능하게 되었다고 한다. 그리해 소위 액티브 파워라는 프로세서가 대기 상태가 아닌 일반 실행중인 상태의 소비 전력을 대폭 낮추는 데 성공했다고 한다. 시험 제작한 레지스터 파일은 최대 주파수 8.3GHz 이나 소비 전력은 불과 83mW 로 전력 효율은 550GOps / W (1W 당 550G의 리드 라이트가 실행가능)로 업계의 지금까지 보고된 예 보다 압도적으로 우수하다 설명했다.

 전시원에 따르면 이 기술은 회로 기술이기 때문에, 어느 세대의 공정 방식도 구현이 가능하다는 것으로, 향후 등장 할 22nm, 14nm 등 미래의 공정 방식과 이전 공정 방식에 논리적으로 구현 가능하다는 것이었다. 현재 연구 개발 단계이며, 곧 제품에 구현된다는 것은 아니지만, 제품 그룹과 긴밀하게 상호 작용을 하고 있다는 것이므로, 앞으로 이 기술이 Intel 프로세서 채택 될 가능성은 충분히 있을 것 같다.

 

Register file에 손을 쓰는 것으로, 임계 값 (한계)까지 전압을 낮출 수 있게 된다.

액티브 파워를 크게 줄일 수 있게된다

 

 

전압을 임계 값 근처까지 낮춤으로써 소비 전력을 크게 줄일 수 있다. 일반 모드시에는 1.2V 등의 일반 전압을 걸치는 것으로, 높은 작동 주파수로 움직이게 할 수있다  

 

 

32nm 공정 방식으로 제조된 테스트 칩의 웨이퍼. 22nm 나 14nm 등 향후 등장하는 공정 방식에도 적용 가능

 


다가올 매니 코어 시대에 대비 소프트웨어 개발과 A-ADAPT


 Intel뿐 아니라 반도체 제조업체들은 매니 코어라는 다수의 프로세서 코어를 실장한 제품의 연구 개발을 계속하고 있다. 한마디로 매니 코어라고 해도 Intel이 개발하는 것에는 두 가지 변종이 있다. 하나는 제품화가 포기된 Larrabee (라라비)의 흐름을 이어받은 Kights (나이츠) 시리즈로, 현재는 PCI Express 카드로 대학 등의 연구 기관에 제공되어 소프트웨어 개발의 연구 개발이 진행되고 있다 .

 다른 하나는 이전 Research @ Intel 에서도 전시된 서버 전용으로 개발이 계속되고 있는 매니 코어. 이번에는 Pentium 급의 코어를 48개 실장한 것이 시험 제작되고 하나의 프로세서에서 위헤서 복수의 서버 OS를 달리게 했다.

 이 프로세서는 24 타일로 구성되어 있으며, 1 개의 타일 안에 2 개의 프로세서 코어와 L2 캐시가 내장 된 구조로 되어 있다. 예를 들면, 현재 클라우드 컴퓨팅의 백엔드로 움직이고 있는 서버는, 블레이드 서버 등이 있으며, 각각 저전력 프로세서가 탑재되는 구성이다. 그러한 복수의 블레이드 서버를 매니 코어 프로세서 에서 하나의 시스템으로 대체해 버리자는 것이 이 프로젝트의 주안점.

 그러나 제품화에는 몇 가지 해결해야 할 과제가 있다고 한다. 예를 들어, I / O 피크를 어떻게 분산할지가 그 일례. 모든 프로세서에서 동시에 연산을 행하면 방대한 데이터가 발생하기 때문에 I / O 병목이 되어 버려 성능을 발휘할 수 없다. 그래서 I / O로드 밸런싱을 프로그래밍 에서 해결할 수 있는지 등을 대학과 협력하여 연구하고 있다고 한다.

 매니 코어 관련에서는 이 밖에도 V-ADAPT (Variation Aware Dynamic Adaptation)라는 데모도 공개되었다. 이 시험제작 프로세서는 48 개의 Pentium 급의 코어가 하나의 다이에 탑재되어 있는데, 48개 코어가 있지만 높은 주파수에서 움직이기 쉬운 코어도 있고, 누설 전류가 작은 것 등 특성이 다른 코어가 하나의 다이 위에 존재하게 된다.

 그래서 반대로 이러한 특성의 차이를 살려, 처리 능력이 필요한 경우에는 동일한 열 설계 범위 내에서 높은 클럭으로 움직이는 코어에 작업을 할당하거나 OS가 동작만 유지하면 좋은 때에는 누설 전류가 적은 코어에 할당 하는 것을 프로세서 자신이 동적으로 행한다. 이를 통해 높은 성능을 실현하면서, 소비 전력을 억제하는 것이 가능하게 된다고 한다.

 

45nm 공정 방식으로 제조된 48 개의 Pentium 급의 코어를 내장한 매니 코어 프로세서의 시제품​​. 히트 스프레더까지 붙어 있고, 매우 시험제품 이라고는 생각되지 않는 완성 이었다.

 

 

    마더 보드. 메모리 소켓은 8 개 준비되어 있으며, 쿼드 채널로 작동

 

 

구조

 

 

대학과 협력하여 매니 코어에 최적화 된 소프트웨어 개발을 연구 중

 

 

 

 

V-ADAPT는 프로세서 코어의 특성 차이를 동적으로 조정


현재의 기술로 실현 가능한 에코 센스 빌딩


 동일본 대지진 이전 일본에서는 스마트 그리드와 같은 전력을 더 효율적으로 사용하는 기존 기술은 별로 주목받지 않았다. 왜냐하면 원자력 발전의 비율이 높았기 때문에 큰 전력을 다른 나라에 비해 비교적 용이하게 쓰며 적은 CO2 배출량으로 공급 될 수 있었기 때문이다. 그런데 동일본 대지진과 거기에 계속되는 후쿠시마 제일 원전 사고로 인하여 상황은 크게 변화했다.

 이전부터 Intel Labs 제안 해왔던 "Eco-Sense Building '도 스마트 그리드 기술의 하나로, 모든 PC에 전력계와 온도 센서를 설치 데이터를 기록하고 서버에서 빌딩 전체의 로그를 집중 관리한다. 클라이언트 유틸리티를 이용하여 자신의 PC가 목표에 비해 어느 정도 절전에 공헌하고 있는지 등을 확인할 수 있다. 또한 스마트 폰 등으로 확인할 수 있는 도구도 제공한다고 한다.

 담당자에 의하면, 이미 도구 등은 완성하고 언제든지 실전 투입 가능하다고 한다. Intel Labs 에도 이러한 기술이 올 여름 일본에 요구되는 것은 이해하고 실제로 담당자는 지난주 일본에 출장하여 Intel 일본 법인과 그 가능성에 대한 논의를 했다고 한다.

 이 밖에 독특한 것은 "Renewable Data Communication" 이라는 전시다. 전시되고 있던 것은 태양 전지판이 붙어있는 Wi-Fi 액세스 포인트. 이 액세스 포인트는 직접 인터넷에 연결되는 것은 아니고 (연결하는 것도 가능). 클라이언트는 이 액세스 포인트 안의 캐시 된 인터넷 데이터에 액세스한다. 클라이언트에서 메일 등을 보내는 것도 가능하지만,이 경우도 액세스 포인트 안의 스토리지에 캐시된다.

 그리고 액세스 포인트에 쌓인 캐시는 정기적으로 날아 오는 헬리콥터에 탑재 된 시스템에 의해 갱신되어 외부에 발신하는 데이터는 그 후 실시간으로 인터넷 접속이 가능한 곳으로 옮겨져 송신하게 된다.

 이 솔루션은 전력 공급이 충분하지 동남 아시아 등의 개발 도상국 전용으로 간주되는 솔루션이지만, 이번 대지진처럼 휴대 전화 통신망이 피해를 입은 일본에서도 사용할 수 있을 것이다. 각자의 단말기만 살아 있으면 가설된 액세스 포인트가 기지국이 복구되는 동안 연결되어 안부 확인에도 도움이 될 수 있다. 향후 재해에 대한 준비로 이러한 솔루션을 검토해 볼 가치는 있을 것 같다.

 

Eco-Sense Building의 구조. 각 PC에 온도계와 전력계 등이 연결된 서버에서

집중 관리된다. 미래에 전기 자동차도 배터리 하나로 관리

 

 

PC에 설치된 관리 도구를 사용하여 자신의 PC가 목표에 어느 정도

기여하고 있는지 등을 확인가능

 

 

노트북 PC의 사이에 있는 것이 온도계의 시험 제작기.

네트워크를 통해 서버에 로그를 기록 가능

 

 

스마트 폰에서도 노트 PC의 소비 전력을 확인가능

 

 

 

 

Renewable Data Communication 기지국. 태양 전지판에서 발전된 전력을 배터리에

축전하고 Atom 기반의 기지국을 구동한다.

3G 및 WiMAX 등이 이용되는 경우는 중계국 으로도 동작하는 것이 가능하다.


Smart Car와 32nm 공정 방식의 무선 칩


 이 밖에도 스마트 폰을 이용해 자동차의 모습을 확인할 수 있는 'Smart Car " 나 원래는 아날로그 회로인 무선 부분을 디지털화 해, 32nm 공정 방식으로 제조 한 "32nm RF Transceiver"등 특색 전시가 있었 아래 사진 설명으로 소개한다.

 

 

 

 

 

Smart Car 데모. IVI (In-Vehicle Infotainment) 시스템과 스마트 폰은 NFC를 이용하여 페어링 및 응용 프로그램 설치를 행한다. 차에 이상이 발생했을 때 등은 스마트 폰에 자동으로 알린다. 응용 프로그램을 이용하여 자동차 카메라 등에서 자동차의 모습을 확인하고 자동차의 LAN을 이용하여 상태 (어떠한 에러가 발생하고 있는지) 등을 체크 할 수 있다. iPhone 등의 NFC 지원하지 않는 단말에서도 QR 코드로 페어링이 가능

 

 

 

 

본래는 아날로그 회로인 무선 부분을 디지털화 하는 "32nm RF Transceiver" 데모. 디지털화 해서 미래의 베이스 밴드 및 MAC뿐만 아니라 무선 부분도 SoC 마이크로 프로세서에 통합 하는 것이 가능하게 된다. 이것으로 디지털 회로가 발하는 노이즈 등의 영향을

받기 어려워 진다.

 

 

GPU가 아닌 CPU를 이용해 레이 트레이싱 렌더링을 실시간에 가까운 속도로 행한 데모. 오픈 소스 커뮤니티와 협력하여 개발하고 있다.

 

 

Automatic Classroom Collaboration은 초등학교에서 학생을 그룹화 해서 작업을 하는

경우, 종래는 선생님이 주도해 그룹화를 하고 있던 것을 컴퓨터의 처리에 맡겨

다양한 공동 작업 (퀴즈 등) 을 시키는 교육 소프트웨어

 

 

클라우드로 레이 트레이싱 연산을 행하고 그 결과를 태블릿과

스마트 폰에 표시하는 데모

 

 

진지한 건지 진지하지 않은 건지, 좀처럼 판단하기 어려운 자전거에 의한 발전 연구.

전력이 불안정한 개발 도상국을위한 솔루션이다 라고 하는 것이지만 ......

 

2011년 6월 9일

 

 

 

[분석정보] Research @ Intel 2013 Direct Compressed Execution 등을 시현

 

 

[분석정보] Research @ Intel 2012 리포트

 

 

 

[분석정보] 2012년 vPro는 클라이언트 관리의 결정적 수단이 되는가? 1/2부

 

 

[분석정보] 2012년 vPro는 클라이언트 관리의 결정적 수단이 되는가? 2/2부

 

 

[분석정보] 범용 컴퓨팅을 강화한 Sandy Bridge의 그래픽

 

 

[분석정보] Intel 48 코어 IA 프로세서를 개발

 

 

[분석정보] Intel 48코어 매니코어 연구 칩 기술 공개