벤치리뷰·뉴스·정보/아키텍처·정보분석

[정보분석] GDC 2013 하스웰 탑재 울트라북 지금보다 게임이 잘된다? 인텔 확장 설명

tware 2013. 3. 27. 15:53


Game Developers Conference 2013 (이하 GDC 2013)의 2 일째가되는 미국 시간 3월 26일 미국 Intel은 이날 하루에 걸쳐, " Ultrabook - Graphics, Power, and Human Interfaces "(Ultrabook 그래픽과 소비, 휴먼 인터페이스)이라는 장기전 세션을 개최했다. Intel의 스폰서 세션은 GDC 관례지만, GDC 2013의 큰 테마는 Intel이 강력하게 추진하고있는 Ultrabook이다.
 그 내용의 대부분은 소프트웨어 개발자가 되는 전문적인 것이었지만, 세션 중에서는 종종, Intel이 2013 년 시장 투입을 예정하고 있는 차세대 CPU " Haswell "(하스웰 또는 하즈웰 개발 코드 이름)에서 통합된 그래픽 기능 (이하 통합 GPU)에 대한 언급이 있었다. 본 논문에서 보고 하는 것은 순전히 "Haswell의 통합 그래픽 기능"에 대해서다.


PC 게이머의 수는 게임기 사용자보다 3 배나 많다?

Matt Ployhar 씨 (Senior Product Planner, Intel ). 최근별로 활동 실적을 듣지 않게 되어 버렸지만, "PC Gaming Alliance '의 대표이기도 한 인물이다


 "Haswell 탑재의 Ultrabook라고 했으니, 원래 Ultrabook에 게임 용도의 수요가 있는거야?"라고 생각하고 느끼는 사람도 적지 않을 것이다. 그것은 미국에서도 비슷한 것 같아서, Intel 수석 제품 플래너를 맡는 Matt Ployhar 씨는 먼저 "게임 플랫폼으로 Ultrabook"의 매력을 설명하는 것으로 시작했다. Ployhar 씨는 "노트북 PC와 태블릿, 스마트폰을 포함하면 출하되는 컴퓨터 장치의 80 %는 모바일이다"는 상황을 설명했다. 그런 다음 "PC 게이머의 수는 게임기 사용자에 비해 3 배, 그리고 컴퓨터의 80 %는 모바일이다. 그렇게 되면 모바일 PC Ultrabook은 게임 메이커에게 매력적인 시장이라는 것이된다"고 론을 전개했다.

PC 게이머의 수는 게임기 사용자에 비해 3 배에 이른다는 슬라이드. 세계적인 신흥 시장 등도 포함하면 확실히 있는 숫자로 말할 수 있을 것이다. 또한 슬라이드에는 이외에도 PC 게임의 장점으로 로열티가 발생하지 않는 것 등도 열거 된


Haswell는 DirectX 11.1에 대한 자신의 확장이 제공되는

 그런데, 그런 Ultrabook 이지만 "Ultrabook에 최적화 된 게임"의 증가를 막는 요소가 통합 된 GPU 성능인 것인 말씀을 기다린 것이다. 그러한 사정 때문인지 아침에 행해진 강연의 주제는 모두 통합 GPU 기능에, Intel은 힘을 쓰고 있었다.
 그 중에서도 주목할만한 화제였던 것이, Haswell의 통합 GPU에서 지원된다는, Intel 자신의 확장이다.

Ployhar 씨가 보여준 Haswell의 통합 GPU의 블록 다이어그램. 그러나 이번 주목적은 그래픽 아키텍처가 아니라 어디 까지나 Haswell 용 소프트웨어 개발이다

 Haswell 구체적인 설명은 Intel 수석 애플리케이션 엔지니어 Steve Hughes (스티브 휴즈) 씨의 강연 ' Breaking the Rules on a GPU " 에서 이루어졌다.

Steve Hughes 씨 (Senior Application Engineer, Intel)



Hughes 씨가 보여준 슬라이드는 강연 제목이 좀 상스러운 표현에 개제되어 있었다. 테마는 4세대 Core 프로세서 (Core 4) DirectX 11 확장에 대한 것이다



 Hughes 씨에 따르면, Haswell에서는 DirectX 11에 대해 Intel 자신의 확장이 2 종류 제공되는 것이다.
 그 중 하나는 " CPU에서 통합 GPU의 메모리를 참조 할 수 있다 "는 것이다. CPU에서 개별 GPU의 메모리를 참조하려고 하면 액세스에는 반드시 PCI Express를 통해하지 않으면 안되기 때문에, 성능면에서 큰 병목된다. 그러나 "Intel의 GPU는 UMA ※ 1 그래서 (PCI Express를 통하지 않고) 포인터의 공유가 가능하다 "고 강조했다. ※ 1 Unified Memory Architecture의 약자로 CPU와 GPU가 같은 메모리를 공유하는 구조

단독(외장) GPU의 메모리는 PCIExpress 통해 연결 되기 때문에 CPU에서 보면 멀리있다. 하지만 시스템 메모리는 CPU의 근처에 있어 대역이 두꺼우니까 UMAsms PCiExpress의 병목과는 무관하다.... 라는 이야기


 "UMA 그래서 메모리를 공유 할 수 있다"라고 하는 것은, CPU와 칩셋에 대해 잘 아는 사람이라면 "동일한 메모리를 사용 하니까, 공유 할 수있는 것이 당연 않을까?"라고 생각할지도 모른다. 하지만, 실은 당연하지 않기도 하다. Hughes 씨는 이 이유에 대해 "메모리 관리 메커니즘이 CPU와 GPU에서 다르기 때문이다"라고 간단하게 답변하고 있지만 실제로 이것이, UMA 메모리 공유 할 수없는 가장 큰 이유다. Haswell의 통합 GPU에서 제공하는 확장 기능에서도 이 문제가 완전히 해결되지는 않으면 Hughes 씨는 말했다.


왜냐하면 확장을 통해 "CPU가 통합 된 GPU의 메모리를 참조 할 수 있다"처럼 확실하게되는데, "통합 GPU가 CPU의 메모리를 참조하는"것은 여전히 할 수 없기 때문이다. 통합 GPU 측에서 CPU의 메모리를 참조하고 싶다면, 결국은 CPU에서 통합 GPU의 메모리 복사가 필요하게 되어 버리는 것이다.


그러나 경쟁인 AMD의 APU는 CPU 코어와 GPU 코어에서 메모리를 공유함에 있어서 고급 구조가 도입되고 있다. APU의 메모리 관리 방법의 설명은 생략하지만, 간단하게 말하면 (일부 조건부이긴 하지만) CPU 코어와 GPU 코어 사이의 상호 메모리 복사가 불필요 하게 되어있는 것이다 (관련 PDF ※ 클릭하면 파일을 엽니다).


즉 Hughes 씨의 발언은 Haswell의 통합 GPU에도 APU 정도 단계는 구현하고 있지 않는 것을 의미하는 셈이다.한편, Haswell은 APU에 없는 이점도 있다. APU는 OpenGL의 확장 기능은 제공하고 있지만, Direct X 용 확장은 제공하지 않는다. 이것은 (Microsoft 이외에 의한) DirectX의 확장이 어렵기 때문이지만, Intel은 그것을 Haswell에서 제공한다고 한다.

Haswell에서 제공하는 DirectX 11 API 확장. "CreateSharedTexture2D '라는 도우미 함수와"CopyResource'라는 트랩이 제공된다. CopyResource는 GPU에서 CPU의 복사를 복사하지 않고 참조만 연결



 위의 슬라이드는 Haswell에서 제공되는 DirectX 확장에 대한 설명으로 여기에서는 확장 함수 하나와 GPU에서 CPU의 복사본이 불필요하게 "API 트랩"을 제공하고 있다. 이들에 의해 통합된 GPU 측 메모리에 있는 데이터, 예를 들어 텍스처 등을 시스템 메모리에 복사하지 않고도 CPU에서 액세스 할 수 있게 된다. 제한적이지만, 사용법에 따라서는 오버 헤드가 상당히 줄일 수 있을 것이다.


투명 다각형을 제대로 투명하게 Adaptive Transparency
Haswell은 확장 기능을 제공하고 사용하기 쉽게


투명색의 다각형을 그림과 같이 순서대로 그리는 알고리즘은 상당히 자원이 많이든다


 남는 또 하나의 확장은 매우 전문적인 이야기지만, 오해를 두려워하지 않고 싹둑잘라 설명하면, "카메라에서 보는 앞에 있는"투명한 색깔의 다각형 "이 잘 투과하지 않고 뒤에 있는 다각형이 그려지지 않는 '문제에 관한 이야기이다.
 투명 다각형이라도 Z 값을 가지고 있기 때문에 앞쪽에 투명 다각형이 있으면 먼저 그것이 그려져 버려, 본래는 비쳐 보여야 할 다각형이 제대로 표시되지 않는다. "이것은 매우 오래된 문제이다"(Hughes 씨). Intel은 2011 년의 Game Developers Conference에서 이 문제를 해결하는 방법으로, DirectX 11에서 도입된 픽셀 쉐이더에서 랜덤 액세스 가능한 버퍼 "Unordered Access View"(UAV)를 사용하는 ' Adaptive Transparency "(적응형 투명성 , 관련 링크 )를 발표했다.  Adaptive Transparency는 2 패스 방식의 수법으로, 대략적으로 설명하면 다음과 같은 처리를 한다.

첫번째 : UAV에 픽셀 당 깊이 (Z 값)와 색상, α 값을 적는다.
두 번째 : UAV의 데이터를 바탕으로, 픽셀 쉐이더에서 계산하여 그립니다.

Adaptive Transparency에도 여러가지 문제가 있었다 ......라는 슬라이드


Haswell에서 제공하는 2 개의 확장 함수. 하나는 초기화 함수이고 다른 하나가 연재를 시작하는 함수이다



 그러나 실제로는 이 방법에도 여러가지 문제가 있었다고 한다. 하나는 픽셀 정보가 임의의 순서로 쓰여 버리는 것. 또 하나는 픽셀 쉐이더에서 렌더링 타겟의 데이터를 반복 읽기 해야 하기 때문에 처리 시간이 걸릴 것이다. 따라서 Intel은 Haswell에서 무작위 순서로 UAV에 기록된 픽셀을 기본 순으로 순열화 (직렬화)하는 HLSL (High Level Shader Language)의 확장 함수를 두 가지 제공한다. 이것은 Haswell의 통합 GPU에 탑재되는 기능을 사용한 것 같고, 기본적으로 처리 자원을 들이지 않고 순열 할 수 있는 것 이라고 한다. Hughes 씨 말하기를 "이 확장은 Adaptive Transparency 같은 무거운 처리의 부담이 경감된다"는 것이다. 또한 이러한 확장은 가까운 시일 내에 샘플 코드가 제공되는 것이므로, 자세하게 알고 싶은 사람은 Adaptive Transparency 의 Web 페이지를 체크하는 것이 좋습니다.



Core 프로세서 통합형 GPU에 최적화도 지도(설명)

 그래픽 내용은 " Using DX11 for Intel 3rd and 4th Generation Core Processors "(제 3 & 4 세대 Core 프로세서에서, DirectX 11의 사용법)이라는 실질적인 강연도 이루어졌다. GPU 전반에 통하는 최적화 이야기가 중심 이었지만, 그 중에서도 Core 프로세서의 통합 GPU 시리즈에 특화된 최적화 기법에 대해 흥미 때문에 간단하게 설명하자.



Intel의 통합 GPU를 위한 최적화에 대한 슬라이드. 붉은색 글씨로 작성된 문장의 "GPA"는 Intel이 자사 GPU 용으로 제공하는 최적화 도구 "Intel Graphics Performance Analizer"


 위의 슬라이드는 먼저 "메모리 대역폭에 주의 할 것"이라고 있다. 구체적으로는, "텍스처는 압축한다. 색 농도는 필요 이상으로 하지 않는 것"이라고 조언되고 있다. 슬라이드 마지막에 적혀있는 "GPU와 CPU가 대역폭을 공유하는 것을 기억 '에 통하는 말이다. 또한 "고가의 MSAA는 사용하기 보다, FXAA 등 대체 수단을 사용할 것"이라고 사후 처리를 이용한 GPU 부하가 적은 안티 앨리어싱 기법의 사용도 권장되었다. "FXAA의 품질은 MSAA와 큰 차이가 없다 '는 것으로, MSAA 이외의 안티 앨리어싱 기술은 Intel에서도 주목하고 있는 것처럼 보인다.


전력 효율에 대한 설명 슬라이드


 전력 효율의 항목에서는 "함부로 프레임 속도를 올리지 않는다. 30fps 제한이 가장 효과적"이라고 구체적인 이야기가 나란히 있다. 그 중에서도 " TDP (Thermal Design Power, 열 설계 전력)는 GPU와 CPU가 공유하는 것을 잊지 마라 '는 특히 강조되고 있던 점이다.


Haswell의 통합 GPU로 AMD와 NVIDIA의 중급형 시장 GPU와 싸워 갈 수 있을 만한 성능을 획득하는 것은 아니다. 그러나 현재 세대 3세대 Core 프로세서의 통합 GPU와 비교 하면 비약적으로 성능도 기능도 상승하게 될 전망이다. Ployhar 씨가 이야기 한 것처럼, 게임 플랫폼으로 본 Ultrabook의 매력은, 성능의 향상과 본고에서 소개한 기능면의 확장과 따라 Haswell 세대에서 확실하게 향상 될 것이다.








[정보분석] 인텔 8 시리즈 칩셋의 문제점"에 대해 GIGABYTE에게 물어 봤다



[벤치리뷰] 인텔 코어 i7-4770k 리뷰 - Xbitslabs



[벤치리뷰] 인텔 4세대 코어 i7-4770K 리뷰 : 하스웰 성능 탐스하드웨어



[벤치리뷰] 인텔 아이리스 프로 5200 그래픽 리뷰 코어 i7-4950HQ 테스트


[벤치리뷰] 코어 i7-4770K 하스웰 성능,프리뷰


[2000.08.25] 그래픽 통합 CPU 팀나(Timna)의 개요를 분명히-극적인 다이 크기 축소를 실현



[아키텍처] Intel의 차기 CPU 하스웰(Haswell) eDRAM의 수수께끼




[정보분석] 하스웰 (Haswell)의 GPU 코어 아이리스(Iris) 왜 강력한가



[정보분석] 배터리로 20일간 아이들 상태로 가능한 차세대 Ultrabook



[분석정보] IDF 2013 베이징 Intel 프로세서에서 가능한 것은 Windows 만이 아니다



[정보분석] IDF 2013 Beijing에서 공개 된 하스웰(Haswell)의 절전 & 오버 클러킹 기능



[정보분석] CES 2013 Intel, Haswell을 탑재한 레퍼런스 하이브리드 PC 공개



[아키텍처] IDF 2012 인텔 차세대 주력 CPU Haswell(하스웰) 공개.



[정보분석] IDF 2011 인텔 하스웰(Haswell)의 다이와 절전 기술



[정보분석] Hasell(하스웰) 최강의 무기 통합 전압 조절기


[정보분석] Intel의 "Ozette"칩에서 Haswell(하스웰)까지의 전압 레귤레이터 통합​​의 길


[정보분석] 인텔의 2013년 CPU 하스웰로 이어지는 네할렘 개발 이야기



[분석정보] GDC 2016 Unreal Engine 4를 통합형 그래픽 기능으로 움직이다