벤치리뷰·뉴스·정보/아키텍처·정보분석

[분석정보] 그래픽 및 DirectX 로드맵을 정리

tware 2009. 2. 18. 18:30

 

 

55nm 프로세스를 채용 한 하이 엔드 제품 "GeForce GTX 295" 과 "GeForce GTX 285" 에서 AMD에 빼앗긴 시장 점유율 탈환을 도모 NVIDIA하지만 차세대 제품 로드맵은 아직 불분명하다.  그래픽 카드 벤더 관계자는 2009 년 2 분기에도 "GeForce 9600" "GeForce 9500"의 각 프로세스 축소 버전에서 40nm 공정 기술을 채용 한 "GT130" "GT120" "G110" (모두 개발 코드 이름)가 출시 될 계획이라고 전했다.

 

 

 


 NVIDIA가 "GeForce GTX 280"에서 제품의 명명 규칙을 변경한 것은 알다시피 이지만 3 자리 모델 번호 첫 자리가 GPU의 세대, 남은 2 자리가 "성능 번호"가 된다. 또한 NVIDIA 관계자에 따르면 "GTX"를 구성하는 세 문자는

G : Graphics (그래픽)
T : Tesla (CUDA 등 범용 컴퓨팅 기능)
X : eXtreme (하이 엔드)

를 가리키게 되고 그것을 감안하면 GT130과 GT120은 "그래픽 및 범용 컴퓨팅 능력을 가진 중산층 모델"G110은 "그래픽 기능을 메인으로 한 G8x/Gx 세대의 엔트리 모델"이라는 의미가된다. 그런데 NVIDIA는 1월에 미국에서 개최한 전시회 "2009 International CES"에서 G120과 GT130의 모바일판 이라고 위치시킨 노트북 PC 용 GPU "GeForce G100M"시리즈를 아래와 같이 발표 하고있다 .

GeForce GT 130M : 55nm 프로세스 32SP, 128bit 메모리 인터페이스, 코어 클럭 1500MHz, 메모리 클럭 800MHz (GDDR3) / 500MHz (DDR2)


GeForce G 110M : 55nm 프로세스 16SP, 64bit 메모리 인터페이스, 코어 클럭 1000MHz, 메모리 클럭 700MHz (GDDR3) / 500MHz (DDR2)


GeForce G 105M : 55nm 프로세스 8SP, 64bit 메모리 인터페이스, 코어 클럭 1600MHz, 메모리 클럭 700MHz (GDDR3) / 500MHz (DDR2)

 

 

GeForce GT 130M의 이미지


 포인트는 GeForce G100M 시리즈가 55nm 공정 기술로 제조되는 점이다. 앞서 언급했듯이, GeForce 100 시리즈 데스크탑 PC 용 GPU는 40nm 프로세스 기술을 채용하여 제조되기 때문에 이것은 보다 범용 쉐이더 유닛 "Streaming Processor"(SP) 수가 증가할 가능성은 높다.

 

 실제로 그래픽 카드 벤더 관계자는 GT130이 64SP, GT120이 32SP, G110이 16SP가 될 전망 전하고있다. 이것은 65nm에서 55nm 같은 중간 과정의 축소는 (회로의 최적화 더욱 필요 하지만) 노광 기술을 사용하여 기본 회로 설계를 그대로 축소 "광학 축소"가 가능하지만, 65nm에서 40nm 같은 주요 프로세스를 넘는 수축은 반도체 회로 자체를 재설계 할 필요가 생겨 재설계시 쉐이더 프로세서 수를 늘리거나 하는 것이 수월하기 때문 이라고 한다.

 

일부는 40nm 프로세스 판 G100 시리즈가, "GeForce GT 200"또는 "Geforce G 200 '시리즈로 이름 붙는다는 소문도 있다. NVIDIA는 최근에도 "GeForce 8800 GT"를 "GeForce 9800 GT"로 이름 바꾸기했던 "실적" 이 있으므로 프로세스 축소를 계기로 최근의 명명 규칙에 번호를 가지런히 할 가능성은 분명히 제로는 아니지만, 아직 소문의 역이 나오지 않은 실정이다.

 

 

 

 

2009년 2월 시점에서 GeForce GTX 260은 55nm 공정 버전 탑재 모델이 각사로부터 시작한 때 이지만, 3 분기에는 40nm 프로세스로 이행한 후속 제품이 등장할 전망(※ 사진은 엘사 재팬의 'ELSA GLADIAC GTX 260 V2 896MB (55nm Edition) ")


 그런데 NVIDIA의 차세대 아키텍처 제품에 대해서는 거의 정보가 누출되고 있지 않다. NVIDIA에 가까운 그래픽 벤더 관계자에 따르면 Direct3D 11을 지원하는 "GT300" (개발 코드 명)이 3 분기 이후에 투입될 전망이란 것이나, "GeForce GTX 260"를 40nm 공정으로 축소 시킨 제품 등이 검토되고 있는 것 같다. 그러나 "지난 1년, NVIDIA의 로드맵은 제품 일정뿐만 아니라 사양과 코드 네임도 자주 변경되므로 제품화 직전이 아니면 확실한 것은 알 수 없다"고 말했던 그래픽 벤더 관계자는 많다.


AMD는 3분기 이후에 "R800"계 제품군을 순차적으로 투입

 GPU 업계 또 하나의 거두인 AMD는 2분기에 40nm 공정 기술을 채용한 미들 클래스 시장 GPU, "RV740" 를 시장에 투입할 계획을 가지고 있다.
 AMD의 파트너가 될 벤더는 "GeForce 9600 GT"와 가격적, 성능적으로 대항할 수 있는 제품의 투입이 요구되고 있으며, AMD는 이에 응하는 형태로, RV740의 쉐이더 프로세서 수를 (ATI Radeon HD 4600 시리즈의 320 기에서) 늘리는 것도 검토하고 있는 것 같다.

 

 


 한 대형 OEM 업체 관계자는 "RV740은"ATI Radeon HD 4830 "의 40nm 프로세스 판이라고 하는 위치가 될 예정이다"라고 말했다. 즉, 프로세스 이행에 따른 반도체의 재설계로 RV740은 640SP 사양이 되는 셈이다. 그러나 이 관계자는 "세계적인 금융 위기의 영향을 받아 AMD의 반도체 제조 계획은 크게 후퇴하고 있다"고 말하고 있어, 2 분기 등장 예정인 RV740이 과연 예정대로 일정에 등장하는건 지금으로는 또한 불투명한 상황이다.

 

한편, 차세대 아키텍처 제품 계획은 명확하다. AMD는 Direct3D 11을 지원하는 "RV870" (개발 코드명)을 3분기에 투입하고 듀얼 GPU 솔루션을 제공하는 "R800" (개발 코드명)과 하위 모델 "RV830" 을 2009년 말에 걸쳐 순차적으로 투입할 예정이다. 이 신제품은 모두 TSMC (Taiwan Semiconductor Manufacturing Company)의 40nm 프로세스 기술로 제조될 전망으로, 아키텍처면에서도 손이 더해지는 것으로 보고되고 있다.동시에 AMD는 이 R800 아키텍처를 채용 한 노트북 PC 용 GPU에 "Manhattan" (맨해튼)이라고 하는 개발 코드 네임을 주고있다. 구 ATI Technologies 시대부터 계속된 코드 네임인 머리 색깔과 다른 이름인 것은

R800 세대에서 항목 시장의 GPU의 제조를, AMD도 출자하는 합작 파운드리로 전환하고 2011년에 출시 예정이다 Fusion APU (※ CPU와 GPU를 통합한 프로세서)의 기반


AMD가 계획하고 있던 미국 뉴욕 주 팹에서 생산할 계획이었던 것으로 부터 붙은 개발 코드 네임이다

때문이라고 회사 근처 OEM 벤더 관계자는 지적하고 있다.


Windows 7 및 DirectX 11에서 Intel이 비약적?!

 그래픽 시장의 향방을 예측하는데 Microsoft의 움직임에서 눈을 뗄 수 없다. 2009년에 출시가 예정되는 차세대 Windows "Windows 7"의 그래픽 지원 환경은 Microsoft가 제 3의 GPU 제조 업체를 밀어주는 것이라고 지적하는 업계 관계자가 많기 때문이다. 제 3의 GPU 메이커는 다름 아닌 Intel이다.

 

 

Windows 7의 DirectX 10.1에서는 DirectX 9 하드웨어도 Direct3D 10 Level 9로 지원


 Microsoft는 Netbook 등 그래픽 성능이 힘이 약한 제품도 Windows 7을 경쾌하게 움직일 수 있게하기 위해, Windows Vista보다 그래픽 하드웨어에 대한 요구 사항을 완화시킨다. 이렇게 하면 Windows 7의 Direct3D 10.1은 Intel 965G 그래픽 기능 통합형 칩 세트와 GeForce FX / PCX, ATI Radeon 9000 같은 프로그램 쉐이더 2.0 (Shader Model 2.0) 세대, DirectX 9 세대의 하드웨어도 " Direct3D 10 Level 9 '하드웨어로 지원된다. DirectX 10에서 폐지된 CAPS (CAPability Set check)를 부활시켜, CPU의 에뮬레이션을 가능하게 한다.

 

 

 

 

 

 

Direct3D 10 Level 9는 지원되는 프로그래머블 쉐이더 세대의 차이 등 세 종류로 나뉜다. 각 클래스의 처리 성능에도 차이가 있다

 

 

DirectX9 하드웨어에서 처리 할 수​​없는 기능 등은 Direct3D WARP 10에 의해 소프트웨어 처리하여 작동을 흡수


 Windows 7에서는 CPU에서 Direct3D 10/10.1의 모든 기능을 완벽하게 지원하는 소프트웨어 래스터화 기능 'Direct3D WARP 10 "(WARP : Windows Advanced Rasterization Platform)이 탑재된다. 그러면 DirectX 9세대의 그래픽 기능도 DirectX 10/10.1 응용 프로그램을 실행할 수 있게 되는 것이다. 요구 사항은 "동작 클럭 800MHz 이상의 CPU를 탑재한 PC '로 멀티 코어 CPU를 탑재한 시스템에서는 저가형 그래픽 기능 통합형 칩셋보다 뛰어난 그래픽 성능을 발휘할 수 있다고 한다.

 

 

 

 

 

 

Intel이 2010년 하반기에 출시를 계획하고 있던 Larrabee의 블록 다이어그램. ROP 등의 고정 기능 유닛을 가지지 않고 벡터 프로세서와 스칼라 프로세서를 통합하는 각 코어가 모든 그래픽 처리를 해내

 이, Direct3D의 호환성 확보가 Intel에 유리하다고 업계 관계자가 지적하는 이유는 Direct3D 11의 가장 큰 특징 중 하나가 될 테셀 레이터도 DirectX 11 세대에서는 CPU에 의한 가속을 사용할 수 있도록 되기 때문이다.


 2008년 후반, Intel이 개발중인 그래픽 프로세서 "Larrabee"(라라비, 개발 코드 네임)의 개요를 분명히 하면 NVIDIA 및 AMD의 관계자는 "고정 기능 유닛이 없는 Larrabee에서는 테셀레이션이 성능 병목이 될 가능성이 높다 "고 지적했다. 이것은 테셀 레이터의 기능을 셰이더 유닛으로 처리하면 일부 쉐이더 클러스터가 테셀레이션 처리만 차지하게되어 쉐이더 유닛 전체의 효율이 떨어지기 때문에. 당초 Microsoft가 Direct3D 11에서 테셀 레이터를 고정 기능 유닛으로 구현하는 방식을 택한것도 처리 효율을 생각한 것이라고 말해지고 있다.

 

 그러나 Windows 7에서는 Direct3D 11도 WARP 의해 소프트웨어 에뮬레이션 할 수 있게 되었다. 즉, 고정 기능 유닛으로 테셀 레이터 대신 CPU를 사용해 버리면, NVIDIA와 AMD가 지적하는 성능 문제는 해소해 버린다.

 

 

 

Direct3D 11 최대의 특징이 되는 테셀 레이터는 원래 고정 기능 유닛으로

구현하는 방향으로 생각되었다

 

 

Direct3D 11의 범용 컴퓨팅 기능 "DirectX Compute Shader"파이프 라인 처리


 이 Microsoft의 "변심"에 업계 관계자는 "Intel을 Microsoft의 범용 컴퓨팅 환경에 끌어위한 수작"이라고 비꼬는. 이른바 GPGPU (General Purpose GPU 범용 GPU) 기능은 Apple이 제창하는 OpenCL 지원이 확산되고 있다. CUDA에서 이 시장을 선도하는 NVIDIA도 (Apple과의 좋은 관계도 있고) OpenCL 지원을 서서히 표명하고 있지만,이 상황에서 Microsoft가 수컷 "DirectX Compute Shader"를 표준 환경에 밀기 위해서는 강력한 백업이 필요하다. 따라서 Intel과 손 잡고 DirectX 11 세대에서 서로의 약점을 부정하려고 한 것이 Windows 7의 WARP 구현 아닌가 하는 셈이다 (※ NVIDIA가 Apple의 헌신을 강화하고 있다에 대항하는 것 이라고 보는 업계 관계자도 있다).

 

 무엇보다, Intel이 32nm 공정 기술로 제조되는 Larrabee를 시장에 투입할 수 있는 것은 빨라도 2010년 하반기로 알려져 있으며, NVIDIA 및 AMD에게는 대항하여 DirectX 11에 최적화하는데, 지나칠 정도로 시간이 있는 것도 확실하다.

 

 

 

Apple이 제창하고 Khronos Group이 표준화를 추진해 왔던

범용 컴퓨팅 언어 Open CL은 GPGPU의 표준 언어로 기대된다


 한편, WARP 구현은 최종 사용자에게 혜택을 지적하는 GPU 벤더 관계자도 있다. 이 관계자는 "테셀 레이터를 엔트리 모델에 구현하면 트랜지스터 수가 불어 나고 만다. 낮은 가격을 유지하려고 하면 성능을 늘릴수 없게 되지만, WARP의 이용을 전제로, 예를 들면 엔트리 모델에서는 하드웨어 테셀 레이터를 생략하고 있다면, 그만큼 범용 쉐이더 유닛을 늘릴 것 "이라며, WARP의 채용이 엔트리 환경의 성능 향상에 기여한다고 지적한다.  

 

경우에 따르면, NVIDIA 및 AMD의 차세대 엔트리 GPU에서는 Direct3D 11을 하드웨어에서 완벽하게 지원하지 않을지도 모른다. 그야말로 DirectX 7세대 하드웨어 T & L 가부, "하드웨어 테셀레이션 레이터는 미들 클래스 GPU 이상의 프리미엄 기능"맙소사가 될 가능성이 나온 셈이다. 그런 의미에서 차세대 그래픽 시장의 캐스팅 보트를 쥐고 있는 것은, Microsoft 인지도 모른다.

 

 

 

[분석정보] 4만 8000개의 제온파이로 중국 톈허2 세계에서 가장 빠른 슈퍼 컴퓨터

 

 

[분석정보] TOP500 슈퍼컴퓨터 순위 2013년 6월

 

 

[제품뉴스] Intel Xeon Phi 새로운 폼 팩터 채용 포함 5모델 추가

 

 

[정보분석] 인텔 60코어 매니코어 "Xeon Phi" 정식발표

 

 

[분석정보] 인텔 슈퍼컴퓨터용 가속기 Xeon Phi 5110P 발표

 

 

[분석정보] Intel, HPC 전용 보조 프로세서 Xeon Phi 2013년 1월부터 일반용으로 출시

 

 

[분석정보] IDF 2012에서 주목한 한가지, 매니 코어 "Knights Corner"

 

 

[정보분석] 엔비디아 세계 최다 트렌지스터 칩 GK 110 공개

 

 

[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 1/2부

 

 

[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 2/2부

 

 

[정보분석] 같은 무렵에 시작된 Nehalem과 Larrabee와 Atom

 

 

 

[분석정보] Intel은 Larrabee 계획과 아키텍처를 어떻게 바꾸나?

 

 

[분석정보] 다시 처음부터 시작된 라라비 무엇이 문제였나?

 

 

[분석정보] 라라비 (Larrabee)의 비장의 카드 공유 가상 메모리

 

 

[분석정보] 인텔의 스칼라 CPU + 라라비의 이기종 CPU 비전

 

 

[분석정보] Larrabee는 SIMD와 MIMD의 균형 - Intel CTO가 말한다.

 

 

[정보분석](암달의 법칙) 2010년대 100 코어 CPU 시대를 향해서 달리는 CPU 제조사

 

 

[분석정보] GDC 2009 드디어 소프트 개발자 정보도 나온 "Larrabee"

 

 

[정보분석] Intel 힐스보로가 개발하는 CPU 아키텍처의 방향성

 

 

[정보분석] 팀스위니 미래의 게임 개발 기술. 소프트웨어 렌더링으로 회귀

 

 

[분석정보] 정식 발표된 라라비(Larrabee) 아키텍처

 

 

[아키텍처] 베일을 벗은 인텔 CPU & GPU 하이브리드 라라비(Larrabee)

 

 

[정보분석] 암달의 법칙(Amdahl's law)을 둘러싼 Intel과 AMD의 싸움

 

 

[정보분석] 모든 CPU는 멀티 스레드로, 명확하게 된 CPU의 방향