벤치리뷰·뉴스·정보/리뷰·벤치·제품

[벤치리뷰] 지포스 GTX 750Ti,GTX 750,라데온 14종 벤치

tware 2014. 2. 20. 12:30

 

 

 

GTX 750 Ti 레퍼런스 카드

 

 

GV-N75TOC-2GI (GTX 750 Ti)

 

 

GV-N75OC-1GI (GTX 750)

 

 

GTX 750 Ti GPU, GM 107-400-A2

 

 

GTX 750 GPU GM107-300-A2

 

 

Kepler 세대의 GPU는 쉐이더 프로세서 "CUDA Core"192 개를 중심으로 스케줄러와 로드 / 스토어 유닛, 초월 함수 단위, L1 캐시, 텍스처 유닛 지오메트리 엔진 등을 한 덩어리로 하는 연산 유닛 "Streaming Multiprocessor eXtreme"( 다음, SMX)를 기본 단위로 하고 있었다. 이에 비해 1 세대 Maxwell에서 새롭게 "Maxwell Streaming Multiprocessor "(이하 SMM )가 기본 단위이며, 그 내용도 32 개의 CUDA Core 스케줄러와 로드 / 스토어 유닛, 초월 함수 유닛과 세트가 파티션으로 4 기 내포하는 사양으로 수정 한 것이 큰 특징이다.

 

 32 개의 CUDA Core를 내장한 파티션이 4 개이기 때문에, SMM 당 CUDA Core 수는 128 개. SMM 당 4 개의 Warp 스케쥴러가 제공되는 점이나, 1 개의 지오메트리 엔진이 결합된 것은 Kepler 세대부터 변함 없지만, 텍스처 유닛 수는 8 개에서 Kepler 세대에서 반감되고 있다.

 

 

 

1세대 케플러

 

 

1세대 맥스웰

 

 

GM107

 

여러 SMM이 래스터 라이저와 세트가되어 "미니 GPU"인 "Graphics Processing Clusters"(이하 GPC)를 구성하는 것도 Kepler 세대와 같지만, GM107는 최대 5 개의 SMM에서 GPC를 구성하는 방법이다. Kepler 세대는 1 ~ 3 개의 SMX에서 GPC를 구성하고 있었으므로, GPC 구조는 대단히 간소화 된 셈이다.
 덧붙여서 GTX 750 Ti는 SMM이 5 개이므로 총 CUDA Core 수는 32 × 4 × 5 640 기. 한 GTX 750는 SMM가 4 개이며, 32 × 4 × 4 512 기라고 계산된다.

 

 

표1 각 제품별 사양.

 

라데온  "HD 7770 ≒ R7 250X ",  "HD 7790  ≒ R7 260X" , "HD 7850 ≒ R7 265(R7 370)" 이며,

"HD 7870 ≒ R9 270 (R9 270X ,R9 370X)", HD 7950 ≒ R9 280, HD 7970 ≒ R9 280X 입니다.

HD 7790 (R7 260X)만 GCN 1.1 (2.0)이고 (사골), 나머지는 GCN 1.0 으로 서로간에 DirectX 지원이 다릅니다.

GCN 1.0은 Directx 12 피쳐레벨 11_1 지원. GCN 1.1(2.0)은 피쳐레벨 12_0 입니다.

R7 260X (HD 7790) 에서 SP를 조금 깎으면  R7 260 ≒ R7 360

다만 리네이밍 제품들은 비디오 메모리 용량이 늘어난 제품도 있습니다.

 

물론 GCN 1.0도 게임에 따라서 DirectX 12 로 돌아가지만, 엄밀하게 말하면 DX12 (피쳐레벨 12_0)를 지원하지 않습니다. DX11과 DX12를 동시에 지원하는 게임에서 DX12로 구동이 되느냐 안되느냐는 게임에 따라 다릅니다. 해당 게임의 DX12가 Direct3D 피쳐레벨을 어디까지 요구하는가? 더 자세히는 DirectX 세부 기능을 어디까지 요구하는가에 따르는 것이죠. 최신 게임은 DirectX 12로 구동을 하려면 DirectX 피쳐레벨 12_0을 요구하기에 GCN 1.0인 HD 7000 (RX 200/300 리네이밍 포함.) 시리즈는 불가 합니다.

 

지포스의 경우는 지포스 600 시리즈 부터 GTX 700 시리즈 (750/750ti 제외) 까지 큰 분류로는 같은 수준인 DirectX12 피쳐레벨 11_0 을 지원하지만, 세부 기능은 GTX 750/750ti가 더 높게 지원하기 때문에, 지포스 GTX 600/700 시리즈에서 DX12로 못돌리는 게임이 지포스 GTX 750/750ti에서는 DX12로 구동이 가능 합니다. 또한 지포스 750의 일부 후기 제품은 지포스 900 시리즈와 동일하게 피쳐레벨 12_1을 지원 합니다. GTX 750 후기형은 이름은 GTX 750 이지만, 실제로는 없는 제품이지만 사실상 GTX 940 같은 제품이기 때문이죠.

 

참고로 라데온 6000 시리즈 까지는 스펙에 비해서 실제 성능이 나오지 않는 AOS 방식을 사용하다가 (드라이버 최적화가 어려움), 라데온 7000 시리즈 GCN 아키텍쳐 부터는 엔비디아가 지포스 8 (8800, 8600 등) 시리즈 부터 사용했던 SOA 방식으로 바꾸면서, 실제 성능이 스펙에 근접하게 나오게 되었습니다. 게임 그래픽은  단순히 SP 연산 성능만으로 (Flops) 나오는게 아닌, 기타 텍스쳐 유닛이나 ROP 유닛, 테셀레이터, 내부 캐시, 내부 버스 구조, 메모리의 성능도 중요하지만 말이죠. 여기에 드라이버 최적화 까지.

 

어쨌든 과거에 비해서는 나아졌다는 겁니다. 예를 들면 라데온 HD 6870 같은 제품이 단순 Flops 수치로는 지포스 560의 2배 가까이 되는데, 실제 성능은 두 제품이 비슷하죠. 그런데 라데온 7000 시리즈 부터는 이정도 까지의 차이가 아닌, 라데온이 Flops 수치가 약간 앞서면 지포스와 동등한 수준이 됩니다.다.

 

 

https://youtu.be/Cetlia4pjFo

지포스 GTX 660 2GB 문명6 DirectX 12 구동. VRAM 2GB 정도 필요.

이렇게 게임에 따라서 지포스 600/700 시리즈도 DirectX 12로 구동 됩니다.

지포스 500 시리즈와 라데온 6000 시리즈 이하는 DirectX 11로 구동해야 합니다.

 

 

https://youtu.be/6TaIZk1x3Oo?t=186s

추가로 비교 대상으로 지포스 GTX 560 1GB 문명6 DirectX 11 구동.

적당히 옵션을 주면 나름 잘 돌아갑니다.

 

 

https://youtu.be/Lrh_X-BRTzQ?t=36s

역시 비교 대상으로 Q9650 3Ghz R7 360 2GB 문명6 DirectX 12 구동.

위 2개는 CPU가 Q6600 3Ghz로 오버이고 이 영상은 Q9650 3Ghz 인게 다릅니다.

Q9650 3Ghz가 Q6600 오버 3Ghz 보다 게임등에서 프레임이 더 잘 나옵니다.

문명6 세가지 영상 모두 메인 메모리는 8GB 입니다.

 

 

https://www.youtube.com/watch?v=7TT4ILKXclU&list=PLrM38DyM-7HdAzjcsaOFs4FPHAcbjzm5N

Q6600 라데온 HD 7850 (R7 265, R7 370) 월드 오브 워크래프트 DX 12 구동.

지포스 600/700 시리즈는 DirectX 12로 구동하지 못 하고 DX11로 돌려야 합니다.

다만 지포스 700 시리즈 중 GTX 750/750TI 은 DirectX 12로 구동이 가능 합니다.

와우의 DirectX 12 모드는 D3D12 리소스 바인딩 티어3을 요구하는데,

지포스 600/700 시리즈는 리소스 바인딩 티어2 까지만 지원하고,

지포스 GTX 750/750TI 와 라데온 7000 시리즈 부터 티어3를 지원하기 때문이죠.

 

인텔 내장그래픽의 경우 스카이 레이크 내장 그래픽부터 피쳐레벨 12_1을 지원 합니다. 지포스는 900 시리즈 부터 피쳐레벨 12_1 을 지원 하구요.

 

다만 와우에서 DX11로 구동할 때와 DX12로 구동할 때를 비교해 보면,

DX12가 성능이 더 잘 나오지만, 그만큼 V램도 1.6-1.7배 정도 더 많이 요구 합니다.

적당한 옵션으로 DX12로 구동하려면, 최소 2GB의 VRAM이 필요 합니다.

DX11은 적당한 옵션으로(텍스처 보통)구동하면 1GB의 VRAM으로도 충분하죠.

 

 

https://youtube.com/watch?v=KEwzDY-Syas&list=PLrM38DyM-7HfHiFCeGKv2b6zmcE_FAtbf

Q6600 지포스 GTX 660 월드 오브 워크래프트 DirectX 11 구동.

DirectX 11 모드는, 와우에서 DX11 과 DX11 Legacy에 가 있는데, 장소에 따라서 어느 한쪽이 더 프레임이 높다는 겁니다. 와우 DX12는 이런게 없죠.

 

 

 

GTX 750 Ti 레퍼런스 카드 (6핀 보조 전원이 없다) 카드길이 146mm

 

 

 

HDMI mini Type C , Uual-Link DVI-D, Dual-Link DVI-I

(설명을 하면, DVI-D는 디지탈 전용으로 D-sub 젠더를 써서 아날로그로 사용이 불가능 합니다. 흔히 말하는 VGA 포트를 못 쓴다는 얘기죠. (여기서 말하는 젠더는 1천원 몇천원짜리 젠더를 말하는 겁니다. 아예 신호 자체를 바꿔주는 몇만원 짜리 컨버터를 말하는게 아닙니다. 컨버터를 쓰면 당연히 D-sub 연결 가능 합니다.)

 

DVI-I 단자는 아날로그도 (D-sub 신호) 나오기 때문에 젠더를 끼워서 D-Sub 출력이 가능하구요. DVI 단자의 우측 + 모양 주변 구멍을 보고 구분하시면 됩니다 (이부분과 최상단 최우측 핀에서 D-sub 신호가 나옴). 이것과 별도로 중앙의 6개 부분이 비어 있는 것들도 있는데 그런 것들은 싱글링크 입니다.

 

다만 당연한 얘기인데, 포트가 DVI-I라 해도 아날로그 연결이 실제로 안되어 있다던가 GPU 자체에서 아날로그를 지원 안한다던가... 포트는 듀얼링크 인데 실제 연결은 싱글링크로 되어 있다던가 라면 당연히 지원은 안되는 겁니다. 거의 대부분은 지원에 맞는 단자를 쓰는데, 간혹 그렇지 않은 경우가 있습니다.)

 

 

 

기가바이트 GV-N75TOC-2GI (750 Ti) 카드길이 188mm

 

 

 

750Ti의 TDP는 60W로 6핀 전원이 필요없지만,

오버클럭에 대응하기 위해 6핀 보조 전원이 필요

 

 

 

HDMI Type A x 2 , Dual Link DVI-D, Dual Link DVI-I

 

 

 

기가바이트 GV-75OC-1GI (GTX 750) 카드길이 172mm

 

 

 

 

 

6핀 전원이 필요

 

 

750Ti와 같은 포트 구성

 

 

테스트 환경 설정에 들어 가자.
 이번 주역이 되는 그래픽 카드가 3장부터, GTX 750 Ti는 레퍼런스 카드를 사용하여 레퍼런스 클럭에서의 검증을 실시하면서 GV-N75TOC-2GI 카드로 정격 클럭에서도 테스트를 실시한다. GTX 750은 입수한 GV-N75OC-1GI가 오버 클럭 모델이기 때문에, 카드의 정격 사양뿐만 아니라, MSI 제의 오버 클러킹 툴 「Afterburner」(Version 2.3.1)을 이용하여 동작 클럭을 레퍼런스 상태까지 낮춘 상태에서도 테스트를 실시하기로 했다.

 

다음 벤치 마크 점수 단락에서는 "동작 클럭을 레퍼런스 상당까지 낮춘 GV-N75OC-1GI"를 「GTX 750」라고 표기하기 때문에,이 점에 주의를. 그런 GTX 750 Ti와 GTX 750의 비교 대상으로 준비한 것이 표1 에 이름을 올린 GPU이다. 현행 모델과 최근에 유통되고 있던 모델에서 GTX 750 Ti와 GTX 750의 비교 대상으로 적절하다고 생각되는 것을 최대한 준비하면 10 제품이 정도이다.  

 

또한 준비한 카드 중 Sapphire Technology 제의 HD 7790 탑재 카드 "SAPPHIRE HD7790 1G GDDR5 PCI - E DL - DVI - I + DL - DVI - D / HDMI / DP DUAL - X OC VERSION"등의 일부 카드는 제조업체 수준에서 동작 클럭을 올린 오버 클럭 모델 때문에, 그 경우 역시 Afterburner에서 동작 클럭을 레퍼런스 상당까지 내렸다.

 

 그 외 테스트 환경은 표 2 와 같다. GeForce 테스트에 사용된 그래픽 드라이버는 NVIDIA에서 전세계 리뷰어에 배포한 "GeForce 334.69 Driver"가 된다. 버전 표기로 하려면 테스트 시작 시점의 공식 최신 β 판 드라이버 " GeForce 334.67 Driver Beta"를 베이스로, 새로운 세대 GPU에 대한 대응을 한 것이라는 이해를 하면 좋다. 한편, Radeon 테스트에 이용한 것은 테스트 시작시의 공식 최신 β 판이되는 "Catalyst 14.1 Beta1.6"이다.

 

 

 

표2

 

또한 이것은 필자의 GPU 리뷰 기사에서 일반적인 설정이지만, CPU 자동 오버 클럭 기능 "Intel Turbo Boost Technology '는 그 효과로 인해서 테스트에 따라 달라질 가능성을 배제하기 위해 마더 보드 UEFI (≒ BIOS)에서 비활성화 하고 있다.

 

다음 그래프 내에서만 GV-N75TOC-2GI을 "GBT 750 Ti OC"GV-N75OC-1GI을 "GBT 750 OC '로 표기하는 것 (기본 사양은 표1과 같은 것인데.. 즉 레퍼런스 750Ti는 코어클럭 1020MHz,부스트 1085MHz이지만 기가바이트 GV-N75TOC-2GI는 코어클럭 1033MHz,부스트 1085MHz 제품이고, 750은 코어클럭 1020MHz,부스트 1085MHz인데 GV-N75OC-1GI는 코어클럭 1058MHz, 부스트는 미공개 입니다. 그렇게 크게 오버된 상태가 아닙니다. 즉 이 제품들은  오버클럭이 되어 있다 가 아닌.. 오버를 할 수 있게 보조전원도 달고 그렇게 만들어진 제품이다 라고 보시면 됩니다.)

 

(그래프는 2종류로 되어 있습니다. 하나는  그래프 상의 카드 이름 순서대로 된 그래프, 하나는 성능순으로 정렬된 그래프 인데... 여기서는  카드 이름순으로 된 그래프를 올립니다. 물론 성능순으로 된 그래프가 조금 더 보기 편할수도 있는데.... 많은 분들이 이게 더 좋을 겁니다. 저도 마찬가지구요. 다만 약간의 색각 이상이 있으신 분들은 그런것이 오히려 더 불편할 수 있기 때문에.....  그래프 상에서 이름이 적힌 순서대로 성능이 나오는 그래프로 올립니다. )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

GTX 750 Ti와 GTX 750이 가진 가장 큰 매력 중 하나가 순서대로 불과 60W, 55W라는 TDP이다. "TDP = 실제 전력"은 아니지만, 100W 초과가 당연되고 있는 엔트리 미들 클래스 GPU 시장에 있어, 보조 전원이 필요하는 것의 영향은 헤아릴 수 없다. 그럼 실제 소비 전력은 어느 정도인가?

 

 

시스템 소비전력 아이들부터 각 게임별

 

 

온도. 아이들 / 고부하시

 

 

[벤치리뷰] Tech Power UP 지포스 960 & 지포스 라데온 벤치마크

 

 

[벤치리뷰] Radeon R9 380X 리뷰