GPGPU 4

[분석정보] GPU 컴퓨팅 기능을 강화한 Skylake의 GPU

GT2 구성이 기본이 되는 Intel 그래픽 Intel은 Skylak 세대에서 GPU 코어의 기본적인 부분을 확장했다. 그렇긴 하지만, Skylake GPU 코어 자체의 구성은 Broadwell GPU 코어와 아주 비슷하다. GPU 코어 전체에서 공유하는  "언 슬라이스 (Un-Slice) "와 미디어 엔진군과 GPU 코어의 안에서 확장으로 병렬화 하는 "슬라이스 (Slice) "가 있다. GPU 코어의 연산 코어 "EU (execution unit)"는 내부에 합계 8개의  32-bit 단정밀도 부동 소수점 적화산 유닛을 갖추고 있다. EU는 32-bit 단정밀도 4-way의 벡터 유닛이 2개 구성되어 있는 것으로 보인다 (1EU = 8 x 2 (FMA) = 8Flops.  EU 수 x 16Flops ..

[분석정보] Larrabee에 쫓기는 NVIDIA가 GT200에게 입힌 GPGPU용 확장

좁히는 Intel의 Larrabee에 대응을 서두르는 NVIDIA의 CUDA 전략 Intel은 데이터 병렬 + 태스크 병렬형 프로세서인 "Larrabee (라라비)"의 준비를 진행하고 있다. 올 여름 아키텍처의 개요를 분명히 하고 내년 (2009년)에는 제품 출시 예정이다. Intel은 당초 Larrabee를 고성능 컴퓨팅 (HPC)용으로 설명을 하고 있었지만, 실제로는 그래픽 제품에 투입한다. 이것은 NVIDIA가 그래픽 카드로 볼륨을 출하해 ​​범용 컴퓨팅에도 사용할 수 있는 프로세서를 보급시키는 전략을 답습하는 것이다. Intel은, 실은 Larrabee 전략의 처음부터 그래픽 제품으로 보급할 계획이었다. 즉, 그래픽 제품으로 전략을 전환한 것이 아니라 처음부터 그래픽으로 판매 계획이었다. 그러나 ..

[분석정보] 지포스 GTX 280 배정밀도 부동 소수점 연산

배정밀도 부동 소수점 연산의 4개 포인트 NVIDIA는 CUDA와 G80 아키텍처는 고성능 컴퓨팅 (HPC)에서 어느 정도의 성공의 발판을 잡았다. 이렇게 한 NVIDIA에 있어서, 배정밀도 부동 소수점 연산 지원은 필수적인 요소이다. HPC 응용 프로그램은 배정밀도가 필요한 국면이기 때문이다. GPU 컴퓨팅을 위한 Tesla 제품에서는 배정밀도 연산은 열쇠가 된다고 해도 좋다. "지금까지도 배정밀도의 벽으로 이식할 수 없었던 응용 프로그램이 꽤 있었다"고 NVIDIA는 필요성을 강조한다. 문제는 현재의 실시간 그래픽에서는 단정밀도 (32-bit)까지의 부동 소수점 연산을 필요로 하는 것. 따라서 지금까지의 GPU는 단정밀도 연산 유닛 밖에 구현하지 않고, GPU에서 배정밀도 연산 지원에는 몇 가지 포인..

[고전 2004.11.15] 시리얼이 되는 FSB와 메모리. CTO Gelsinger 인터뷰 2/2부

Intel의 연구 부문을 총괄하는 Patrick P. Gelsinger (팻 · P · 겔싱어) CTO 겸 수석 부사장 (CTO & Senior Vice President)에게 향후 CPU 개발의 방향성을 듣는 인터뷰의 2번째. 10월의 일본 방문시 인터뷰를 베이스로, 9월의 Intel Developer Forum (IDF)시의 내용도 약간 추가되어 있다. Patrick P. Gelsinger 씨 모든 인터페이스는 시리얼로 [Q] CPU의 멀티 코어화는 메모리 대역폭과 FSB (Front Side Bus)의 확장을 요구하는 것이다. 멀티 코어화를 통해 무어의 법칙을 넘어 CPU가 고성능화 하면 메모리와 FSB도 급격히 가속화 해야 한다고 예측하고 있다. [Gelsinger] 그 관점은 같다. 향후 프로세..