벤치리뷰·뉴스·정보/리뷰·벤치·제품

[벤치리뷰] 인텔 제온 파이 5110P와 엔비디아 테슬라 K20 행렬 곱 실효 성능 비교

tware 2013. 3. 29. 22:00





평가 환경
 노드 수

폼팩터
타워형 (4U 랙 마운트) 
 프로세서
인텔 제온 프로세서 E5-2687W @ 3.10GHz x 2CPUs 
 메모리 64GB DDR3 
 GPGPU 카드
엔비디아 테슬라 K20M 
컴파일러
PGI Accelerator Fortran / C / C + + Workstation 2013 (13.3) 
 수치연산 라이브러리
인텔 MKL 11.0 Update 1 
 GPU용 수치계산 프로그램 라이브러리   CUBLAS (CUDA Toolkit 5.0 포함)
 OS CentOS 6.2 x86_64  







평가 환경
 노드 수
 폼팩터   타워형 (4U 랙 마운트)
 프로세서 인텔 제온 프로세서 E5-2687W @ 3.10GHz x 2CPUs  
 메모리 64GB DDR3 
 코 프로세서  인텔 Xeon Phi 5110P
 컴파일러   인텔 Composer XE 13.0 Update 1
수치연산 라이브러리
  인텔 MKL 11.0 Update 1
MPI
  Intel MPI 4.1
OS
  Red Hat Enterprise Linux 6.3


행렬 곱 프로그램을 CUDA5 (Kepler 최적화)에서 이용 가능하게 되었다. Shared Memory 뱅크 크기를 설정하는 cudaDeviceSetSharedMemConfig 함수에서 4 바이트 / 8 바이트를 모두 시도하고 벤치마킹에서는 빠른 것을 일관되게 사용.


  정밀도
N 계산시간(초)
GFlop
(연산해야
할 양)
GFlops
(실제 초당 성능)
(하드웨어)
이론성능
실행효율
E5-2687W x 2 MKL
10000
 2.58 1863
 722.12 793.60
 91.0%
  Phi 5110P x 1 MKL(native 실행)
 10000  1.25  1863  1486.28 2021.76
73.5%
  K20 x 1 CUBLAS
 10000  1.17  1863  1589.46 3520.00 45.2%
  K20 x 1 CUBLAS (호스트 - K20 사이
전송시간 제외)
 10000  0.81  1863  2292.49 3520.00
65.1%




배정밀도
 N 계산시간(초)
GFlop
(연산해야
할 양)

GFlops
(실제 초당 성능)
(하드웨어)
이론성능

실행효율
E5-2687W x 2 MKL  10000  5.53  1863 336.91
396.80 84.9%
  Phi 5110P x 1 MKL(native 실행)  10000  2.53  1863  736.95 1010.88 72.9%
K20 x 1 CUBLAS  10000  2.64  1863  704.34 1170.00
 60.2%
  K20 x 1 CUBLAS (호스트 - K20 사이
전송시간 제외)
 10000  1.93  1863  965.26 1170.00
82.5%


2013년 3월 29일 (여기서 테스트 된 것중 가장 최근 것 입니다.)



[벤치리뷰] N형 문제 프로그램의 인텔 제온 파이 이식 평가




[분석정보] 매니코어 프로세서로 손바닥 슈퍼 컴퓨터를 실현



[분석정보] TOP500 슈퍼컴퓨터 순위 2013년 6월



[분석정보] 4만 8000개의 제온파이로 중국 톈허2 세계에서 가장 빠른 슈퍼 컴퓨터



[정보분석] 인텔 60코어 매니코어 "Xeon Phi" 정식발표



[분석정보] 인텔 슈퍼컴퓨터용 가속기 Xeon Phi 5110P 발표



[분석정보] Intel, HPC 전용 보조 프로세서 Xeon Phi 2013년 1월부터 일반용으로 출시



[분석정보] IDF 2012에서 주목한 한가지, 매니 코어 "Knights Corner"



[정보분석] 엔비디아 세계 최다 트렌지스터 칩 GK 110 공개



[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 1/2부



[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 2/2부



[정보분석] 같은 무렵에 시작된 Nehalem과 Larrabee와 Atom



[분석정보] Intel은 Larrabee 계획과 아키텍처를 어떻게 바꾸나?



[분석정보] 다시 처음부터 시작된 라라비 무엇이 문제였나?



[분석정보] 라라비 (Larrabee)의 비장의 카드 공유 가상 메모리



[분석정보] 인텔의 스칼라 CPU + 라라비의 이기종 CPU 비전



[분석정보] Larrabee는 SIMD와 MIMD의 균형 - Intel CTO가 말한다.



[정보분석](암달의 법칙) 2010년대 100 코어 CPU 시대를 향해서 달리는 CPU 제조사



[분석정보] GDC 2009 드디어 소프트 개발자 정보도 나온 "Larrabee"



[분석정보] 그래픽 및 DirectX 로드맵을 정리



[정보분석] Intel 힐스보로가 개발하는 CPU 아키텍처의 방향성



[정보분석] 팀스위니 미래의 게임 개발 기술. 소프트웨어 렌더링으로 회귀



[분석정보] 정식 발표된 라라비(Larrabee) 아키텍처



[아키텍처] 베일을 벗은 인텔 CPU & GPU 하이브리드 라라비(Larrabee)



[정보분석] 암달의 법칙(Amdahl's law)을 둘러싼 Intel과 AMD의 싸움



[정보분석] 모든 CPU는 멀티 스레드로, 명확하게 된 CPU의 방향