[벤치리뷰] 인텔 제온 파이 5110P와 엔비디아 테슬라 K20 행렬 곱 실효 성능 비교

벤치리뷰·뉴스·정보/리뷰·벤치·제품

[벤치리뷰] 인텔 제온 파이 5110P와 엔비디아 테슬라 K20 행렬 곱 실효 성능 비교

tware 2013. 3. 29. 22:00

평가 환경
노드 수	1
폼팩터	타워형 (4U 랙 마운트)
프로세서	인텔 제온 프로세서 E5-2687W @ 3.10GHz x 2CPUs
메모리	64GB DDR3
GPGPU 카드	엔비디아 테슬라 K20M
컴파일러	PGI Accelerator Fortran / C / C + + Workstation 2013 (13.3)
수치연산 라이브러리	인텔 MKL 11.0 Update 1
GPU용 수치계산 프로그램 라이브러리	CUBLAS (CUDA Toolkit 5.0 포함)
OS	CentOS 6.2 x86_64

평가 환경
노드 수	1
폼팩터	타워형 (4U 랙 마운트)
프로세서	인텔 제온 프로세서 E5-2687W @ 3.10GHz x 2CPUs
메모리	64GB DDR3
코 프로세서	인텔 Xeon Phi 5110P
컴파일러	인텔 Composer XE 13.0 Update 1
수치연산 라이브러리	인텔 MKL 11.0 Update 1
MPI	Intel MPI 4.1
OS	Red Hat Enterprise Linux 6.3

행렬 곱 프로그램을 CUDA5 (Kepler 최적화)에서 이용 가능하게 되었다. Shared Memory 뱅크 크기를 설정하는 cudaDeviceSetSharedMemConfig 함수에서 4 바이트 / 8 바이트를 모두 시도하고 벤치마킹에서는 빠른 것을 일관되게 사용.

단정밀도	N	계산시간(초)	GFlop (연산해야 할 양)	GFlops (실제 초당 성능)	(하드웨어) 이론성능	실행효율
E5-2687W x 2 MKL	10000	2.58	1863	722.12	793.60	91.0%
Phi 5110P x 1 MKL(native 실행)	10000	1.25	1863	1486.28	2021.76	73.5%
K20 x 1 CUBLAS	10000	1.17	1863	1589.46	3520.00	45.2%
K20 x 1 CUBLAS (호스트 - K20 사이 전송시간 제외)	10000	0.81	1863	2292.49	3520.00	65.1%

더블클릭을 하시면 이미지를 수정할 수 있습니다

배정밀도	N	계산시간(초)	GFlop (연산해야 할 양)	GFlops (실제 초당 성능)	(하드웨어) 이론성능	실행효율
E5-2687W x 2 MKL	10000	5.53	1863	336.91	396.80	84.9%
Phi 5110P x 1 MKL(native 실행)	10000	2.53	1863	736.95	1010.88	72.9%
K20 x 1 CUBLAS	10000	2.64	1863	704.34	1170.00	60.2%
K20 x 1 CUBLAS (호스트 - K20 사이 전송시간 제외)	10000	1.93	1863	965.26	1170.00	82.5%

2013년 3월 29일 (여기서 테스트 된 것중 가장 최근 것 입니다.)

[벤치리뷰] N형 문제 프로그램의 인텔 제온 파이 이식 평가

[분석정보] 매니코어 프로세서로 손바닥 슈퍼 컴퓨터를 실현

[분석정보] TOP500 슈퍼컴퓨터 순위 2013년 6월

[분석정보] 4만 8000개의 제온파이로 중국 톈허2 세계에서 가장 빠른 슈퍼 컴퓨터

[정보분석] 인텔 60코어 매니코어 "Xeon Phi" 정식발표

[분석정보] 인텔 슈퍼컴퓨터용 가속기 Xeon Phi 5110P 발표

[분석정보] Intel, HPC 전용 보조 프로세서 Xeon Phi 2013년 1월부터 일반용으로 출시

[분석정보] IDF 2012에서 주목한 한가지, 매니 코어 "Knights Corner"

[정보분석] 엔비디아 세계 최다 트렌지스터 칩 GK 110 공개

[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 1/2부

[정보분석] IDF 2011 Justin Rattner 기조연설 매니코어 시대가 다가옴 2 /2부

[정보분석] 같은 무렵에 시작된 Nehalem과 Larrabee와 Atom

[분석정보] Intel은 Larrabee 계획과 아키텍처를 어떻게 바꾸나?

[분석정보] 다시 처음부터 시작된 라라비 무엇이 문제였나?

[분석정보] 라라비 (Larrabee)의 비장의 카드 공유 가상 메모리

[분석정보] 인텔의 스칼라 CPU + 라라비의 이기종 CPU 비전

[분석정보] Larrabee는 SIMD와 MIMD의 균형 - Intel CTO가 말한다.

[정보분석](암달의 법칙) 2010년대 100 코어 CPU 시대를 향해서 달리는 CPU 제조사

[분석정보] GDC 2009 드디어 소프트 개발자 정보도 나온 "Larrabee"

[분석정보] 그래픽 및 DirectX 로드맵을 정리

[정보분석] Intel 힐스보로가 개발하는 CPU 아키텍처의 방향성

[정보분석] 팀스위니 미래의 게임 개발 기술. 소프트웨어 렌더링으로 회귀

[분석정보] 정식 발표된 라라비(Larrabee) 아키텍처

[아키텍처] 베일을 벗은 인텔 CPU & GPU 하이브리드 라라비(Larrabee)

[정보분석] 암달의 법칙(Amdahl's law)을 둘러싼 Intel과 AMD의 싸움

[정보분석] 모든 CPU는 멀티 스레드로, 명확하게 된 CPU의 방향

'벤치리뷰·뉴스·정보 > 리뷰·벤치·제품' 카테고리의 다른 글

[벤치리뷰] 2013년 4월 VGA (GPU) 등급 (0)	2013.04.19
[벤치리뷰] N형 문제 프로그램의 인텔 제온 파이 이식 평가 (0)	2013.04.09
[벤치리뷰] 모바일,서피스프로, 엔비디아 GPU 벤치 (0)	2013.04.07
[벤치리뷰] x86 ARM 크로스 플렛폼 그래픽 벤치마크 (0)	2013.04.04
[벤치리뷰] 게임용 CPU 2013년 3월 (0)	2013.03.21
[벤치리뷰] 코어 i7-4770K 하스웰 성능,프리뷰 (0)	2013.03.19
[모바일 뉴스] 일본 에이서, Windows 8 태블릿 "ICONIA W510"용 키보드 독 (0)	2013.03.01
[벤치리뷰] 새로운 옵테론 6300 (0)	2013.02.20

현재글[벤치리뷰] 인텔 제온 파이 5110P와 엔비디아 테슬라 K20 행렬 곱 실효 성능 비교

tware 리뷰/벤치마크/뉴스

시세, amd, 가격, 가격조사, CPU 시세, 매니코어, Xeon Phi, World of Warcraft, 아이테니엄, 시장, 아톰, IDF, CPU 가격, 월드 오브 워크래프트, 라라비, 인텔, 제온파이, 브로드웰, CPU 조사, CPU 시장,

tware 리뷰/벤치마크/뉴스

[벤치리뷰] 인텔 제온 파이 5110P와 엔비디아 테슬라 K20 행렬 곱 실효 성능 비교

'벤치리뷰·뉴스·정보 > 리뷰·벤치·제품' 카테고리의 다른 글

'벤치리뷰·뉴스·정보/리뷰·벤치·제품'의 다른글

티스토리툴바

« 2024/12 »
일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

[벤치리뷰] 인텔 제온 파이 5110P와 엔비디아 테슬라 K20 행렬 곱 실효 성능 비교

'벤치리뷰·뉴스·정보 > 리뷰·벤치·제품' 카테고리의 다른 글

'벤치리뷰·뉴스·정보/리뷰·벤치·제품'의 다른글

관련글

티스토리툴바