벤치리뷰·뉴스·정보 1110

[분석정보] 드디어 밝혀진 AMD의 불도저 (Bulldozer)

컴팩트하고 전력 효율이 높은 Bulldozer ISSCC2011의 회장이 된 샌프란시스코 메리어트 호텔 AMD는 미국 샌프란시스코에서 지난 주 개최된 반도체 컨퍼런스 "ISSCC (IEEE International Solid-State Circuits Conference) 2011 '에서 새로운 아키텍처 CPU"Bulldozer (불도저) "디자인의 개요를 밝혔다. ISSCC에서 3 개의 세션에서 공개 된 Bulldozer의 모습은 설계대로라면 이 새로운 CPU가 상당한 경쟁력을 가질 것을 보여주었다. ISSCC에서 밝혀진 것은 Bulldozer 다이 평면도 정보 및 각 모듈의 개요, 상대적으로 작은 모듈 크기, 3.5GHz 이상을 달성하는 고클럭화 디자인과 높은 처리량을 제공하는 부동 소수점 ( FP)..

[업계동향] 인텔 14nm 세대에 50억 달라를 들여 새로운 제조 시설을 애리조나에 건설

미국 Intel은 18 일 (현지 시간) 미국 애리조나 주에 "팹 42 '로 불리는 반도체 제조 시설을 신설한다고 발표했다.(50억달러 1달러 1천원 계산시 5조원) 팹 42은 14nm 공정에서 제조 가능한 최첨단 반도체 제조 시설에이를 전망이며, 2013 년 완공 예정이다. 회사 사장 겸 최고 경영자 (CEO) 폴 오텔리..

[분석정보] ARM버전 Windows로 시작된 x86 대 ARM의 CPU전쟁

x86 대 RISC 전쟁의 재현과 같은 x86 대 ARM x86 CPU는 PC & 서버에서 모바일로. ARM 등 임베디드 CPU는 모바일 및 임베디드에서 컴퓨팅으로. 그 틈인 태블릿이 주 전장으로. 그리고 PC OS를 쥐고 있는 Microsoft는 차기 Windows를 ARM에 싣는다. 양상은 x86 대 ARM의 CPU 전쟁으로 이동하기 시작했다. 이것은 예전의 x86 대 RISC (Reduced Instruction Set Computer) 군의 CPU 전쟁을 연상시키는 전개이다. 10여년 전에도 Alpha, PowerPC, MIPS, PA-RISC 같은 고성능 RISC CPU 군이 일어나. Microsoft도 Windows NT에서 x86뿐 아니라 Alpha, MIPS, 또한 PowerPC를 지원했다..

[벤치리뷰] 인텔 샌디브릿지 공개 코어 i7 2600k, i5 2500k, i5 2400, i3 2100 CPUs

인텔 2세대 코어 시리즈인 샌디브릿지 기사입니다. 자세한 사항은 원사이트에서 확인하시고 간단히 기사를 살펴보겠습니다. i7 2600K 4.9GHz는 오버클럭된 것 입니다. 나머지는 다 기본클럭이구요. 시스템 전력소모 입니다. 빨강 로드시(폴딩앳홈 구동시), 파랑 아이들 다른 벤치와 다르게 일단 전력소모부터 보여주고 시작하는군요. 산드라 벤치마크 중 메모리 대역폭 벤치마크 입니다. 단위는 GB/s (원글도 이것 뿐입니다.) 요즘은 많이 잊혀진 산드라 벤치마크 프로그램 입니다. 산드라는 프로그램으로 테스트 해서 나오는 결과 전체가 몹쓸 것은 아닌데.. 이게 실제 게임이나,사무 프로그램이나,그래픽 프로그램들을 실제로 돌렸을때랑 결과 차이가 좀 있다보니 조금 잊혀졌죠. 요즘 산드라뿐만 아니라, 시스마크나, 3D..

[와우] 월드 오브 워크래프트 대격변 최소/권장사양.

대격변 PC 최소사양,권장사양. 오리지날 시절 윈도98/Me도 지원했지만 세월이 흐름에 따라 윈도7을 지원하며 최소사양은 1GB 메모리 이지만, 실제로는 XP 512MB PC에서도 작동.(메모리 최대 확보 필수,백신등 off) 게임을 매우 부드럽게 즐기기 위해서는 인텔 코어2듀오 2.4G 또는 AMD64x2 2.6G 이상의..

[분석정보] 범용 컴퓨팅을 강화한 Sandy Bridge의 그래픽

비 그래픽 프로그램을 실행시키기 위한 코어 Intel의 차기 CPU "Sandy Bridge (샌디 브릿지)"에 내장된 그래픽 코어는 전체 구조는 기존의 Intel 그래픽을 계승하고 있지만, 내부 구조는 크게 변경되어있다. 3D 그래픽과 범용 컴퓨팅 및 미디어 프로세싱의 3 분야 각각의 처리를 높이기 위해 프로세서와 주변 기능이 대폭 강화되고 있다. 그 중에서도 눈에 띄는 것은 범용 컴퓨팅을 위한 확장. Intel은 Sandy Bridge 그래픽 코어는 레지스터 파일을 증대시켜 레지스터를 많이 필요로 하는 범용 컴퓨팅에서도 레지스터가 넘쳐 메모리 액세스가 발생되기 어렵게 했다. 그러나 그것만이 아니다. Sandy Bridge 그래픽 코어는 다른 중요한 범용 컴퓨팅을 위한 확장이 이루어지고 있다. 요즘의 ..

[와우] 월드 오브 워크래프트 대격변 고화질 오프닝 동영상

월드 오브 워크래프트 3번째 확장팩 대격변 데스윙이 돌아왔습니다. 이에 맞서싸울 호드와 얼라이언스 용사들은 최대레벨 85로 제한이 풀리며, 그동안 데스윙과 싸울 준비를 마쳐야 합니다. 현실에서도 저사양 PC사용자의 경우 컴퓨터 업그레이드를 준비해야 할지도 모릅니다.

[분석정보] 캐쉬 구현 방식으로 보는 AMD와 인텔이 처한 상황

3 계층 캐시의 어디에 데이터 놓을까? 예를 들면 그림 1과 같이 1차 ~ 3 차까지 캐시를 가진 CPU를 생각해 본다. 여기서 CPU가 데이터 (명령어도 좋다) 페치를 걸 경우, 우선 1 차 캐쉬의 태그를 검색한다 (그림 1 - ①). 여기에서 찾으면 문제없이 단순히 1 차 캐시에서 데이터를 끌어 온다 (그림 1 - ②) 그것으로 좋다. 문제는 1 차 캐쉬에 데이터가 없는 경우 (캐시 누락)이다. [그림1] 1 차 캐쉬에서 히트 한 경우 데이터 (빨간색 사각형)의 움직임 그림 2는 2 차 캐시에서 히트 한 경우 다. 먼저 기본 태그를 참조 (그림 2 - ③) 여기에 없는 것으로 확인되면 다음은 2 차 태그를 참조한다 (그림 2 - ④). 2 차 태그에서 발견되면 2 차 캐시에서 데이터를 가져 오고 (그..

[분석정보] 보여진 AMD의 차기 CPU Llano의 실상

종전 공개된 사진보다 큰 다이 AMD는 대만 타이페이에서 10월 19일에 개최한 기술 컨퍼런스 "AMD Technology Forum and Exhibit (AMD TFE)" 에서 2011년의 메인 스트림 PC 용 CPU"Llano (라노)"의 발표를 했다. 이 컨퍼런스에서는 Llano의 웨이퍼를 공개, 또한 단 시간이지만 동작 시현을 보였다. 따라서 Llano의 실상이 밝혀지기 시작했다. Llano에 대해 TFE에서 공개된 웨이퍼에서 다양한 것이 밝혀졌다. 우선, 다이 사이즈. 웨이퍼를 보면 4코어 판 Llano의 다이는 세로 (CPU 코어를 위쪽으로 본 경우)에 18.x 개, 가로 22 개 배치되어 있는 것으로 보인다. 300mm 웨이퍼이므로, 다이의 각 변의 길이는 계산에서 세로가 16mm 조금, ..

[분석정보] CPU와 메모리의 속도 차이를 해소하는 캐시의 기초지식

CPU의 속도에 따라갈 수 없는 메모리의 속도 이번에는 "캐시"의 이야기이다. 캐시의 목적은 "지연의 은폐"에 있다. 불쑥 고자세의(수준높은) 말이 통하지 않기 때문에, 옛날 이야기에서 시작하자. [그림 1] 초기 CPU와 메모리의 조합 초기 PC의 경우 그림 1과 같이 CPU와 메모리가 직결 (엄밀히 말하면 메모리 컨트롤러를 통한)되어 있었다. 초기라는 것은 대개 i386 내지 호환 칩셋이 사용되고 있었을 무렵까지 이야기이다. 이때는 CPU의 속도가 빨라도 30MHz 정도. 메모리 칩의 속도는 100ns (10MHz) ~ 80ns (12.5MHz) 정도. 가끔 70ns 제품 (≒ 14.3MHz) 및 60ns (≒ 16.7MHz) 제품이 고가로 판매된다는 어떤 의미의 한가로운 시대였다. 물론, 이것도 C..

[분석정보] AMD가 확장판 K10 코어 기반의 APU Llano 를 첫 공개

대만의 기술 컨퍼런스에서 Llano의 동작 데모를 행하다.  AMD는 대만 타이페이에서 개최한 기술 컨퍼런스 "AMD Technology Forum and Exhibit (AMD TFE) '에서 내년 (2011년)의 메인 스트림 PC 용 CPU"Llano (라노) "의 동작 시현을 최초로 공개했다 . 또한 Llano의 웨이퍼를 공개, Llano 가 상대적으로 GPU 성능을 ..

[분석정보] x86을 고속화하는 조커기술 명령변환 구조

x86에 한해서, 아웃 오브 오더에서 빼놓을 수 없는 것이 명령 변환의 구조이다. 인텔의 경우 "μOp"(마이크로 옵) AMD (가 인수한 NexGen)는 당초 "RISC86" 라고 칭하고, 그 후 "Op"궁극적으로 "microOp" 라고 표기는 바뀌었지만, 이를테면 x86 명령을 "RISC 형" 내부 명령으로 변환하는 방법이다. 이 내부 명령이 μOp 라든지 microOp 등으로 불리는 것이다. 여기서 잠깐 RISC와 CISC의 이야기를 하기로 한다. 예를 들어 x86라는 명령은 CISC의 대표적 예 이지만, 원래 RISC와 CISC의 차이? 라는 것을 간단하게 설명하자. RISC와 CISC의 차이를 대충 복습 RISC 개념을 그것을 명확하게 알지 못하고 탑재한 CPU는 꽤 예전부터 있다※1. 하지만 ..

[분석정보] 명령의 실행 순서를 바꿔 고속화 하는 아웃 오브 오더

슈퍼 스칼라와 아웃 오브 오더는 세트 기술 슈퍼 스칼라 다음에 소개하는 기술은 아웃 오브 오더이다. 아웃 오브 오더는 슈퍼 스칼라을 전제로 하는 기술이다. 아웃 오브 오더 없이 슈퍼 스칼라는 있지만, 슈퍼 스칼라 없이 아웃 오브 오더는 있을 수 없다 (이말은 의미가 없다) 때문에 현실적으로 슈퍼 스칼라 가정의 기술이라 생각해도 좋을 것이다 (x86으로 말하면, 최소 펜티엄 이상이 되어야 효용이 있는 기술. 486 이하는 필요 없는 기술. 486 이하는 파이프 라인이 1개 뿐인 스칼라 프로세서. 펜티엄 이상은 2개 이상인 슈퍼스칼라 프로세서. 실제로 아웃 오브 오더는 펜티엄 프로부터 적용이 되어 있습니다. 펜티엄 프로가 슈퍼스칼라 프로세서 이면서, 명령 변환(명령 분해), 아웃 오브 오더를 사용 합니다.)..

[아키텍처] 트릭을 거듭한 Sandy Bridge 마이크로 아키텍처

AVX의 구현은 2 개의 유닛을 확장하고 결합 Sandy Bridge의 CPU 코어는 새로운 AVX (Advanced Vector Extensions)의 실행 엔진이 구현 되었다. AVX는 256-bit 폭 (32-bit 단 정밀도라면 8way)의 SIMD (Single Instruction, Multiple Data) 명령어를 포함한다. 종전의 SSE의 128-bit 폭의 SIMD 엔진의 2 배의 벡터장이 된다. Intel에서Sandy Bridge의 아키텍트를 맡은 Bob Valentine 씨 (Senior Principal Engineer)는 "같은 양의 명령 흐름과 캐시 대역폭에서 2 배의 연산이 있다.보다 효율적인 명령 스타일"이라고 벡터 길이를 2배로의 이점을 강조한다. 또한 AVX는 마스크로드..