벤치리뷰·뉴스·정보/아키텍처·정보분석

[분석정보] 2008년 중에 95%를 듀얼 코어로 하는 Intel CPU로드맵의 비밀

tware 2007. 11. 9. 19:00

 

 

1세대 2년마다 아래로 밀리는 멀티 코어 CPU

 Intel CPU의 2008년 로드맵은 듀얼코어 화가 더욱 진전된다. Celeron 브랜드로 듀얼 코어를 투입해 전체 데스크탑 CPU 중 95%가 듀얼 코어 또는 쿼드 코어 CPU로 이행한다.

 Intel CPU의 듀얼코어 화가 급진전되고 있는 이유는 명확하다. 그것은 듀얼 코어의 다이 크기 (반도체 본체의 면적)가 45nm 공정에서는 밸류 CPU의 범위에 들어가기 때문이다. 그리고 32nm 공정에서는 쿼드 코어가 메인 스트림 CPU의 다이 크기에 이르고, 22nm 에서는 계산상은 옥타 (8) 코어가 메인 스트림 클래스가 된다 (1코어의 크기가 커지지 않는다는 가정하에. 1코어의 IPC가 늘어나지 않는다고 할 때. 실제로는 신 아키텍터는 기존 아키텍처보다 1코어의 IPC가 늘어나며 1코어의 크기가 커짐. 설사 IPC는 조금 늘어나더라도 SSE,AVX 등의 데이터 병렬 처리량이 대폭 증가되어 코어의 크기가 커짐. 여기에 확장 명령 유닛이 아니더라도, 기존의 기본 연산 처리장치를 강화해서 연산 레이턴시를 줄이는데, 역시 코어를 크게 만드는 원인). 그렇지만, 실제 제품으로는 GPU 통합판의 듀얼 코어 CPU가 메인 스트림에서 저가형을 차지하게 될 것이다. GPU 통합 듀얼 코어도 32 ~ 22nm에서는 밸류 시장에 침투 가능한 다이 크기가 된다.

 

 

Intel 데스크톱 CPU 전환 예상

 

 

 

Intel 모바일 CPU 전환 예상

 

 CPU의 다이 사이즈는 제조 비용과 밀접하게 얽혀, 다이 사이즈는 목표 시장의 기준이된다. Intel의 전통적인 패턴은 새로운 마이크로 아키텍처 CPU가 300 제곱 mm 정도의 다이로 하이엔드로서 등장하고, 200 제곱 mm 전후로 퍼포먼스 세그먼트로 침투해 메인 스트림 시장에 들기 시작하며, 140 제곱 mm 전후로 메인 스트림 시장을 누르고 밸류 시장에 침투하기 시작, 100 제곱 mm 전후로 밸류 세그먼트로 널리 퍼지는 것이다. 1세대 약 70%씩 다이를 축소한다.

 이 Intel의 듀얼 코어 CPU에 적용하면 거의 이론대로 되고 있다. 90nm 공정에서는 듀얼 코어 CPU는 퍼포먼스 CPU의 다이 사이즈였다. 65nm 공정에서는 풀 스펙의 듀얼 코어 CPU가 메인 스트림 CPU에 최적의 다이 크기가 되었다. 45nm 공정에서는 컷 아웃 (소용량 캐시) 버전 듀얼 코어 CPU가 밸류 CPU의 다이 크기가 된다. 숫자로 나타내면 200 제곱 mm 대 (2MB L2, 90nm) → 140 제곱 mm 대 (4MB L2, 65nm) → 80 제곱 mm 대 (3MB L2, 45nm)로 Intel 듀얼 코어 CPU의 다이 크기가 작아지고 1 세그먼트씩 아래로 내려오고 있다.

 45nm 듀얼 코어의 저가형인 3MB L2 캐시의 Penryn 3M 다이 (81 제곱 mm)는 65nm 싱글 코어 CPU인 "CedarMill (시더밀)"  "Merom (메롬) -L"(콘로 셀러론) 과 거의 같은 크기다. 이 크기는 Intel CPU의 전통적인 최저 사이즈로 밸류 CPU의 가격대에 떨어 뜨리는 때에는 이 크기를 기준으로 한다.

 칩 제조 비용도 80 제곱 mm 정도의 다이 크기가 되면 30 ~ 40 달러 정도에 들어가게 된다. 따라서 Intel은 60 달러 이하의 저가형 가격으로 팔아도 채산이 맞게 된다. Intel은 그것을 내다보고 데스크톱 CPU를 밸류 세그먼트까지 듀얼 코어화 하려고 한다. 먼저 성숙해 수율 (생산량)이 오른 65nm 공정의 듀얼 코어 CPU를 밸류에 침투. 45nm가 성숙 생산 용량이 늘어난 곳에서 더 저렴한 비용으로 80 제곱 mm의 45nm 듀얼 코어로 전환시키는 것으로 보인다.

 

 

Intel CPU 다이 크기 및 아키텍처


45nm 가격이 내려가는 Core MA의 쿼드 코어 CPU


 Intel은 듀얼 코어 CPU를 벨류 세크먼트까지 침투시키는 것과는 대조적으로, 쿼드 코어 CPU의 비율을 일정 수준으로 고정한다. Intel의 데스크탑 CPU의 출하 계획 전체로 보면 쿼드코어는 2008년에도 전체의 7 ~ 8% 정도다. 이 이유도 명백하다. 그것은 쿼드 코어 CPU의 제조 비용이 여전히 퍼포먼스 CPU의 범위에 머물기 때문이다.

 좀 더 자세히 설명하면 Intel 쿼드 코어 CPU를 현재의 Core MA로 만들기를 계속하면 쿼드 코어의 제조 비용을 메인 스트림 시장 수준으로 낮출 수 있다. 그러나 Intel은 쿼드 코어를 Nehalem (네할렘) 마이크로 아키텍처로 전환시킬 생각이며, 쿼드 코어 Nehalem 비용은 낮추기 어렵다. 따라서 안이하게 쿼드 코어 CPU의 비율을 높일 수 없다고 추측된다. (네할렘 아키텍처는 코어부의 크기가 펜린(요크필드,울프데일)보다 1.5배 큼. 코어당 IPC 증가(더 많은 회로가 필요), 하이퍼스레딩 구현(약 10% 코어 크기가 커짐. 대신 총 처리량이 20~30% 증가), 64비트에서도 마크로 퓨전 가능 등. 참고로 펜린 역시 45나노가 아닌 콘로와 같은 65나노 였다면 콘로보다 코어부의 크기가 더 큼. 펜린은 콘로의 개선판이라 추가 회로 증가. 네할렘은 톡(신 아키텍처) 펜린은 틱(공정이전 및 개선판). 이런 것을 소프트웨어 개념으로 말하면, 톡은 새로운 윈도우, 틱은 SP1. 윈도에서도 서비스팩으로 가면 알게 모르게 개선되고 추가되는 기능들이 있죠. P6 ~ 펜4 시절이나, AMD k6 이후의 경우는 톡, SP1,SP2,SP3 같은 형태로 발전하고, 이후에 톡을 내놓은 형태.)

 Core MA의 65nm 버전 쿼드 코어 CPU "Kentsfield (켄츠필드)"는 실제로는 Core 2 Duo (Conroe : 콘로) 2 다이를 하나의 패키지에 봉한 MC​​M (Multi-Chip Module)이다. 예전 MCM은 패키지에 밀봉하지 않으면 엄격한 테스트를 할 수 없었다. 테스트 결과 밀봉한 다이 중 하나가 불량이면 칩 자체를 폐기할 수 밖에 없었다. 따라서 MCM의 수율은 싱글 칩의 경우와 마찬가지로 나빴다. 그러나 Intel은 Pentium D 듀얼 다이 도입때 검사 기술이 발달해, 현재 양품 다이 (KGD : Known Good Die)를 2개 선별해서 조합하는 것이 가능하기 때문에 MCM은 반대로 수율면에서 유리하게 된다고 설명했다.

 싱글 다이 칩의 경우, 다이 사이즈가 2배가 되면 결함이 다이 위에 있는 확률이 늘어난다. 따라서 수율이 쭉 내려가고, ​​1매의 웨이퍼로부터 얻는 칩 수를 줄어 제조 비용이 상승한다. 반면 KGD를 2개 조합하는 경우는 수율의 비율은 절반 크기의 다이 수율과 동일하다. 그만큼 비용이 유리하다.

 

 

칩의 다이 크기와 수율

 

 물론 MCM에서는 KGD 검사 비용과 MCM 화의 비용이 더해져 올라, MCM의 수율로도 비용에 영향을 준다. 그러나 Intel의 주장대로라면, 그래도 Kentsfield의 ​​제조 비용은 싱글 다이에 같은 면적의 칩보다 낮은 것으로 생각된다.

 Kentsfield는 143 제곱 mm의 Conroe의 다이가 2개 이므로 총 다이 크기는 286 제곱 mm. 이것은 꼭 Nehalem 쿼드 코어 "Bloomfield (블룸필드)"와 같은 정도의 크기다. 그러나 비용으로 보면 Kentsfield는 Bloomfield보다 낮다고 추측된다. Intel이 KGD를 저렴한 비용으로 검사 할 수 있다면, 200 제곱 mm 클래스 다이의 CPU와 동일한 정도의 비용 가능성도있다.

 마찬가지로 45nm 공정의 쿼드 코어 "Yorkfield (요크필드)"는 45nm의 6MB L2 판 Core 2 Duo (Penryn : 펜린)의 다이 (107 제곱 mm) 2 개로 구성되어 있다. 2개의 다이의 합계는 214 제곱 mm로, 제조 비용은 200 제곱 mm의 싱글 다이 CPU 보다 낮은 것으로 생각된다. Intel은 또한 3MB L2 판의 Penryn 3M 듀얼 구성한 염가판 쿼드 (Q9300)도 투입한다. Penryn 3M 다이는 81 제곱 mm이기 때문에 제조 비용은 더욱 감소한다. 각각의 다이 자체는 제조 비용 30 달러 대의 CPU의 크기이기 때문에, Intel 하려고 생각하면 쿼드 코어 CPU를 100 달러 대의 메인 스트림 가격대에 밀어 넣는 것이 가능할 것이다. (2008년에 중반 Q6600의 공시가 224달러 ->193달러, 요크필드 Q8200이 224달러 출시. 2009년 Q8400이 183달러, Q8300이 163달러)

 


다이 크기가 한층 커지는 Nehalem

 이렇게 보면 Intel의 MCM 판 CPU는 한 단계 아래의 싱글 다이 CPU와 같은 수준의 비용이 될 것으로 생각된다. 이러한 제조상의 포인트를 고려하여 MCM 버전 CPU의 위치를​​ 미룬 것이 아래의 그림이다. Kentsfield와 Yorkfield는 실제 다이 크기보다 아래로, 제조 비용적으로 알맞다 생각되는 위치로 밀어뒀다.

 

 

Intel CPU 다이 크기와 제조 비용


 녹색 화살표가 싱글 코어 CPU, 파랑이 듀얼 코어 CPU, 분홍이 쿼드 코어 CPU를 나타내고있다. 이렇게 보면 흐름은 명백하다. Core MA와 NetBurst의 듀얼 코어 CPU는 90nm에서 퍼포먼스 CPU, 65nm에서 메인 스트림 CPU, 45nm 공정에서 밸류 CPU에 적합한 제조 비용이 된다. NetBurst 와 Core MA의 파란색 화살표는 오른쪽 밑의 3세대에서 최상에서 최하로 내려오고 있다.

 한편, 분홍색 쿼드 코어 화살표는 65nm에서 퍼포먼스 CPU, 45nm 메인 스트림 CPU의 비용으로 내려 오지만, Nehalem에서 리셋 된다. Nehalem 쿼드 코어는 45nm 공정에서 퍼포먼스 CPU 레인지이기 때문이다. 위의 그림에 있듯이, Nehalem 쿼드 코어 다시 성능 레인지로 되돌아 간다.

 따라서 Intel 에게는 선택지가 2가지 있다. 하나는 Nehalem의 쿼드코어를 퍼포먼스 PC에 Core MA의 쿼드 코어를 메인 스트림 PC에 가져오는 것이다. 그러나 Intel은 아마 그렇게하지 ​​않을 것이다. Nehalem의 듀얼 코어로의 이행이 저해되기 때문이다.

 명령 세트 아키텍처와 기능은 되도록 통일하는 것이 Intel의 방식이므로, 2009년 부터는 메인 스트림도 Nehalem으로 이전을 추진할 것이다. Nehalem으로의 이전을 추진하기 위해서는, Intel은 Core MA에 대한 Nehalem의 우위를 명확히 할 필요가 있다. 이 경우 구세대의 Core MA의 쿼드 코어가 메인 스트림 부분에 존재하면 사정이 좋지 않을 것이다. 아키텍처의 이동을 촉진하기 위해서는, Core MA를 Nehalem의 아래, 듀얼 코어 밸류 PC 클래스를 차지하는 CPU로 위치하는 것이다. 따라서 Intel은 쿼드 코어는 Core MA 계에서 Nehalem 계로 완전히 이행시키는 것으로 추측된다.

 Nehalem 쿼드 코어는 45nm에서 퍼포먼스 CPU, 32nm에서 메인 스트림 CPU로 이행한다. Nehalem 계 이후에 등장하는 32nm 공정 CPU "Sandy Bridge (샌디브릿지)" 는 CPU 코어가 크기 않다고 말해지고 있기 때문에 아마 같은 페이스로 멀티코어화가 진행될 것이다. 그렇게 되면, 22nm에서는 밸류 CPU도 원리적으로는 가능하다. 그러나 Intel은 밸류는 쿼드코어 CPU가 아닌 GPU 통합의 듀얼 코어 CPU를 가져올 것이다.


 GPU 통합판에서는 GPU 코어만큼, CPU 측의 다이 크기가 증가하고 CPU의 제조 비용은 늘어난다. 그러나 GPU 통합으로 칩세트 수가 1개로 줄어들기 때문에 전체 비용은 감소하거나 일정하게 유지되는 것으로 추정된다. 참고로, Intel 저렴한 비용으로 KGD를 가져오는 것이 가능하다면, GPU 통합도 MCM으로 스타트 할 가능성이 높다. 앞에서 설명한 이유로, 다이가 커지는 경우, (MCM) 그 쪽이 전체 비용을 줄일 수 있기 때문이다.

(실제 클락데일은 MCM으로 그래픽을 통합했죠.)

 한편, Nehalem의 듀얼 코어 CPU는 45nm 메인스트림의 레인지로 되고, 32nm의 "Westmere (웨스트 미어)" 세대 다이 크기가 밸류 레인지가 된다. 32nm 공정에서 로우엔드까지 Nehalem 계가 Core MA를 대체하게 될 것이다. (결국 이런식으로 진행이 됐죠. 네할렘 세대는 펜티엄과 셀러론이 명목상 있을 뿐, 실제로는 밸류(저가형) CPU 부분은 울프데일 펜티엄 시리즈가 담당을 했죠. 셀로론과 펜티엄이 똑같은 아키텍처로 확실히 다시 자리 잡은건 샌디브리지 시절 부터죠. 이전까지 고급형과 저가형이 쭉 같은 아키텍처에 캐쉬가 적고 클럭이 낮은 제품을(그래서 결국 다이사이즈가 작은) 셀로론에 쓰고, 후에 펜티엄 브랜드가 저가형, 셀러론 브랜드가 초저가형을 이뤘는데, 네할렘(과 웨스트미어세대) 세대에는 건너 뛰게 되죠. 첫번째 듀얼코어+GPU 보급형 CPU인 클락데일이 32나노 부터 시작을 하니까요. 45나노 막판 취소로 없고 (아마도 TDP 문제), 32나노 버전만 존재하죠. 그러다 보니 저가형, 초저가형 부분은  코어아키텍처의 45나노 버전 펜티엄 셀러론이  담당)

 


CPU 코어 자체가 Core MA보다 큰 Nehalem

 Nehalem에 이르면, Core MA보다 다이가 1세대 만큼 증가 될 것으로 추정되는 복잡한 이유가 있다. 이유의 하나는 노스 브릿지 기능의 통합에 따른다. Nehalem의 다이를 보면 다이의 윗변에 위치하는 DRAM 컨트롤러 부분이 전체 면적의 10% 정도를 차지하고 있는 것이 판명된다. 또 다이의 중앙에 위치하는 CPU 코어 간의 조정을 행하는 컨트롤 로직도 상당한 면적을 차지하고 있다. 추가로, 다이의 양단에 QuickPath Interconnect (QPI) 링크가 있다. 즉, 노스 브릿지 만큼 다이가 늘어난다. 이 만큼의 비용 증가는 시스템 전체에서 보면 칩셋 측의 비용 감소에 있는 정도로 상쇄 될 것으로 보인다.

 그러나 그것만이 아니다. Nehalem 아키텍처는 CPU 코어 자체가 Core MA 세대와 비교하면 약 1.5 배 크다. CPU 코어가 대형화 됐기 때문에, Nehalem에서는 동일한 CPU 코어 수의 Core MA 보다 필연적으로 CPU 자체가 대형화 된다.

 

 

Penryn와 Nehalem의 비교


 다만 새로운 CPU가 비대화 되는 것 자체는 2000년까지는 당연한 패턴이었다. 새로운 마이크로 아키텍처의 CPU 코어는 구 마이크로 아키텍처 CPU 코어의 2배 크기라는 것이 관례였다. 예를 들어, 180nm와 130nm 공정의 NetBurst와 P6 (Pentium III)을 비교하면 같은 싱글 코어에서도 NetBurst 쪽이 약 2배의 사이즈다. (이렇게 기존보다 큰 코어로 만들었기 때문에 새로운 CPU가 IPC 자체가 높죠. 여기에 클럭까지 높으니까 성능이 훨씬 좋게 되구요. 단 펜4와 콘로의 관계는 펜4는 그 당시까지의 방향인 더욱 RISC화로 성능을 높이는 방향이었고, 콘로는 다시 CISC화로 돌린 아키텍처의 사상 자체가 다릅니다. 펜4 개발 당시 까지 RISC화로 최대한 해서 성능을 높이는 방향이었죠. 그래서 콘로의 경우 펜4와 크기가 비슷함에도 성능과 전력이 훨씬 좋습니다. 콘로 이전에 펜4 자체가 펜3 보다도 IPC가 낮습니다. 콘로는 베이어스 계를 잇는 아키텍처죠. 펜4의 경우는 P3에 비해서도 더 안좋은건 클럭을 높여서 성능을 높인다 까지 들어갔기 때문이구요. 수율에 의해서도 물론 클럭이 더 높은 제품이 나오지만, 원천적으로 클럭을 높일 수 있도록 하는 것에도 추가 회로가 들어 갑니다. 이런 부분은 아래 링크 글들을 참고하세요.)

 예외는 Core MA다. 싱글 코어에서 비교한 경우에, Core MA CPU의 다이 크기는 넷버스트와(펜4) 거의 다르지 않다. 즉, P6 → NetBurst에서는 CPU의 다이 면적은 2배로 증가했는데, NetBurst → Core MA에서는 거의 같았다. 따라서 Core MA 세대 멀티 코어화가 급진전 됐다. 반면, Core MA → Nehalem에서는 CPU 코어는 1.5 배로 늘어난다. 예전 정도는 아니지만, Core MA 처럼 CPU 코어의 확대를 억제한 접근법과는 명백히 다르다.

 접근법의 차이는 CPU의 시작 포인트의 차이에도 나타난다. 전통적으로, Intel CPU는 본격적으로 양산에 들어가는 것은 200 제곱 mm의 다이에서로, NetBurst도 초대 Willamette (윌라멧)은 217 제곱 mm 였다. 반면, Core MA 최초의 Merom (메롬)이 143 제곱 mm로 갑자기 메인 스트림의 다이에서 시작되고 있다. 이것은 Core MA를 개발한 것이 모바일 CPU를 만져온 Intel 이스라엘 팀이라는 사정이 관련되어 있는 것으로 추측된다. 원래 모바일 CPU로 설계 되었기 때문에, 메인 스트림의 사이즈로 시작했을 가능성이 높다.

 


초점이 다른 Core MA와 Nehalem

 이것은 Core MA와 Nehalem에서는 포커스 타겟이 크게 다른 것도 보여준다.

 Core MA 최초에 메인 스트림 PC 용 듀얼 코어 CPU가 투입되고, 퍼포먼스 PC와 볼륨 서버 전용의 쿼드 코어는 MCM으로 만들고, 밸류 전용의 싱글​​ 코어도 뒤늦게 파생시켰다. 그리고 2년 늦게 MP 서버용으로 최적화 설계된 헥사코어 (6코어) "Dunnington (더닝 턴)"을 투입한다.

 이에 비해서 Nehalem은 퍼포먼스 PC & 볼륨 서버에 최적화 된 쿼드코어를 먼저 투입. 늦게 메인스트림 PC용 듀얼 코어를 파생시키고, 1년 늦게 MP 서버에 최적화 된 옥타 코어 "Beckton (벡톤)"을 투입한다. 밸류 세그먼트에 Nehalem 아키텍처를 투입하는 것은 아마 32nm 세대가 된다.

 Nehalem은 아키텍처 적으로도 CPU끼리 QPI로 직접 접속하고, DRAM 컨트롤러를 통합하는 것으로, 보다 대규모 서버 구성을 쉽게 취하게 된다. 또 SMT (Simultaneous Multithreading)를 탑재하는 것으로, 더욱 쓰레드 병렬성을 높이게 된다. 메모리 인터페이스도 3 채널 DDR3로 무리를 해서라도 확장하고 있다.

 이러한 특징을 가진 Nehalem의 초점은 분명 성능 PC와 서버 및 워크스테이션에 있다. Core MA 와는 방식이 다른, 오히려 전통적인 Intel 데스크톱 및 서버 CPU의 접근법에 가깝다.

 

 

 

포커스가 다른 Core MA와 Nehalem

 

  이러한 다이 사이즈의 커브에서 Intel의 제품 전략은 어느정도 추측 가능하다. 아마 Intel은 Core MA도 쿼드 코어의 출하를 일정량으로 억제, Nehalem 쿼드 코어에 바톤 터치. 메인 스트림에는 Nehalem의 듀얼 코어를 투입하고, 밸류에 Core MA의 듀얼 코어라는 배치를 하는 것으로 추정된다.

 

 

Intel Server 및 워크스테이션 CPU Roadmap

 

 

 

intel Desktop CPU Roadmap

 

 

 

intel Mobile CPU Roadmap

 

 

 

 

intel Desktop 칩셋 Roadmap

 

2007년 11월 9일

 

[벤치리뷰] 거의 10년 인텔 CPU 비교

 

[고전 2000.08.25] 그래픽 통합 CPU 팀나(Timna)의 개요를 분명히-극적인 다이 크기 축소를 실현

 

[고전 2001.08.29] 베니어스 2003년 상반기 출시 발표, 3.5Ghz 펜티엄4 데모

 

[고전 2002.09.12] 7700만 트랜지스터를 전력효율 향상에 쓴 Banias

 

[고전 2002.09.11] 이것이 Banias 플랫폼이다 CPU 마이크로 아키텍처 편

 

[고전 2003.02.20] Pentium M 1.60GHz의 처리 능력

 

[분석정보] x86을 고속화하는 조커기술 명령변환 구조

 

[고전 2005.11.30] 마이크로 아키텍처의 변화를 반영하는 "Core"브랜딩

 

[분석정보] 20년 후인 지금도 곳곳에서 살아남은 펜티엄 아키텍처

 

[고전 2005.12.28] Merom(메롬) 이후인 Nehalem(네할렘) 과 Gilo(길로)

 

[정보분석] 2년 주기로 아키텍처를 쇄신하는 Intel

 

[분석정보] 명확해진 Core Microarchitecture

 

[아키텍처] Core Microarchitecture 속도의 비밀은 CISC의 아름다움

 

[벤치리뷰] 인텔 코어2 듀오 제국의 역습

 

 

[분석정보] 연내에 투입되어 45nm에서 보급을 노리는 Inte의 쿼드코어

 

 

[정보분석] Penryn의 1.5배 CPU 코어를 가지는 차세대 CPU "Nehalem"

 


[정보분석] 인텔의 2013년 CPU 하스웰로 이어지는 네할렘 개발 이야기


[고전 2003.02.27] Prescott,Tejas는 5GHz대, 65nm Nehalem은 10GHz이상

 

[분석정보] Atom의 절전 기술도 탑재한 Nehalem

 

 

[분석정보] Intel이 개요를 밝힌 옥타 코어 CPU Nehalem-EX

 

 

[벤치리뷰] 184달러 코어2 쿼드 Q8400

 

 

[고전 1999.08.11] AMD의 조커는 Socket판 Athlon Select?