벤치리뷰·뉴스·정보/아키텍처·정보분석

[정보분석] 2개의 CPU 개발팀이 경쟁하는 Intel의 사내 전략

tware 2008. 1. 30. 23:00

 

똑딱이 모델 두 CPU 팀

 Intel이 말하는 "똑딱똑딱 째각째각 (Tick Tock)" 모델은 정말 잘가는 것인가? 틱톡 모델은 2년마다 CPU의 공정 기술을 혁신 (Tick), 그 중간의 2년마다 CPU 마이크로 아키텍쳐를 쇄신(Tock)하는 개발 모델인 것이다. 작년 (2007년)에 45n​​m 공정을 도입, 올해 (2008년)는 새로운 마이크로 아키텍처 "Nehalem (네할렘)"을 도입, 내년 (2009년)에 32nm로 2010 년에 "Sandy Bridge (샌디 브릿지)" 마이크로 아키텍처를 도입한다. 그러나 순조롭게 2년마다 교체하는 것인가? 어쩌면 어느 시점에서, 데스크톱 & 서버용 CPU와 모바일용 CPU의 2개의 라인으로 다시 나뉠지도 모른다. 그것은 Intel 사내의 PC용 CPU 개발 팀의 성격이 매우 다르기 때문이다.

 Intel은 현재 PC&서버용의 IA CPU 개발 팀을 2개 가지고 있다. 하나는 오리건주 힐스보로(Hillsboro)의 개발 팀으로 Digital Enterprise Group에 속해 있으며, Pentium III(P6) 와 Pentium4 (NetBurst) 아키텍처를 개발했다. 또 하나는 이스라엘의 하이파(Haifa)에 있는 팀으로 Mobility Group에 속하고 있으며, (그 이전에는 노트북용 MMX 펜티엄 틸라무크 설계, 생산및 판매가 취소된 3D그래픽 통합 보급형 CPU 팀나를 개발) Pentium M (Banias)과 Core Microarchitecture (Core MA)를 개발했다. Intel의 IA-32 계 CPU는 이 두 팀이 교대로 개발하는 체제로 되어있다. 올해 등장하는 Nehalem은 오리건팀, 2010년에 등장하는 Sandy Bridge는 이스라엘 팀이 담당한다.

 이 태세의 표면상의 목적은, 4년 주기의 긴 CPU 개발 기간을 오버랩시키는 것으로, 새로운 마이크로 아키텍처 CPU의 투입을 2년 주기로 단축하는데 있다. 그러나 또 하나의 의도는, 두 팀을 사내에서 경쟁시키는 것으로, CPU 개발을 가속시키는 것에 있다고 말한다. 어느 CPU 업계 관계자는 "오리건 측은, 이스라엘팀이 Core Microarchitecture (Core MA=콘로)로 성공한 것에서 내심 상당히 초조해 있다. 직책을 봐도, 이스라엘 측이 공로에 의해 올라 왔으며, 지금은 오리건과 동격으로 나란하게 됐다. 그래서 오리건은 Nehalem에 걸며, 매우 힘을 쏟고있다. 여기에서 실패하면 다음이 없기 때문이다 "라고 말했다.

 

 

인텔 마이크로 아키텍처 사이클

(위에 보이는 P6, NetBurst, Banias, Core(Merom), Nehalem, Sandy Bridge가 아키텍처 아래쪽의 Coppermine, Tualatin 이런건 P6 아키텍처의 개량판, P6세대는 최초의 펜티엄 프로(P6. 1995년 출시)을 시작으로, 펜티엄2, 펜티엄3 코퍼마인(180 나노 공정), 펜티엄3 투알라틴(0.13 마이크로 공정=130나노 공정)까지 매우 길게 하나의 아키텍처로 버팀. 펜티엄4로 알려진 NetBurst도 마찬가지로, 초대 윌라멧(180나노 공정), 노스우드(130나노 공정), 프레스컷(90나노 공정), 시더밀(65나노 공정)까지 오리지날 아키텍처를 3번 개선. 이유는 기존에 오리건 개발팀과 함께 CPU를 개발하던  펜티엄을 (93년 출시) 개발했던 산타클라라 개발팀이 P7을 개발하는 중간에 HP와 공동개발하는 서버용 IA64 (아이테니엄) 개발팀으로 바뀌었기 때문에, 한동안 오리건 팀 혼자서 CPU를 개발. 원래대로면 오리건팀이 펜티엄프로 출시한 뒤에 산타클라라 팀이 펜티엄2~3 시기에 새로운 CPU P7을 가지고 나와야 하지만 아이테니엄 개발을 했고, 당시 하이파 팀은 기존의 아키텍처 파생상품 설계팀. 이미 개발된 펜티엄MMX의 노트북용 CPU를 설계한다던가 이런 팀. (물론 이후에는 센트리노로 유명한 노트북용 CPU인 펜티엄M 베니어스 (130나노), 도선 (90나노) 요나(65나노. 코어 듀오)를 개발하고 그 뒤에 서버&PC&노트북을 아우르는 콘로 (메롬, 코어2 듀오) 출시.) 이런 이유로 펜3 시기에는 AMD가 동급으로 따라온 상태. AMD는 공장규모도 (생산능력. 소프트웨어가 아니기 때문에 생산량이 매우 중요합니다. 아무리 AMD CPU가 성능상 좋아져도 각 PC업체에 공급을 못하면, 업체들이 손빨고 있을 수가 없죠. 당연히 인텔 CPU를 사용할 수 밖에 없죠.) 그렇고 어쩔수 없이 인텔을 추종할 수 밖에 없는데 (인텔이 시장을 개척하면 거기서 활동하는), 성능상으로는 동급 또는 그 이상이 되버림. AMD가 인텔을 노려볼 때 인텔은 자신들이 지금까지 접근하기 힘들었던 IBM,알파등이 잡고있던 고성능 서버&슈퍼컴퓨터 시장을 잡는 것이 목표였기 때문에.... 문제는 IA-64도 (첫 제품 머시드)계획보다 설계기간이 길어져서 출시.

AMD역시 마찬가지로, AMD64를 페넘2까지 매우 길고 길게 끌고감.

K8때 왜 높은 시장 점유율을 점유 못했나? AMD의 생산량이 x86 시장의 20%가 한계라서 그렇습니다. 이건 뇌피셜이거나, 기자들 생각이 아니라, AMD와 인텔 법정 분쟁에서 AMD가 법원에 직접 낸 자료의 내용 입니다. 생산량 한계가 20% 라고요. 소프트웨어처럼 그냥 웹사이트에 올려두고 그냥 팔면 되는 소프트웨어 처럼 생각하는 분들은 그래서 예전 CPU가 단종이 되면, 새것 팔아먹을려고 그런다고 하는데.. 공장이 무한대에 공장직원 월급이 땅파서 나오는 거도 아니고.. 새 제품 나왔으면 새 제품 공장에서 뽑아야지, 과거 제품 계속 생상하고 있을 수가 없죠. 한동안은 나오겠지만, 계속 나올 수는 없는거죠. 정 과거 제품 사고 싶으면, 중고 사야죠. 그냥 인터넷에 올려만 두고 팔면 되는데, 안파는 소프트웨어가 문제죠. 소프트를 실물로 팔더라도, 소프트웨어는 제조가 쉽죠. 만들 수 있는 업체가 여기저기 많고, 기술이 필요한게 아니니까요.)

 

 

[고전 1998.06.10] Pentium II Xeon으로 서버 시장이 바뀐다

 

 

[분석정보] AMD Fab 36의 위험과 기회

 

 

보다 성능에 초점 두는 오리건

 오리건의 개발 센터가 주력하는 Nehalem은, 실제로 성능 괴물이다. Intel이 고객에게 설명하는 Nehalem의 성능은, Core MA 세대를 아득히 상회한다. 듀얼 프로세서 구성으로 비교하는 경우, 3GHz의 쿼드코어 Xeon X5365 (Clovertown : 클로버 타운)에 비교해서 쿼드 코어 Nehalem EP (Gainestown : 게인즈타운)의 성능은 정수연산(SPECint_rate2006)에서 1.6배 이상, 부동 소수점 연산 ( SPECfp_rate2006)에서 2.4 배 이상이라고 한다. 실제로 성능 테스트를 할 수 있는 샘플이 나오기 까지는, 진짜 성능은 알 수 없지만, 부동 소수점 연산 성능이 이상하게 높은 것은 확실하다. 2.4 배라는 수치는 상당히 이상하며, 대폭적인 확장이 예상된다.

 어느 업계 관계자는 " 지금까지 Intel CPU의 부동 소수점 연산 성능이 왜 (설계에 비해서) 나쁜지는, 사내에서도 논란이 되었다. 그러나 메모리 병목을 고려하지 않는 퍼펙트 메모리에서의 시뮬레이션을 진행하면 성능은 제대로 나온다. 큰 병목이 FSB에 있는 것은 분명해서, 그 때문에 Nehalem에서는 그것을 제거하는 아키텍처를 취했다" 고 말했다. Nehalem에서는 FSB를 통하지 않고 직접 D​​RAM에 액세스하고, 메모리 대역폭도 극단적으로 넓히는 것으로, 부동 소수점 유닛에 충분한 데이터를 피드 할 수 있게 했다는 것이다. 물론 피드 데이터 양에 합당하게, 부동 소수점 연산 부분에도 확장이 더 해지고 있는 것은 틀림 없다.

 이러한 Nehalem의 접근에서 보이는 것은, 여전히 성능을 제 일로 삼는 생각이다. 하이엔드 데스크탑 PC & 웍스테이션이나 서버용으로 고성능을 노린다. 다만 NetBurst까지의 접근과는 달리, Nehalem 에서는 TDP(Thermal Design Power : 열 설계 전력)와 성능 효율도 고려한다. 일정한 전력 안에서 최대의 성능을 발휘 할 수 있도록 노린다 (다만, 현재 나와있는 최초의 Nehalem 샘플은 외부 전력 공급이 필요하다). 이것에 의해서, 동일한 전력의 서버룸이나 데스크톱에, 최대한의 성능을 제공한다. 그러한 발상으로 보인다. "Nehalem의 설명에서는, 먼저 성능. 그뒤 TDP를 챙겨도 괜찮은 차례다" 라고 업계 관계자는 말한다.

 성능을 끌어 올리려면, 보다 많은 트랜지스터가 필요하다. 따라서 Core MA에서 Nehalem은, 같은 공정 기술에서 CPU 코어의 크기가 1.5 배 미만이 되었다. CPU 코어를 더 비대화시켜 성능을 올리는 방향에 있다.

 

 

Penryn(펜린)과 Nehalem(네할렘)의 다이 비교

 

전력에 중점을 둔 이스라엘

 반면, 이스라엘측의 아키텍처는, 전력 절감에 포인트를 두고 있다. 적어도 Core MA까지는 그렇고, Core MA를 개발한 이스라엘의 하이파 디자인 센터의 설명을 듣는 한, 지금도 중심은 흔들리지 않은 것으로 보인다.


 실제로, 이스라엘 팀은, NetBurst에서 Core MA로의 이행에서도, CPU 코어의 규모는 비대화 없이, 거의 같은 정도의 규모로 억제했다. 보다 전력 소비를 억제, 명령 수준의 병렬성을 높혀서, 성능은 크게 늘렸다. 그 결과, 성능 / 소비 전력은 비약적으로 향상됐다.

 Core MA의 약점 하나는, 명령 페치로부터 명령 프리 디코드 부분. 이 부분의 대역이 파이프 라인의 백엔드의 실행 파이프 라인에 비해 가늘다. 명령 페치를 확장하면 성능이 오르는 것은 당연히 알면서도, 소비 전력과 교환되기 때문에, 그렇게 하지 ​​않았다. 성능과 전력에서, 전력으로 보다 기운 것이 Core MA다. 무리해서 CPU 코어를 크게해서, 전력을 증대시키는 위험을 늘리기 보다, 기능을 억제해서라도 전력 절감을 노린 사상이 느껴진다.

 이러한 사상 자체는, Sandy Bridge에도 계승되어 있다고 한다. "Sandy Bridge에서 CPU 코어는, 그만큼 비대화 되지 않았다고 들었다. 코어 자체는 적당히 멈추고, 초점은 CPU 코어의 속 보다도, 오히려 다른 부분에 두고 있다고 들었다" 라고 어느 업계 관계자는 말한다.

 Sandy Bridge 에서도, 당연히 부동 소수점 연산 성능의 확장은 계속된다. CPU에 있어서 효율성을 유지 하면서 성능을 올리는 것이 가능한 부분은 거기이기 때문이다. 이미, Sandy Bridge에 대해서는 1코어당 28GFlops (4GHz 때 / SSE 명령)라는 부동소수점 연산 성능의 수치가 보고되고 있다. 부동 소수점 연산 유닛의 상대적인 크기는 작아지고 있기 때문에, 32nm 공정의 Sandy Bridge는 부동 소수점 연산 유닛 자체는 Nehalem에서 극단적인 비대화는 불러오지 않는다고 추측된다. (실제 샌디 브릿지는 AVX 명령과 유닛 도입으로, AVX 피크 Flops가 단정도,배정도 네할렘의 2배 입니다. FMA가 추가된 하스웰은 다시 또 2배가 되구요. 하스웰은 네할렘 4배. 당연하지만 벤치마크의 성능이 아닌, 피크 Flops 입니다. 실제 성능은 피크대로 차이가 나지는 않죠.)

 문제는 오히려 늘어난 성능에 합당한 만큼의 온칩과 오프 칩의 대역폭 확보에, Sandy Bridge는 메모리 버스나 내부 버스에 연구를 집중할 필요가 있다.

 



CPU 코어를 크게하지 않고서 성능을 올림

 CPU 코어를 작게 멈춰서 성능을 끌어 올린다는 사상은, 이스라엘 팀이 주력하고 있는 사양인 "터보모드"로도 간파된다. 터보 모드는 CPU 내외의 다양한 조건의 변화에 응해서, CPU 코어 단위로 성능을 부스트하는 기술이다. 그것에 의해서, 시스템의 냉각 능력의 범위 내에서, 효율적으로 성능을 높인다. Intel 에서 하이파 디자인 센터를 담당하는 Intel의 Ro​​n Friedman (론 프리드먼) 씨 (Vice President, General Manager, Mobile Microprocessors Group)는, 터보 모드에 의해서, 대부분의 경우에 20%를 넘는 성능 향상이 얻어질 것이라고 표현.

 터보 모드의 포인트는, CPU의 트랜지스터를 거의 늘리지 않고 성능 향상을 얻는 것에 있다. 소비 전력면으로 보면 안전한 성능 업이며, 이스라엘 팀은 이전부터 이 모드의 이점을 Intel 사내에서 역설했다고 한다.


 CPU의 평균 소비전의 저감을 강조하는 점도, 이스라엘 팀의 포인트다. 모바일에서는 TDP와 마찬가지로 평균 소비 전력의 저감이 중요해지기 때문에, 모바일 부문에 소속된 이스라엘 팀으로서는 당연한 것이지만, 이점은 오리건 팀과 크게 다르다. "오리건 측에서 평균 소비 전력을 중시한다는 설명은 들은 적이 없다" 고 어느 업계 관계자들은 말한다. 오리건 측이 서버 및 데스크톱 부문에 소속되어 있는 것을 생각하면, 이것도 당연 할지도 모르지만, 이스라엘 팀은 서버에서도 평균 소비 전력이 중요 하다고 주장한다.


"오늘날 서버팜에서 가장 중요한 지표가 되는 것은, 컴퓨팅 밀도다. 즉 일정한 전력 공급과 냉각 속에서, 얼마나 많은 컴퓨팅을 넣을 수 있는지가 중요해지고 있다.

 만약 보다 적은 전력으로 컴퓨팅 할 수 있다면, 서버룸에 보다 많은 컴퓨팅 성능을 넣을 수 있게 된다. 서버팜의 경우에는, 전력 비용은 점점 더 중요해지고 있으며, 전력 소비가 적다면, 냉각 능력도 늘리지 않아도 되기 때문에, 보다 많은 전력을 절약 가능하다.


 문제는 서버와 서버팜의 평균 소비 전력을 어떻게 정의 하는지에 대해서, 아직 논의 중이어서, 의견 일치가 얻어지지 못한 것이다. 정의를 위한 작업은 진행되고 있지만, 여전히 업계 표준의 정의는 되어 있지 않다 "(Friedman 씨)

 논점은 명확해서, 이스라엘 측은 서버 CPU에 있어서도 평균 소비 전력의 저감이 중요해진다고 보고 있다. 역으로 말하면, 차 차세대 서버도 담당할 Sandy Bridge도 평균 소비 전력에 상당한 초점을 두었다고 예상된다.

 

 

터보 모드의 포인트

 

 

 

GPU 코어의 통합에 대한 가치관이 다르다

 CPU에 GPU 코어의 통합에 대한 가치관도, 오리건과 이스라엘은 크게 다르다. 오리건 측은 당장은 동일 패키지에 넣으면 OK라고 생각하는 것 같지만, 이스라엘 측은 온다이(On-Die)로 통합하지 않으면 의미가 적다고 믿고있다. 그것은 온다이 통합하지 않으면 전력 절감의 효과가 적기 때문이다.

 이스라엘 출신인 I​​ntel의 Shmuel (Mooly) Eden (물리 에덴) 씨 (Vice President, General

Manager, Mobile Platforms Group, Intel)는 지난해 9월의 IDF에서 다음과 같이 말했다.

 "전체적으로는, 모바일 기술에서 통합화는 I/O를 줄이는 것으로 소비전력과 설치면적을 줄이는 이점이 있다. 또한 CPU와 그래픽을 타이트하게 통합하면, (GPU와 CPU의) 실행유닛을 각각 서로 사용하는 것도 가능하게 된다. 많은 면에서 통합은 이치에 맞다.

 그러나 주의 깊게 하지 않으면 활용할(살릴)수 없는 것도 확실하다. 우선 마케팅 상(의 통합)과, 진정한 통합을 구별 할 필요가 있다. 멀티 칩 패키지로 (GPU를 CPU 패키지에)넣었다고 하자. 그것은 칩의 장착 면적을 줄이지만, 혁신적일까? 아니다. 그러면 같은 실리콘에 (CPU와 GPU를) 넣은 경우는? 그것은 혁신이다.

 결국 통합은 이치에 맞다. 그래서 우리는 통합은 올바른 방향 이라고 믿고있다. 전반적으로 말하면, 점차 통합으로 나아갈 것 "

 이 시점에서는, 아직 오리건 개발 Nehalem의 GPU 통합 CPU "Havendale / Auburndale"이, CPU와 GMCH(노스 브릿지 칩)의 2개의 칩을 하나의 패키지에 봉합한 MCM인 것은 알고 있지 못했다. 그러나 지금 돌아보면, Eden 씨의 이 말은, 오리건식 GPU 통합에 대한 비판이다. 실리콘 상에 통합이 아니라면, 마케팅 상의 통합이라고 시사하기 때문이다. 오리건 측의 접근은 혁신적이 아니라고 말하는 것 처럼 들린다.

 

 

Havendale(헤븐데일) / Auburndale(어번데일) 시스템 아키텍처

(그래픽이 통합된 이 45nm CPU는 취소 되었습니다. 32나노 클락데일만 약간 늦게 출시 되죠.

TDP가 문제여서 취소하고 바로 32나노 클락데일을 출시했다고도 하는데,

그게 아니어도 네할렘 아키텍처는 서버/웍스테이션용 제품이 먼저 나오고(메모리 컨트롤러만 통합하고 PCI-E는 통합하지 않은 설계상 다른 제품), 데스크탑용 네할렘인 린필드는(메모리 컨트롤러, PCI-E 통합) 1년뒤에 출시가 되고, 이어서 클락데일이 출시되는데, 이 네할렘 세대도 45나노 린필드/헤븐데일 출시, 1년뒤에 32나노 네할렘/클락데일 이렇게 출시가 된다면, 또 다른 개발팀의 차기 제품인 샌디브릿지가 출시 준비가 됐음에도 출시를 못하거나, 동시대에 존재하게 되니 이것대로 문제죠. 특별히 문제없는 린필드는 그냥 45나노 세대로 끝이고, 2코어 제품은 취소후 급거 32나노 클락데일로 (이덕에 클락데일 i5 제품의 경우 린필드 보다 암호화 성능이 좋습니다. 32나노 네할렘은 암호화 기능 추가) 출시로 마무리. 물론 1년 먼저 출시된 서버/웍스테이션용 네할렘 제품은 45나노/32나노 제품이 모두 있습니다. 아키텍처 전체 개발이 아닌, 단순 설계만 (예를들면 단순히 코어수만 늘려도) 새로해도 시간은 꽤 걸리죠. 서버용 네할렘 EX의 설계는 펜티엄을 개발했던 산타클라라 팀이 (이 당시는 아이테니엄 개발팀) 했다고 합니다.)

 

 

문제는 통합화 타이밍의 어려움

 반면 이스라엘 팀은, CPU에 GPU 코어의 통합을 실제로 설계한 경험이 있다. 취소된 "Timna(팀나)"다. Timna는 Eden 씨의 지휘 아래서, Intel 이스라엘의 개발 팀이 개발한 Pentium III 계의 통합 CPU로, GPU 코어와 DRAM 콘트롤러를 내장했다.

 "CPU와 GPU의 통합을 성공시키려면, 옳은 시기에 옳은 기술로 진행하지 않으면 안된다. 최초로 GPU를 통합한 CPU는 무엇이었는가를 생각해 냈으면 좋겠다. 그것은 FUSION이 아니다. CPU와 GPU를 통합한 최초 칩은 "Timna" 였다.

 

 Paul (Paul S. Otellini (폴 S 오텔리니) 씨 (President & CEO))는, Timna 대해서 두 가지 실수가 있었다고 말했다. 하나는 Timna의 개발을 시작한 것, 다른 하나는 Timna를 그만둔 것이다. 왜냐하면 Timna가 취소된 것은, GPU의 통합이 잘되지 않아서가 아니기 때문이다. GPU 통합 자체는 훌륭하게 잘했다. 그런데도, Timna가 출시되지 않았던 이유는, RDRAM 인터페이스를 통합해서 였다. RDRAM은 너무 고가였기 때문이다 (99년 정도, 늦어도 2000년 초에는 출시가 되었어야 하는데, 이런 이유로 질질 끌려서 중간에는 메인보드에는 SDRAM을 끼우지만, 그 SDRAM을 팀나의 RDRAM 인터페이스에 연결해주는 별도의 메모리 변한 칩을 메인보드에 올려서 출시하는 쪽으로까지 공개가 됐는데, 문제는 팀나가 저가형 PC용 인데, 거기에 칩하나를 더 또 집어넣으면, 저가의 의미가 없어지겠죠. 전력도 칩하나가 어쨌든 더 먹을테고...).


 Timna의 경험이 있기 때문에, CPU와 GPU의 통합은 나에게 새로운 이야기는 아니다. 그래서 통합이 가지는 제약이 따라다니는 것을 이해하고 있다. 예를 들어 CPU를 2년마다 리프레시하고, 그리고 GPU를 6~7 개월 마다 리프레시 하려고 한다. 그러면 (CPU 개발주기 때문에 GPU 아키텍처가) 동결되는 기간이 길어져 버린다 "

 Eden 씨가 지적하고 있는 것은, CPU로의 기능 통합에는, 적절한 타이밍을 택하기 어렵다는 점이다. Timna의 경우는, 통합한 DRAM 컨트롤러가 메인 스트림이 되지 못했기 때문에 실패했다. 이 막힘이 없었으면, CPU에 GPU 코어의 통합은 더욱 조기에 침투 했을지도 모른다. 짧은 사이클로 진화를 계속하는 GPU 코어에 대해서도, 적절한 타이밍에 통합하지 않으면, 통합 GPU 코어의 기능이 시대에 떨어지게 된다는 실수를 범할 수도 있다. (시대의 주류 메모리나(공급과 가격), 시대가 DX10 시대가 열리기 직전이면 그에 맞게 DX10 GPU로  잘 조절해서 통합을 해야지, 최초에 맞춰서 DX9 GPU로 통합하면 망함. 물론 그럼에도 불구하고 외장 그래픽에 비하면 분명 아무리 빨라도 반세대 ~ 한세대 쯤 늦을 수 밖에 없겠죠. 완전하게 최신 GPU로 통합하려다 보면 CPU 출시가 늦어지니...)

 한 업계 관계자는, Intel의 GPU 통합은 최초는 MCM이지만, 그 뒤로는 실리콘 상의 GPU 통합을 계획하고 있다고 말한다. Timna의 실패를 경험한 이스라엘이 Sandy Bridge에 GPU를 통합한다고 하면, 합리적인 방법은 CPU 설계를 어느정도 모듈화 해서, GPU 코어의 교체를 쉽게하는 것이다.

 한 업계 관계자는, Sandy Bridge 세대에는, 내부 네트워크가 간단하게 코어를 늘릴 수 있도록 되었다고 한다. GPU 같은 이종 코어도 포함해서, 쉽게 통합 가능한 구조라고 말한다. Sandy Bridge가 CPU의 각 블록의 연결을 위해, 광대역의 링 버스를 준비한다는 정보는, 이것에 부합한다. Cell Broadband Engine (Cell BE)도 CPU 코어간의 연결에 링 버스를 채용하는데, 연결하는 유닛이 일정 이상 늘어난 경우에는, 설계 상은 링 버스가 합리적인 선택이다. 크로스바 스위치 보다, 훨씬 설계가 쉽게 되기 때문이다. 따라서 링버스라면 코어 수의 증감에도, 설계상은 대응하기 쉽다.

 

 

 

 

통합형 CPU로 개발된 Timna

 

 

2000년에 공개한 통합 CPU로 개발된 팀나 (이 그림은 다른 기사의 그림)

P6 코어라고 펜티엄 프로는 아닙니다. 펜2, 펜3가 다 P6 아키텍처죠

 

 

기술 구상이 견고하게 정해진 이스라엘 센터

 이스라엘 하이파 디자인 센터가 개발한 CPU 마이크로 아키텍처는 Banias, Yonah, Merom과 연속성이 강하다. 띄엄띄엄 혁신하는 것이 아니라, 점진적으로 기술을 더하는 것처럼 보인다. 어느 CPU 업계 관계자는 "견고하게 이뤄진 성능 효율적이 높은 CPU의 기술 구상이며, 그 기술 요소를 하나 하나 단계적으로 구현하는 느낌이다"라고 말했다.

 성능/전력 효율을 높이는 CPU 설계 아이디어를 결론 내, 미래에 어떤 CPU를 개발할지, 상당히 확실히 굳힌 비전을 가지고 있는지도 모른다. 그리고 그 기술 중에서, 각 세대의 공정 기술에 의한 트랜지스터 예산에 맞춰서 구현할 가능성이 높다.

 그렇다면, 하이파 디자인 센터의 차기 마이크로 아키텍처 "Sandy Bridge"는, 그 연장에 있다고 추측된다. Banias, Yonah, Merom으로 쌓아 올린 앞으로의 마이크로 아키텍처가 Sandy Bridge가 된다. 어느 업계 관계자는 "Sandy Bridge는, 최초에는 근본이 되는 아이디어를 들었을 때부터 지금까지, 거의 내용이 바뀌지 않았다"고 말했다. 노선은 이미 오래 전부터 결정되었다고 생각된다.

 Sandy Bridge는 원래는 히브리어의 코드 네임 "Gesher (게셔)"로 불렸다. Gesher에서 Sandy Bridge로 바뀐 것은, 기술적인 내용의 변화가 있기 때문이 아니라, 명칭뿐이라고 한다. Intel은 CPU 코드네임에서, 히브리어를 배제하고 영어로 정리하려는 것으로 보인다. 이것은 이스라엘 개발의 CPU의 코드네임에서, 이스라엘 냄새를 잡으려는지도 모른다.


 Gesher는 히브리어로 "다리"의 의미로, 이전처럼 지명이 아니다. 따라서 같은 마이크로 아키텍처의 CPU 패밀리에는 "Bridge"가 붙여지게 됐다고 한다. Gesher만이 지명 코드네임이 아닌 것은, 다리이 넋에 의미가 있기 때문 이라고 말한다. 이것은, Sandy Bridge에서는 CPU 코어 자체가 아닌, CPU 코어의 연결이나 제어에 초점을 맞추고 있는 가능성을 보여준다.

 


유형이 다른 2 개의 개발 센터가 양립

 성격이 다른 Intel의 2 개의 CPU 개발 센터. 그 차이의 근본은, 각각의 인재 유형의 차이에 있는지도 모른다.

 

"오리건 측의 아키텍트는, 특징이 있는, 좀 괴짜인 천재 기질 분위기의 인물이 많다"고 어느 CPU 업계 관계자는 말한다. IDF 등에서 밖으로 나오는 아키텍트들을 보더라도, 그런 인상을 갖게된다. 반면 이스라엘 측의 설계자는, 어느쪽인가 말하면, 좀 더 보통 분위기의 인물이 많은것 처럼 보인다. 이것은 지극히 주관적인 감상인데, 같은 인상을 가졌다고 말하는 Intel 관계자도 있었다.

 실제, 오리건의 아키텍트에서는, Intel을 사직한 후에 CPU 개발비화 책을 쓰며, Web에서 자신의 업적을 아슬아슬한 곳까지 밝히는 인물이 나오지만, 이스라엘에서는 그러한 이야기​​는 들려오지 않는다. "이스라엘 팀은 대단한 통제가 주어진다고 들었다" 라고 어느 업계 관계자는 말한다.

 또, 이스라엘 측의 R & D 팀에서는, 논문도 그다지 발표되지 않는다. "논문을 내면 아이디어가 알려져 버린다. 우리는 그러한 것은 좋아하지 않는다"고 Eden 씨는 그 이유를 설명한다. 이것은 학회나 학술지에 논문을 발표하는 것 자체가 업적이라고 생각하는, 미국 연구자의 가치관과는 상당히 다르다.

 

 이렇게 보면, 똑같이 Intel의 CPU를 개발하면서도, 오리건과 이스라엘은, 문화도 가치관도 상당히 다른 것을 알 수 있다. 당연히, 거기에서 태어나는 CPU 마이크로 아키텍쳐도 다르다.

 그렇다면 의문은, 정말로 양팀의 CPU가, 2년마다 모바일에서 하이엔드 까지 모두 커버하며 바뀌어 가는 것인가 라는 점이다. 이것은 Nehalem의 모바일과 Sandy Bridge의 하이 엔드가 각각의 시장에 맞는지 어떤지 라는 점에 달려 있다. 어쩌면, 서버에서는 Nehalem 계가 남고, 모바일에서는 Sandy Bridge로 교체된다 라는 공존 상태가 될지도 모른다. (이렇게 되건 아니고, 그냥 노트북부터 서버까지 모두 커버하는 CPU를 양 개발센터가 5년간 개발해서 내놓습니다. 2팀이 동시에 개발을 하니까 소비자 입장은 2.5년 정도면 새로운 아키텍처가 나오죠. 중간의 공정이전 및 아키텍처 개선판도(콘로->펜린. 켄츠필드 -> 요크필드. 샌디브릿지 -> 아이비브릿지 같은) 나오기 때문에 CPU 브랜드로만 하면 거의 1년에 하나씩 나오게 되구요.)

 

pc watch

 

 

[2000.08.25] 그래픽 통합 CPU 팀나(Timna)의 개요를 분명히-극적인 다이 크기 축소를 실현

 


[아키텍처] 환경 조건을 이용하여 성능을 끌어 올리는 터보 모드(전압 레귤레이터 전압 조절기)

 

 

[정보분석] 같은 무렵에 시작된 Nehalem과 Larrabee와 Atom


 

[고전 1998.06.10] Pentium II Xeon으로 서버 시장이 바뀐다

 

 

 

[고전 1998.07.10] 다음 Slot 2 MPU Tanner는 하이엔드 워크스테이션 겨냥?

 

 

 

[분석정보] Intel 4번째 x86 CPU 개발 센터 방갈로르

 

 

[정보분석] Intel 힐스보로가 개발하는 CPU 아키텍처의 방향성

 

 

[분석정보] 5W 이하의 저전력 프로세서의 개발로 향하는 Intel

 

 

[고전 1998.11.4] DEC의 Alpha 개발 팀이 대 Intel 진영에

 

 

[정보분석] Merom(메롬) 이후인 Nehalem(네할렘) 과 Gilo(길로)

 

 

[정보분석] 2년 주기로 아키텍처를 쇄신하는 Intel

 

 

[고전 2000.2.25] 인텔 사내경합이 낳은 Willamette 1.4GHz

 

 

[정보분석] 인텔의 2013년 CPU 하스웰로 이어지는 네할렘 개발 이야기

 

 

[분석정보] Intel의 개발 책임자에게 듣는, Skylake 개발 비화